Video Breakdown es un proyecto de Microsoft Garage que potenciará la búsqueda de videos mediante tecnologías como detección de rostro y OCR.

 
Buscar videos en servicios como YouTube o Vimeo puede ser tan fácil como ingresar las palabras adecuadas para encontrarlos, o tan difícil que a veces las palabras clave arrojan resultados muy diferentes a lo que buscamos. Ojalá hubiera una forma más efectiva de encontrar videos, y tal parece que Microsoft encontró cómo hacerlo. 

Video Breakdown es uno de tantos proyectos de Microsoft Garage, una plataforma que permitirá buscar videos y encontrarlos mediante tecnologías de reconocimiento como detección de rostro y OCR, contenido seguro gracias al cifrado AES. Por el momento sólo está disponible mediante invitación y esto es lo que ofrece (o busca ofrecer):
  • Transcripción lingüística. Convierte audio a texto basado en modelos de lenguaje acústico.
  • Detección de rostro. Encuentra cuándo aparece cada rostro en un video.
  • Diarización del hablante. Ubica y entiende quién habla cuándo.
  • OCR. Extrae texto que aparece en el video como capa sobrepuesta, diapositivas o de fondo.
  • Identificación de rostro. Entiende de quién es el rostro de la persona detectado.
  • Detección de actividad vocal. Separa el ruido de fondo y la actividad de voz.
  • Búsqueda contextual. Entiende el contexto de los resultados de búsqueda.
  • Análisis del sentimiento. Entiende el nivel positivo vs negativo del habla o contenido escrito.
Algunos videos en Video Breakdown muestran su funcionamiento, por ejemplo, a Jeff Bezos, CEO de Amazon hablando de la diez reglas para el éxito, video en el que se identifica a dos personas desconocidas, algunas palabras clave y mucho positivismo.
Por ahora se ignora cuándo es que Video Breakdown estará disponible para todo el público, algo que, por supuesto, estaremos dando a conocer.

Publicar un comentario

Con la tecnología de Blogger.