miércoles, 17 de septiembre de 2008

Gaudi (Google Audio Indexing): por la boca muere el pez

Hacía ya meses que algo no me sorprendía tanto. Es una de esas cosas que todos hemos pensado alguna vez, sobre todo a los que nos gusta la ciencia ficción, pero que hemos descartado pensando que es cosa del futuro.

Cuando lo descubrí no podía creer que estuviera ocurriendo ya, en este mismo instante. Las posibilidades de este invento son sencillamente impresionantes. Además de que cambiará el modo en que nos relacionamos con la información.

Hasta ahora la búsqueda de la información se realizaba de dos formas: o buscábamos palabras o frases, en definitiva, información escrita, o buscábamos imágenes que, al fin y al cabo, se encuentran porque llevan relacionadas una serie de palabras, las famosas tags, una solución que era necesaria a medida que la cantidad de información disponible se hacía cada vez mayor.

Resumiendo, buscamos palabras y encontramos la información que ha sido marcada con esas tags de las que hablábamos.

Pero lo que hasta ahora no era posible era buscar palabras que salieran directamente de la boca de quien las pronuncia y cuyo contenedor fuera una pista de audio, no un documento escrito.

No estoy seguro de haber sido claro. El concepto es demasiado nuevo para mí y quizás no me esté expresando con claridad. Lo que quiero decir es que ya se pueden encontrar en vídeos y en archivos de audio las palabras concretas que se han pronunciado en ellos y que están registradas digitalmente en las pistas de audio.

Supongamos que queremos encontrar las veces que el senador McCain ha pronunciado la palabra war en sus últimos discursos. Escribiremos en la casilla de búsqueda las palabras McCain+ war y pulsaremos el botón de búsqueda.

El motor nos mostrará una serie de enlaces a determinados vídeos donde aparece el candidato republicano y nos dirá no solamente el número de veces que ha pronunciado la palabra war sino que, como premio, nos indicará en qué instante exacto de la locución aparece.

Fíjaos en la siguiente imagen:




Tenemos un vídeo de McCain y en la barra de progreso hay una serie de puntos amarillos que son precisamente los marcadores a los instantes en que se pronuncia la palabra war.

Pero si vemos debajo apreciaremos que el sistema nos puede conducir directamente y con una introducción previa a esos momentos.

¿Te parece interesante el asunto?.

Esto cambia radicalmente nuestra relación con la información. La enriquece exponencialmente. Sin embargo, como cualquier adelanto técnico, encierra algunas trampas con las que hay que convivir. Fijaos en lo tendencioso que he sido poniendo el ejemplo de MacCain y la palabra war.

Es verdad que el senador pronuncia demasiadas veces esa palabra, pero también es verdad que casi no hay resultados para la palabra death en los discursos de McCain, cosa que Obama sí que tiene en abundancia. ¿Qué es más peligroso importante, lo que se dice o lo que se oculta no se dice?

Por cierto, con la palabra peace ocurre lo contrario y Obama le supera diez a uno. ¿Sigo siendo tendencioso?. Quizás, no lo oculto, pero lo importante es que mi tendenciosidad puede ser desmontada fácilmente por cualquiera de vosotros porque dispondréis de la misma herramienta que yo he usado: GAUDI, acrónimo de Google Audio Indexing.

Se trata de un invento de Google que está presentando en su famoso Google Labs, un portal-laboratorio donde muestra algunos de sus avances. De aquí han salido cosas tan interesantes como Street Maps, Google Docs y demás inventos.

De momento solo se puede probar para resultados concernientes a McCain y a Obama pero es un buen comienzo. Da fé de las inmensas posibilidades de esta tecnología.

No espereis a probarlo. Os sorprenderá.

FUENTE: The Official Google Blog

4 comentarios:

juanlufont dijo...

Bueno, realmente no es tan sorprendente el invento, otra cosa es que nadie haya llevado a las masas la implementación de esta tecnología, bien por fata de interés, bien por las limitaciones de cómputo e indexación, pero al fin y al cabo se basa todo en el tratamiento, muestreo y estudio de ondas. Veanse transformadas de Fourier y demás base matemática.

Saludos

AprendizDeTodo dijo...

Ahora mismo ya hay discursos de otros políticos.

bydiox dijo...

Bueno, yo estuve ayer por la tarde mirándolo y me sorprendió muy mucho... las posibilidades son enormes... ignoro cómo será el proceso (de largo) pero a priori:

-Transcribir automáticamente ficheros de audio
-Hacer búsquedas en hemerotecas de radios


Me parece IM-PRESIONANTE.

Garred dijo...

Joder, cuanta información se podría indexar con esto funcionando...

[modo_conspiranoico]Seguro que la NSA utiliza algo parecido para realizar escuchas telefonicas...[/modo_conspiranoico]

Publicar un comentario