¿Cómo funciona la huella digital de audio?

sobre huellas digitales de audio de wikipedia http://en.wikipedia.org/wiki/Aud…

Un algoritmo acústico robusto de huellas dactilares debe tener en cuenta las características perceptivas del audio. Si dos archivos suenan igual al oído humano, sus huellas digitales acústicas deberían coincidir, incluso si sus representaciones binarias son bastante diferentes. Tenga en cuenta que la coincidencia acústica de huellas dactilares puede ser una medida de distancia entre vectores de características, y no una coincidencia binaria directa. Por lo tanto, las huellas digitales acústicas no son huellas digitales bit a bit, que deben ser sensibles a cualquier pequeño cambio en los datos. Las huellas digitales acústicas son más análogas a las huellas digitales humanas donde se toleran pequeñas variaciones que son insignificantes para las características que utiliza la huella digital. Uno puede imaginar el caso de una impresión de huella dactilar humana manchada que puede coincidir con precisión con otra muestra de huella digital en una base de datos de referencia; Las huellas digitales acústicas funcionan de manera similar.

Para la aplicación de sincronización Team Coco, cada episodio de Conan se envía para tomar las huellas digitales de audio después de la grabación. Durante la grabación, los editores generan contenido y lo vinculan a una marca de tiempo específica dentro del episodio.

Cuando ingresa al modo de sincronización, la aplicación escucha a través del micrófono de su dispositivo y canaliza el audio a un servicio que intentará hacer coincidir el audio con un episodio de Conan y averiguar en qué parte del episodio se encuentra. Una vez que ha descubierto el episodio que está viendo y la marca de tiempo actual, obtiene el contenido de sincronización para ese episodio / hora.

Esto permite que la aplicación reconozca episodios en vivo, episodios reproducidos desde un DVR o transmitidos desde el sitio web. Mientras el audio sea claro, la aplicación puede determinar exactamente qué episodio está viendo y qué tan avanzado está el episodio.

http://laplacian.wordpress.com/2
es una muy buena explicación del principio general (al menos en el contexto de la música).

More Interesting

¿Qué son los desarrolladores full stack, front-end y back-end? ¿Qué hacen cada uno de ellos?

Si solo pudieras ejecutar Linux y no se te permitiera iniciar un sistema operativo en una máquina virtual, ¿cuál sería tu computadora portátil ideal?

¿Quiénes son los mejores desarrolladores de aplicaciones iOS en Silicon Valley?

¿Quién está usando Redis en un entorno de producción?

¿Qué plan de estudios debo seguir para convertirme en ingeniero de software, especialmente en el aprendizaje automático, después de aprender una cantidad suficiente de Python?

¿Cómo se transmite un video capturado por mi cámara web por un servicio como ustream?

¿Qué plataformas principales en línea que utilizamos son de código abierto?

¿Qué cambios ocurrirían si Quora fuera de código abierto?

Tesla Motors (compañía): ¿Cómo puede Elon Musk hacer que sus vehículos sean más seguros para conducir?

¿Por qué una compañía SaaS elegiría México en lugar de India y Europa del Este para externalizar sus requisitos de ingeniería?

¿Por qué las páginas web enumeran varias fuentes (Ej: font-family: 'Helvetica', 'Times', 'Times New Roman', serif;) en lugar de una sola?

¿Qué distingue al 1% superior de los profesionales de control de calidad del 10% superior?

¿Cuál es el mejor lenguaje de programación para usar al construir una red social, PHP o Ruby? ¿Por qué?

¿Puede un ingeniero de software convertirse en ingeniero mecánico?

¿Por qué algunos programadores odian la programación de pares mientras que otros la aman?