( descaradamente robado de Dean Rutter en http: //www.oneaccordpartners.com…)
Siri es una implementación notable de varias tecnologías: la tecnología de reconocimiento de voz y texto a voz (TTS) de Nuance Communications, el motor de procesamiento de lenguaje natural de inteligencia artificial (AI) y los servicios de back-end de Siri (es decir, capacidades de procesamiento y acceso a datos y otros recursos). Quizás una simplificación útil es sugerir que Siri tiene tres capas: procesamiento de voz, análisis de gramática, motor de aprendizaje de contexto y servicios.
(fuente: http://www.venturewerks.com/blog…)
- ¿Qué es un algoritmo eficiente para encontrar el número de submatrices con el mismo número de 0s y 1s?
- Actualmente estoy en la universidad haciendo el segundo año de B. Tech y quiero saber cuándo puedo prepararme para el Examen de Aptitud de Posgrado en el examen de Ingeniería
- ¿Debería molestarse en aparecer en entrevistas de software si no tiene el 'talento innato' para resolver problemas complejos?
- Como desarrollador, ¿cómo trato con los malos gerentes de proyecto?
- ¿Se dirige al desastre si tiene demasiadas partes móviles en la arquitectura de su sistema de software?
Hay un par de buenas críticas sobre cómo puede estar funcionando Siri (nadie lo sabe realmente, ya que todo es secreto).
Una de las teorías es que Apple está utilizando el software de Nuance (http://www.nuance.com/) para hacer el reconocimiento de voz básico, analizar el discurso en algunos tokens mágicos y enviarlo todo al servicio web apropiado para obtener el responder. ver el gráfico de arriba.
Artículos adicionales sobre protocolo / trabajos potenciales:
- Protocolo Siri de ingeniería inversa de Applidium: http://arstechnica.com/apple/new…
- Enlace de Nuance: http://techcrunch.com/2011/10/05…
- Amplia descripción general de Dean Rutter: http://www.venturewerks.com/blog…
En pocas palabras: reconocimiento de voz de Nuance (probablemente backend), SSL, compresión (aparentemente sin cifrado), protocolos de servicios web y lo que sea que estén utilizando los servicios de terceros de destino.