El desarrollo de la tecnología de reconocimiento visual desde cero es bastante difícil y requiere un nivel de doctorado de los algoritmos de visión por computadora. Se puede encontrar una buena vista de alto nivel en ¿Cómo reconoce Plink Art las pinturas? Plink fue comprado por Google y presumiblemente integrado en Google Goggles.
Debo decir que hay una gran cantidad de bibliotecas con licencia no comercial para hacer tecnología de reconocimiento visual fuera de la caja, pero mucho de esto ha surgido de años de investigación académica (estoy pensando en SIFT / SURF / PTAM / GLOH, etc.).
La aplicación de iPhone de Yelp utiliza tecnología de reconocimiento visual cero (lo hice). Utiliza puramente la brújula, el acelerómetro y el GPS para adivinar lo que debería ver con la lente de la cámara: la cámara no está haciendo nada. Además, si lo desea, incluso puede construir el suyo usando las diapositivas de una charla que di recientemente: http://bennewhouse.com/other/VTM…
- ¿Debo pasar a las pruebas del desarrollo de software?
- ¿Cuánto costaría obtener una plataforma Zomato o Foursquare-esque construida desde cero?
- ¿Qué se consideraría un buen porcentaje de capital para recibir como desarrollador de software de nivel medio en una empresa de aproximadamente diez personas?
- ¿Cuáles son los buenos libros de desarrollo de software / arquitectura que uno puede leer?
- ¿Cuál es su opinión sobre la programación de pares?