¿Existe una base de datos existente de elementos de menú en todos los restaurantes de Nueva York?

Que yo sepa, uno no existe. Sin embargo, tampoco creo que sea fácil tomar los menús de las páginas del menú. Verá, he tenido algo de experiencia escribiendo rastreadores y bots. Le eché un vistazo al robot.txt de la página de menú para usted y es muy restrictivo. Por supuesto, no tiene que seguir el robot.txt, es cortés hacerlo. Sin embargo, los datos son el producto más importante en la web y le garantizo que su bot será rápidamente prohibido. Tendrá que encontrar alguna otra forma innovadora de obtener sus datos.

http://www.menupages.com/robots.txt

Aquí es la forma en que prefiero obtener datos.

1) Asóciese con alguien que ya tenga datos y obtenga volcados de datos + actualizaciones frecuentes.

2) Acceso API a los datos y consulta según sea necesario.

3) Cuando todo lo demás falla, raspe. Raspar es un gran dolor.

4) Obtenga datos usted mismo revisando todos los restaurantes + solicite ayuda de la comunidad (difícil pero se puede hacer). Use métodos innovadores aquí, como tomar fotografías y luego ejecutarlas a través de OCR. Encuentre sitios de restaurantes, su menú PDF, escriba un motor de búsqueda solo para restaurantes de Nueva York, etc.

La opción 4 es difícil pero más deseable porque entonces son sus propios datos y usted puede hacer lo que quiera. Además, piénselo, junto con su aplicación siempre puede licenciar los datos 😉

Tómelo de un sitio llamado allmenus dot com
O ir a plataforma única