¿Cuánto es importante saber sobre IR, PNL y modelado de temas para convertirse en un buen científico de datos? ¿Cuán relevantes son estos para la ciencia de datos?

La respuesta depende totalmente de qué tipo de científico de datos desea ser y para qué tipo de empresa desea trabajar. Hay muchos científicos de datos que trabajan que saben muy poco sobre minería de texto. Recuerde, hay toneladas de compañías con muchos datos, pero muy pocos datos de texto. Muchas compañías de Wall Street son así. Las empresas de logística también suelen ser así.

Por otro lado, hay muchas compañías donde la minería de texto es una gran parte del trabajo de un científico de datos. Mi empresa, Return Path, es un ejemplo. Procesamos toneladas de correos electrónicos cada día, por lo que una gran parte del trabajo de los científicos de datos consiste en clasificar los datos de mensajes de correo electrónico. Quora es otro ejemplo de una empresa con toneladas de datos de texto.

Obtener un doctorado en modelado de temas lo convertiría en un candidato muy atractivo para muchas empresas. Pero asegúrese de obtener un doctorado por los motivos correctos. Un doctorado lleva mucho tiempo, por lo que realmente debe asegurarse de que desea hacer la investigación antes de comprometerse.