¿Qué hacen los científicos de datos comerciales a diario?

Gracias por el A2A.

Por científicos de datos comerciales, infiero que te refieres a científicos de datos comerciales o no académicos.

Sí, se usan todas esas cosas. Algunas más en algunas industrias, otras más en otras. Una cosa que obtendrá en algún momento es que muchas cosas son iguales bajo diferentes supuestos. Por ejemplo, puede tener un modelo particular para inferencia y predicción bajo el supuesto de que sus intervalos de confianza son diferentes de uno a otro. El aprendizaje automático no es tan diferente del aprendizaje estadístico y ambos incluyen modelos de regresión. Pregunte a la gente qué es el agrupamiento y algunos le dirán que se trata de minería de datos, otros que es aprendizaje estadístico y otros que es aprendizaje automático. Al final, es solo una familia de algoritmos de aprendizaje no supervisados.

En nuestro caso particular, no hay un día en que una de esas cosas no se use. Puede haber un argumento de que rara vez hacemos regresiones aquí, pero usamos ANOVA bastante, así que retrocedemos disfrazados … 🙂

Usted hace un punto muy válido acerca de que la especialización de Coursera es más académica. Sin embargo, eso no le quita valor. Todo lo contrario. Estoy viendo que varios investigadores académicos se mudan a los negocios exactamente porque proporcionan ese valor agregado de la experiencia de investigación científica.

Aunque esta es una visión muy personal, si desea un grupo de cursos de ciencia de datos más corporativo, debe consultar el Nanodegree de análisis de datos de Udacity. No creo que sea mejor o peor, es diferente en el sentido de que está más en línea con las necesidades corporativas.

En mi experiencia (con sede en Londres), el tipo de técnicas a las que se ha referido no se usan “literalmente”. Son cosas que debes saber para ser bueno en ciencia de datos, pero hay mucho más que hacer.

A mis científicos de datos les encantaría recibir un proyecto que se apoyara en el aprendizaje automático, pero la realidad es que no hay suficientes empresas dispuestas a pagarlo. Esto tiene mucho que ver con el hecho de que no es ampliamente conocido y entendido, ni sus beneficios son bien vendidos por los científicos de datos.

En cuanto a la inferencia estadística y la regresión, estas técnicas están integradas en una imagen más amplia. Forman la base de los supuestos necesarios para usar / escribir buenos algoritmos de minería de datos. Son los fundamentos de la prueba de hipótesis y el análisis exploratorio. Deben ser una forma de pensar para un científico de datos, como el niño de karate que aprende la cera, la cera y la almacena en la memoria muscular antes de enfrentar una pelea.

De todos modos, para responder a su pregunta más general, describiré un proyecto típico de ciencia de datos que he experimentado. La primera parte trata de comprender cuál es el problema comercial “real” y cómo se traduce en una pregunta analítica. Ser bueno en esto realmente solo viene con experiencia. ¡La segunda etapa podría ser recopilar datos, transformar datos, limpiar datos, unir datos … datos datos datos …! Esto a menudo puede tomar el 80% del tiempo total. Nunca obtienes los datos proporcionados en el formato completo perfecto como lo harías cuando aprendes, por lo que debes poder transformarlos. Entonces debe hacer un análisis exploratorio completo. Esto informará las decisiones sobre qué técnicas puede aplicar más adelante y de qué manera. No daré una conferencia sobre lo que esto implica, pero es una parte fundamental de la ciencia de datos que no se enseña bien. Solo después de esto usará las técnicas que podría aprender en un curso de ciencias de datos. Con frecuencia, esto puede ser una combinación del enfoque puro con algo de conocimiento comercial y sentido común. Todo con una visión del resultado y respondiendo la pregunta original. También puede que tenga que doblar las reglas, por ejemplo, en la vida real, será difícil encontrar un conjunto de datos con variables verdaderamente independientes y es posible que simplemente tenga que ‘seguirlo’.

Mi consejo sería aprender amplitud y no profundidad, y tratar de obtener la mayor cantidad de práctica posible en la vida real.