¿Cuál es el mejor consejo para un científico de datos novato?

Estoy seguro de que hay muchos otros puntos que destacar, pero recomendaría lo siguiente:

  • No intentes reinventar la rueda. La mayoría de los métodos y algoritmos utilizados en la práctica han existido con éxito y han sido muy bien investigados durante mucho tiempo. Siempre que sea posible (99% de las veces) use una implementación existente en lugar de intentar escribir su propio algoritmo.
  • Desarrollar una visión para los negocios. No necesita renunciar a su trabajo y obtener un MBA. Simplemente trabaje en estrecha colaboración con sus contrapartes comerciales y comprenda cómo su empresa encaja muy bien en su cadena de valor. Esto significa que debe familiarizarse con los Indicadores clave de rendimiento (KPI) de su unidad de negocio u organización. Ningún modelo predictivo de aprendizaje automático o proyecto de ciencia de datos se encuentra en el vacío, por lo que debe alinearse con esos objetivos empresariales / organizacionales y eso es parte de su trabajo.
  • Participe en un aprendizaje continuo y eduque a quienes lo rodean. Publique sus hallazgos y solicite comentarios. Los problemas más valiosos son complejos y no estoy hablando solo de la complejidad del algoritmo. Requieren múltiples puntos de vista para abordarlos correctamente.
  • Conviértete en un buen desarrollador gradualmente. Este puede ser más controvertido, pero mi observación es que cada vez más empresas están dispuestas a contratar grandes desarrolladores e inyectarles conocimientos de aprendizaje automático en lugar de al revés. Esto se debe a que cada vez más empresas están interesadas en implementar modelos analíticos avanzados para sus usuarios finales dentro de sus productos o servicios, en lugar de solo obtener información empresarial internamente de sus datos, que ha sido el enfoque tradicional de BI. Si puede producir código de nivel de producción y ser dueño del proceso de principio a fin desde la ingestión de datos hasta la entrega de predicciones de baja latencia en tiempo casi real, usted es el maestro de su dominio. Mi empresa BigML (Desarrolladores | BigML.com) ofrece una API de Machine Learning para desarrolladores que buscan adoptar análisis avanzados más rápido, por lo que también puede ser un recurso valioso para pagar.

Mantenlo simple. Los analistas de datos y científicos sin experiencia están demasiado fascinados con algoritmos complejos y poder predictivo cuando a veces lo que se necesita es un modelo estadístico e interpretable simple.

Se pragmático. Comprenda que el negocio es más importante que su experiencia técnica. Su sistema bellamente diseñado no tiene valor si su ROI es cero o negativo.

Nunca (¡NUNCA NUNCA!) Dejes de aprender. Siempre habrá algo que valga la pena leer, ver, escuchar o mejorar. A veces es un modelo, a veces es codificación, a veces es un negocio … a veces es tomarse un tiempo libre de aprendizaje.

No haga que las horas extras y el tiempo de crisis sean la norma Necesita tiempo libre para leer, descansar y disfrutar de la vida. Las personas con exceso de trabajo son menos productivas con el tiempo, su cerebro se apaga constantemente, los niveles de concentración caen. Esto es cierto para cualquier profesión, pero dada la falta de científicos de datos y el trabajo técnico extremo que realizan, tengo la sensación de que esta profesión tendrá la misma curva que la gente de TI en los años 90.

No subestimes los métodos tradicionales de información. Con esto, me refiero a simples búsquedas en Google.

Supongamos que su jefe quiere que escriba un informe sobre un distrito en particular en su ciudad. Un [1] profesional de TI de variedades de jardín leerá cinco páginas de búsquedas de Google. Sin embargo, como [2] científico de datos, querrás leer hasta veinte o incluso más páginas de búsquedas de Google.

  • [1] ¿Qué es la vida? – Búsqueda de Google
  • [2] ¿Qué es la vida? – Búsqueda de Google

Domina lo básico antes de pasar a las cosas avanzadas. Necesitas caminar antes de correr, grasshoppa.

Mi consejo es este: mejora en Google.

Que tengas un fructífero viaje con la informática.

Como escéptico de los datos, es importante ser imparcial, interpretar los datos sin ningún sesgo y decir lo que los datos dicen sin ningún temor. (Usted ve el mundo rojo o verde si usa anteojos rojos o verdes). Intente mirar los datos desde diferentes perspectivas.

Para agregar a lo que otros ya han publicado:

Sea receptivo a las nuevas ideas e intente pensar cómo se puede aplicar y no cómo se puede rechazar.

Esté preparado para experimentar con nuevos enfoques : durante su capacitación, es posible que haya encontrado ciertas formas de hacer las cosas, pero es posible que no siempre funcionen en un escenario de la vida real. Por lo tanto, no se confíe demasiado con su enfoque y sea franco al admitir sus errores, pero no dude en intentarlo.

Siempre piense en nuevas formas de recopilar información . Muchas veces, incluso las personas con experiencia pasan por alto cierta forma de encontrar una nueva información que puede ser crítica en el resultado de un análisis. Si lo convierte en un hábito desde el principio, este será un gran activo en los próximos años.

Puede referirse a 7 cualidades importantes para un científico de datos que lo resume todo

En lugar de pensar “¿dónde puedo aplicar lo que sé hacer?” pensar: “¿qué problema debo resolver y cuál es la mejor manera de hacerlo?”