¿Cuáles son los desafíos potenciales para trabajar como Data Scientist en una ‘compañía soñada’?

Con respecto a algunas de las empresas ‘calientes’ para las que podría considerar trabajar como Científico de Datos, se ha desarrollado una exageración inevitable que potencialmente conduce a resultados adversos. Esta exageración ha llevado a distorsiones en lo que las personas esperan cuando solicitan un puesto y lo que encuentran cuando comienzan.

Si “todos” quieren trabajar allí, existe una distorsión natural en el mercado laboral debido a la competencia sobrecalentada, donde el valor de su contribución individual puede ser potencialmente devaluado. Del mismo modo, el apalancamiento y la libertad que supone que obtendrá al trabajar allí también pueden reducirse mucho en la realidad. Con la competencia interna espumosa de colegas igualmente brillantes y bien entrenados, puede encontrar que su influencia para asumir desafíos aparentemente está bloqueada en muchos aspectos.

Siguen algunas advertencias y consideraciones acerca de las decepciones que PODRÍAMENTE encontrar en las compañías ‘calientes’, básicamente donde las expectativas demasiado infladas pueden no cumplirse si es contratado (nota: a continuación hay advertencias, hay muchos grupos y proyectos prometedores en estas compañías, pero uno debe entrar con una comprensión realista de las desventajas potenciales: estas se basan en historias REALES de colegas míos que trabajan en estas empresas):

> El acceso avanzado al hardware puede no ser tan prolífico como usted supone: no siempre se le proporcionará acceso a las últimas herramientas y tecnologías en estas empresas “populares”. En algunas de estas empresas (es decir, el gran ‘minorista en línea’), en sus materiales de reclutamiento se aclara que los costos están estrictamente controlados; este es un principio fundamental. Como tal, entiendo por mis colegas que trabajan allí que incluso una estación de trabajo de clase de desarrollador y un monitor profesional son difíciles de obtener; incluso los desarrolladores de tiempo completo a menudo se cargan con un equipo mediocre (en comparación con lo que podría obtener en una empresa en crecimiento que tiene hambre) talento). Del mismo modo, no siempre es el caso que su grupo y función en particular le otorguen acceso a servidores avanzados.

> El software empresarial avanzado puede no ser tan prolífico como usted supone: algunos grupos en estas compañías evitan el software empresarial para reducir los costos de licencia, relegando a los científicos de datos a herramientas de código abierto. Aparentemente es difícil defender las nuevas licencias de software empresarial si su grupo aún no está usando esa herramienta en particular. R y Python no siempre son el enfoque más rentable para realizar investigaciones científicas de datos. Incluso una herramienta de escritorio como JMP o SPSS, que cuesta unos pocos cientos de dólares, puede alcanzar órdenes de magnitud en eficiencia sobre el rebuscar en la línea de comandos o las herramientas de secuencias de comandos. Lo mismo ocurre con las herramientas basadas en servidor. Es posible que requiera esfuerzos sobrehumanos y varios meses para solicitar una única herramienta de software que le permitirá hacer su trabajo mejor. He aprendido de algunos en estas firmas ‘calientes’ que parece haber una actitud de que las ineficiencias comunes asociadas con el trabajo con herramientas de código abierto (por ejemplo, R y Python) pueden superarse simplemente presionando al personal para que trabaje más horas mientras luchan. con desafíos rutinarios de gestión y análisis de datos. Tenga en cuenta que SAS Enterprise Miner ha sido excluido de algunas competiciones de Kaggle cuando el desarrollador entra, configura diez rutinas avanzadas de ML, realiza diagnósticos integrales y obtiene el mejor modelo en 30 minutos, mientras que los demás todavía están pirateando intentando ingresar sus datos en R. Una vez que se gradúe de la escuela y haya demostrado su habilidad con R, puede ser hora de considerar que puede hacer más y puede hacerlo mucho más rápido utilizando herramientas empresariales.

> Los datos pueden no ser tan accesibles como usted supone. Los datos están altamente politizados y están sujetos al control de silos organizativos politizados. Parte de esto puede ser protocolos de seguridad esperados y un bloqueo comprensible, pero también puede encontrar que grupos particulares no quieren que otros ‘jueguen con SUS datos’. Las empresas más grandes vienen con políticas de acceso a datos: puede que se decepcione al saber que los datos no están necesariamente disponibles prolíficamente. Uno puede trabajar bajo la impresión de que trabajar en uno de estos unicornios tecnológicos es equivalente al nirvana de datos, que hay un país de las maravillas de datos míticos de datos prolíficos y fascinantes que se ponen a su disposición instantáneamente una vez que comienza. ¡Oh, la decepción cuando pasas las primeras semanas limpiando y estructurando un viejo archivo .csv en Excel! Algunos grupos tienen su acceso a los datos bajo control, pero hacen una advertencia grupo por grupo en estas grandes empresas. Tenga en cuenta: si tienen sus datos bajo control y pueden incorporarlos fácilmente a las herramientas para realizar análisis, ¿por qué lo están contratando …? El rol abierto puede ser uno en el que se le entregan terabytes de datos bien estructurados y herramientas empresariales para implementar algoritmos de aprendizaje automático desde el primer día. Sin embargo, vale la pena preguntar esto explícitamente durante la entrevista de trabajo: la mayoría de las veces, el científico de datos de frente mirará sus zapatos, sacudirá la cabeza y llorará un poco para sí mismos …

> La gran escala de las organizaciones a menudo conduce a ineficiencias organizativas aisladas: relacionadas con todos los comentarios anteriores, estas organizaciones son inmensas en escala y esto ha llevado a la fragmentación en la supervisión del programa de ciencia de datos en algunos casos. La mayoría de ellos todavía están en modo de crecimiento vertiginoso, lo que significa que piratearon procesos organizativos sobre la marcha mientras el auto proverbial se precipitaba por la autopista. Una vez más, en el gran minorista en línea, las diferentes divisiones también pueden ser países diferentes, incluso países que compiten activamente ya veces amargamente entre sí. Esto se basa en la “droga pura” que escucho de mis colegas de estas empresas. La burocracia interna y la competencia, y las ineficiencias resultantes, se compensan con largas horas pirateando (¡sorpresa! No código o datos) procesos y políticas corporativas, reuniones sobre cómo obtener acceso a los datos, tratando con ese gerente que está a cargo de decir ‘ no ‘, requisitos cambiantes y proyectos que se cierran a mitad del vuelo, etc. Las organizaciones enmarcan estas realidades como un’ plus ‘: la competencia se vende como’ construcción de personajes ‘. ¿Es este realmente el caso? Piense profundamente si está adquiriendo experiencia en ciencia de datos o si está aprendiendo más sobre cómo lidiar con la burocracia corporativa a una escala muy grande (lo que admito es una habilidad laboral útil, pero todo con moderación).

Para resumir, debido a la exageración, estas son organizaciones altamente politizadas, internamente competitivas. De alguna manera, la exageración y el gran grupo de reclutas ansiosos significan que su trabajo vale marginalmente menos, si no es que se puede gastar inmediatamente bajo ciertas condiciones: siempre puede ser reemplazado por el próximo soldado de datos, por lo que se espera que tolere el status quo y aceptar las muchas horas de reuniones, falta de acceso, herramientas deficientes, etc. etc.

Cuales son las alternativas? Las consultorías dinámicas medianas son una. Sin embargo, si está interesado en trabajar para una organización establecida, y / o, por ejemplo, si desea evitar los viajes y el flujo que viene con el trabajo de consultoría, aún le aconsejaría NO apuntar a una de las ‘grandes especialidades’.

¿Por qué? Simplemente porque todo el mundo y su perro claman ingresar a estas organizaciones, a menudo con muchas suposiciones equivocadas sobre el trabajo que harán, las tecnologías a las que tendrán acceso y la cantidad de libertad que encontrarán.

Elija una empresa para los desafíos de la ciencia de datos de la misma manera en que enfocaría la inversión de su dinero. Lo más probable es que tenga una mejor oportunidad de retorno de la inversión si elige un diamante no reconocido, ignorado o ignorado en bruto.

Piense en su carrera como Benjamin Graham, el gurú de las inversiones que fue mentor de Warren Buffet, que consideró invertir. Compre el miedo y venda la codicia (The Intelligent Investor – Wikipedia). En este caso, piense cuidadosamente lo que está comprando si invierte su carrera en una empresa exagerada, en lugar de un diamante en bruto en el que puede crecer y asumir desafíos que serían desconocidos en las empresas ‘espumosas’.

Este es el mejor consejo que puedo ofrecer: no persigas a los rebaños. Escriba su propio camino y descubra oportunidades de valor ocultas que se esconden fuera de la vista.

More Interesting

No me siento cómodo con la programación, entonces ¿puedo convertirme en un científico de datos simplemente aprendiendo herramientas como Tableau, Qliksense, Alteryx, etc.?

Análisis de datos, ciencia de datos, análisis web, análisis de negocios: ¿Cuáles son los salarios típicos de los "científicos de datos" para las nuevas empresas en el Área de la Bahía?

¿Cuál debería ser el camino para ser un científico de datos?

¿Debería continuar mejorando mis habilidades de JavaScript y Jquery si estoy interesado en convertirme en un Científico de Datos?

¿Cuál es el salario de un científico de datos en nanobi analytics en Bangalore?

¿Qué tan raros son los científicos de datos?

¿En qué consiste el trabajo de un científico de datos en las principales empresas de tecnología?

¿Qué piensan los reclutadores de ciencia de datos de los más nuevos que han aprendido ciencia de datos en línea y en libros y qué esperan de ellos?

Cómo agudizar mis habilidades de ciencia de datos en el contexto de conseguir un trabajo como científico de datos

¿Con qué debo prepararme antes de unirme como científico de datos en una multinacional?

¿Qué especialidad debería elegir si quiero ser un científico de datos?

¿Puedo obtener un trabajo de científico de datos en Filipinas incluso si no tengo una maestría o doctorado?

¿Está bien seguir una carrera de consultor de Big Data para convertirse en un científico de datos en el futuro?

¿De qué se trata la ciencia de datos? ¿Cómo es el futuro en eso?

¿Qué desean los estadísticos que los científicos de datos sepan?