Déjame contarte una pequeña historia para colorear dónde he estado. Entonces responderé la pregunta:
He estado haciendo lo que ahora llamamos ciencia de datos desde finales de los 90. En aquel entonces, American Express reclutaría a sus analistas de datos cuantitativos y modeladores de riesgos (lo que los científicos de datos se llamaban entonces) de los diversos programas de economía de la universidad de agricultura. Sí, leíste eso bien. Economistas agrícolas. Estaba estudiando ag econ y uno de mis colegas que tenía un doctorado ag econ había sido reclutado y se unió a AmEx. Le pregunté por qué Am Ex estaba reclutando tanto a economistas agrícolas. Ella respondió: “Oh, eso es fácil. Todos nosotros con antecedentes econométricos podemos programar SAS y tener experiencia de la vida real con datos reales y lidiar con todo el dolor que implica el análisis de datos reales. La escuela de negocios y los economistas tradicionales tienen una gran teoría y pueden hacen estudios de caso pero no pueden hacer una regresión sobre datos sucios para salvar sus vidas “.
Ok, eso es super, solo usa SAS, ¿verdad? Pues no tan rápido. Eso fue en 1996 y tenía sentido. Sin embargo, el enorme problema único de SAS es simple: debe solicitar permiso para usar SAS en cualquier tienda que no esté pagando miles de dólares al año por las licencias de SAS. SAS no solo no es barato, nadie puede decirle cuánto cuesta SAS porque no anuncian precios. Puedo decirle que cuando estaba en una compañía de seguros de Fortune 500 me dijeron que pagaron> $ 2000 / año por caja de escritorio (no tengo idea si esto es correcto). Y eso es solo SAS base, no todos los paquetes y componentes agregados. Sin embargo, un empleado que tenía autoridad para gastar $ 2000 no puede simplemente llamar a SAS y obtener una copia. No. Tiene que pasar por la cadena de mando de TI corporativa con todas las maravillosas aprobaciones, controles y equilibrios.
- ¿Qué debo hacer para convertirme en un científico de datos si no tengo conocimiento de SQL y no tengo dinero para seguir un curso certificado?
- Cómo ser un científico de datos con experiencia en comercio
- Soy administrador de sistemas con 3 años de experiencia laboral con Infosys en India y estoy planeando un cambio de carrera a ciencia / análisis de datos. ¿Es un movimiento correcto?
- ¿Es el mejor camino para convertirse en un ingeniero de ML / Data Scientist para enfocarse en convertirse primero en un desarrollador de software (para alguien sin experiencia en estadísticas o programación)?
- ¿Quién fue el primer científico?
Enfrentando ese dolor de cabeza fue cómo me presentaron a R. Estaba trabajando en la compañía de seguros Fortune 500 antes mencionada y quería hacer una regresión logística. No cirugía de cohetes, solo un logit, tal vez un probit si me sentía con suerte. Sabía cómo hacer lo que quería hacer en SAS con solo unas pocas líneas de código. Pero la compañía no tenía ninguna licencia de sobra y para obtener una nueva licencia tuve que presentar un caso de negocios para justificar el gasto. Investigué un poco y descubrí que R podía hacer regresiones logísticas y también leer y escribir en nuestra base de datos Oracle. Así que en una semana aprendí suficiente R para mover datos hacia / desde Oracle y realizar la regresión logística deseada. Mi proyecto fue un éxito y obtuvimos algunas ideas sobre cosas que nunca antes habíamos tenido. ¿Le importaba al liderazgo empresarial que el análisis se hiciera en R? No. Solo querían una idea.
En ese momento tuve una epifanía: si construía mi carrera en programas caros, monolíticos y de código cerrado, entonces mi carrera estaría sujeta a los caprichos de las compañías que controlan esas herramientas. Solo iba a ser útil para las grandes empresas dispuestas a otorgarme permiso para comprar las herramientas o las empresas que ya tenían mi pila de herramientas en su lugar. Sin embargo, si construí mi carrera en herramientas de herramientas de código abierto como Python, R, Postgres y Linux, podría llevar mis habilidades a cualquier parte y realizar análisis sin tener que pedir permiso. Crecí en una zona rural de Estados Unidos y la idea de tener que pedir permiso para patear traseros es solo un anatema para mí. Quiero patear traseros con salvaje abandono y no pedirle permiso a nadie por el placer. Y para ese fin, uso herramientas de código abierto.
Tuve una conversación con John D. Cook hace más de 3 años que fue muy similar a esta. Solo que no estábamos hablando de SAS. Él escribió sobre esto en su blog: consejos profesionales sobre herramientas