¿Qué tipo de habilidades necesito como científico de datos, especialmente como cuantitativo en la industria financiera?

Daré un tipo básico de respuesta, ya que no trabajo directamente en finanzas. Mis disculpas si subestimo su nivel de habilidad.

Un buen trasfondo en el cálculo, especialmente en la medida en que permite enfoques adaptativos a problemas complejos (y especialmente cuando se trata de aprender sobre la relación entre una función y un gráfico, además de la suma, integración y derivadas, ya que para eso van preocuparse por interpretar sus resultados en más de una dimensión, comprender la naturaleza de las relaciones en los conjuntos de datos y los fundamentos de muchos métodos de estadísticas, comprender la dimensionalidad en las relaciones y comprender la direccionalidad y las tendencias de comportamiento en las relaciones).

La capacidad de aprender al menos suficiente programación para operar R, Matlab o cualquiera de los programas de análisis de datos comunes. En realidad, no te haría daño obtener más que eso, pero dado que estas son herramientas comunes, es una buena idea jugar con ellas. R es gratuito y hay alrededor de un millón de tutoriales disponibles. Tendrá que ser autodirigido con respecto al software de análisis, ya que esa será su arma preferida para manejar datos.

La capacidad de inferir términos de búsqueda de material previamente leído. Siempre habrá momentos en que comiences a mirar algo y te des cuenta de que necesitas más información. Una habilidad vital para cualquiera que quiera analizar datos será poder elegir palabras clave para poder redirigir su búsqueda de literatura. Muchos documentos ofrecen palabras clave, pero debe practicar la posibilidad de escanear artículos en busca de términos importantes o centrales en general, porque pasará una buena cantidad de tiempo en la literatura sobre descripciones y operación de motores de búsqueda para encontrar varias cosas. La capacidad de comprender y sumar ideas nunca será algo inútil para saber cómo hacerlo. Tampoco es la capacidad de encontrar más información usando términos repetidos, importantes o centrales de lo que ya tiene. Un investigador o científico de datos debe ser capaz de autodirigirse de esa manera, así como la autodirección en términos de búsqueda de información es una función de la práctica, la experiencia y la paciencia, así que tenga en cuenta que será una habilidad importante para usted. tener.

La capacidad de explicar cosas complicadas a personas con poca alfabetización estadística también será muy importante. Eso es algo que no puedo explicar exactamente cómo hacer, excepto para decir que practico explicar a diferentes tipos de personas para ser flexible. Practico explicando como lo haría a mi abuela, que tiene educación secundaria, como a un estudiante universitario, a un colega, como a un niño pequeño, oa alguien a quien no le gusta el tema. Requiere que puedas entender profundamente, lo que te exige que trates de entender profundamente. Tenga en cuenta que la alfabetización estadística promedio es realmente pobre, y a menudo presentará sus resultados a las personas que le están pagando para que entiendan algo que quizás no entiendan. (No digo que sea bueno en eso, por cierto).

Un buen historial en estadísticas. Si yo fuera usted, estudiaría los enfoques bayesiano y frecuentista: Bayes porque permiten el dinamismo y los enfoques frecuentistas porque permiten cierta simplificación / descomposición. En cuanto a métodos específicos, querrá familiarizarse con lo siguiente:

métodos básicos para obtener estadísticas descriptivas y cómo interpretarlos comparativamente a análisis más complejos
Método de Monte Carlo
Análisis de componentes principales
Análisis factorial
cómo elegir proxies
al menos otro método para descomponer conjuntos de datos complejos
cómo / por qué usamos modelos ingenuos
Análisis de red bayesana
al menos un poco (pero tanto como puedas) de complejidad y teoría de sistemas complejos
al menos un poco (o tanto como puedas) de teoría general de grafos
el álgebra lineal y las matemáticas discretas no harían daño aquí, y tampoco lo haría un conocimiento funcional de cómo funcionan las pruebas (necesitará poder leer fórmulas complejas para usar muchos de esos métodos)
El modelado de ecuaciones estructurales tampoco haría daño
Análisis de fallas / análisis de supervivencia / análisis de confiabilidad
Análisis transversales

Pero antes de volverse loco con las matemáticas, comience con algo más simple (algunos de esos métodos son multidimensionales, y tratar de hacerlo sin una base sólida en las cosas más simples es una forma rápida de volverse loco).

Eche un vistazo a OLS y a la ecuación y gráficos de Bayes generados a partir de ellos. La buena noticia es que OLS está modelado a partir de la ecuación de una línea, que debería haber encontrado con bastante rapidez en el estudio de las matemáticas y la optimización, que debería estar en la mayoría de los cursos de cálculo.

La ecuación de Bayes es un poco más complicada, probablemente sea más fácil pensar en ella como un ejercicio para asignar proporción por fracción. Si va a asignar probabilidad, generalmente tiene partes semi relacionadas, que son proporcionales entre sí de alguna manera. En este caso, es creencia previa, creencia después de presentar evidencia, y evidencia o apoyo para esa creencia. Una forma simplista de pensarlo sería que la creencia afecta la probabilidad de que algo ocurra, al igual que la evidencia disponible. Los actores humanos son extraordinariamente influyentes en los sistemas, y están fuertemente influenciados por sus creencias.

En realidad, ambos se usarán muy comúnmente en muchos campos para analizar la probabilidad. Comenzaría, si estuviera comenzando, mirando un único análisis de variables independientes y dependientes en OLS, y luego un análisis bayesano muy simple, y trataría de descubrir cómo explicar lo que estaba sucediendo. Lentamente agregue más y más variables, y continúe. (Recuerde ejecutar estadísticas descriptivas para que pueda orientarse). Y no se preocupe por que parezca un poco loco al principio: las estadísticas son muy diferentes de la forma en que las personas tienden a pensar, y estudiarlas reorganiza su forma de pensar de maneras que se van a sentir raras. *

Hay varios conceptos con los que querrás estar muy familiarizado:

diferencia
error (errores de tipo I y II, así como conocimientos básicos de la función de los términos de error)
intervalo de confianza
dependencia e independencia
grados de libertad
probabilidad y algunos límites prácticos
la maldición de la multidimensionalidad
prueba de hipótesis nula (o al menos por qué debe probar contra sus supuestos, así como con ellos)
colinealidad
distribuciones de probabilidad y lo que significan sobre los datos y métodos que puede usar
la idea de variables de control
cómo configurar un experimento / cómo ensamblar un modelo (puedes llegar muy lejos estudiando lo que ya existe)
contrafactuals
robustez
lo que entendemos por estimación y estimador

Aquí hay algunas falacias / problemas que suceden mucho con las estadísticas que querrás tener en cuenta:

La paradoja de Simpson
falacia del jugador
falacia del fiscal
dragado de datos
negando el antecedente
por qué no debes descartar a menudo datos desfavorables
qué es una pregunta cargada y cómo genera problemas
sobregeneralización
cómo se pueden sesgar las muestras / datos (la respuesta es muy fácil)
mala interpretación de las estadísticas de frecuencia
la diferencia entre significación estadística y práctica

Un libro divertido sobre cómo no hacer las cosas, que probablemente debería leer bastante temprano, es Cómo mentir con estadísticas . En cuanto a los textos sobre cómo hacer análisis econométricos específicos, este tipo hace una serie de youtube (Estadísticas / Econometría – Academia Burkey). Deberías (porque no lo he revisado personalmente, estoy obteniendo esto de otra persona) complementar esto con un buen libro de texto sobre econometría. Me han dicho que este libro es bastante bueno como libro para principiantes: Econometría en su mayoría inofensiva: un compañero empirista: 9780691120355: Economics Books @ Amazon.com. También se supone que es un buen libro para principiantes: Una guía para la econometría: 9781405182577: Economics Books @ Amazon.com

Si puede soportarlo desde el principio, pasaría un poco de tiempo con las discusiones sobre por qué muchos estadísticos dicen que uno obtiene información descriptiva, no prescriptiva de las estadísticas, y leo un poco sobre por qué las personas que hacen estadísticas tienden a decir que podemos ‘ t obtener causalidad de ello. Es un poco complicado, pero hay razones importantes para al menos ver las razones que la gente enumera para esto.

Contestaré lo que pueda, pero Quora es realmente un lugar invaluable para aprender sobre estadísticas. Siga a muchas personas que responden en este tema: a menudo proporcionarán fragmentos diarios de información útil sobre interpretación, fórmulas de las que quizás no haya oído hablar, discusiones sobre falacias y problemas, etc.
___________________

* Cuando estaba tratando de aprender esto por primera vez, pasé varias semanas visualizando, sin razón aparente, distribuciones y gráficos sobre objetos cotidianos. Lo mismo ocurre con el cálculo y los sólidos de rotación: por alguna razón, cuando está inactivo, mi cerebro no puede tratar de estimar el volumen de personas, perros, casas, etc., usando sólidos de rotación o simplemente estimando cosas con geometría.

Las matemáticas le hacen cosas extrañas a tu cerebro cuando las estudias intensamente.

Tengo 45 años, no tengo un título técnico, pero he tomado algunas clases de informática. Comenzaría con una pizarra en blanco, pero estoy dispuesto a volver a la escuela. ¿Hay trabajos de nivel de entrada para alguien como yo? ¿Soy demasiado viejo para convertirme en científico de datos?

¿Los científicos de datos tienen más oportunidades de trabajo o les resulta más fácil conseguir trabajo con un doctorado que un máster, suponiendo que ya hayan tenido un trabajo en el campo? Básicamente, ¿qué beneficio ofrece un doctorado sobre un máster después de obtener su primer trabajo de científico de datos?

Quiero ingresar a un programa de maestría en ciencia de datos. ¿Podría aprender matemáticas discretas darme una ventaja competitiva?

¿Puedo ingresar a la ciencia de datos después de un largo período de experiencia sin TI?

¿Cuál es el papel de un ingeniero de datos en Facebook?

¿Qué clases debo tomar en Georgia Tech si quiero ser un científico de datos?

Estas son las habilidades más necesarias para un puesto de científico de datos al analizar miles de puestos de trabajo (también incluí algunos recursos gratuitos que encontré para cada habilidad):
1. Python

Curso de principiantes de programación web: aprenda la programación de Python
Pitón
Learn Python – Tutorial interactivo gratuito de Python

2. Aprendizaje automático

Aprendizaje automático en curso
Aprendizaje automático en curso

3. R

Aprenda el lenguaje de programación R y los conceptos básicos de RStudio en 1 hora
Lenguaje de programación R – Code School
Introducción a R | DataCamp

4. Big Data

Universidad Big Data
Big Data y Hadoop Essentials – Udemy
Descripción básica de Big Data Hadoop – Udemy

5. Hadoop

Big Data y Hadoop Essentials – Udemy
Descripción básica de Big Data Hadoop – Udemy
Curso de formación y certificación de Hadoop | Udemy

6. SQL

Entrenamiento interactivo en línea de SQL para principiantes
Sachin Quickly Learns (SQL): lenguaje de consulta estructurado
Tutorial SQL

7. Estadísticas

Estadísticas uno en curso
Estadística y probabilidad
Probabilidad y Estadística

8. Java

Aprenda Java: el tutorial de programación de Java para principiantes
Aprenda Java – Tutorial interactivo gratuito de Java
Aprenda programación Java desde cero – Udemy

9. Minería de datos

Minería de datos y raspado web: cómo convertir sitios en datos
Minería de datos en curso

Una excelente manera de adquirir nuevas habilidades y hacer crecer su red profesional es asistir a reuniones: http://data-science.meetup.com/

Puede obtener más información sobre las habilidades necesarias para convertirse en un científico de datos y obtener recursos relevantes aquí.

Nir Goldstein

Dado que está trabajando como cuantificador, ya debe tener una sólida base matemática. Todo lo que necesita hacer es cambiar su mentalidad: de una mentalidad cuantitativa a una mentalidad de científico de datos. Todo lo demás se puede aprender en el trabajo.

Los quants trabajan principalmente en la fijación de precios de derivados y otros productos financieros. Los científicos de datos, por otro lado, resuelven una gran cantidad de problemas en todas las industrias. Por lo tanto, uno debe estar abierto a resolver nuevos problemas en todos los dominios. Entonces podemos decir que el rol del científico de datos es bastante más amplio en comparación con un rol cuantitativo

La ciencia de datos también es muy amplia. Utiliza técnicas de muchas áreas académicas diferentes, como Matemática Aplicada, Estadística, Aprendizaje automático, Informática teórica, Investigación de operaciones, Econometría, Psicometría. Para un principiante es importante tener las siguientes habilidades

Habilidades :

1- Matemáticas (álgebra lineal, geometría coordinada, cálculo avanzado)

2- Probabilidad (Comprensión de la probabilidad y diferentes distribuciones de probabilidad)

3- Estadísticas (comprensión de distribuciones estadísticas, estadísticas resumidas, escuelas de teoría y análisis estadísticos, estadísticas inferenciales, etc.)

4- Econometría (prueba de hipótesis, regresión lineal, supuestos de regresión lineal, regresión logit / probit, modelos de datos de panel, explicación de efectos marginales en regresión, etc.)

5- Aprendizaje automático (regresión lineal / logística, árbol de decisión, análisis discriminante lineal, refuerzo, embolsado, bosque aleatorio, SVM, etc.)

6- Investigación de operación (programación lineal / no lineal / entera)

7- Programación estadística (módulos SAS, SPSS, R, Matlab, Octave, Python)

8- Programación de uso general (C, C ++, JAVA, Python)

Suscríbase a nuestra Universidad de YouTube Channel Analytics para aprender Analytics / Data Science

Jaehyeon Kim

Se da una sensación de habilidad en las ofertas de trabajo. Puede ver el trabajo objetivo y sus expectativas.

Muchos demandan perspicacia empresarial. Debe estar familiarizado con cualquier miembro de la organización. Esto requiere algún marco de la operación de la organización.

También exigen competencia en programación. Debe tomar un problema comercial y enmarcarlo en el lenguaje informático. Esto abarca todo. Extrae, transforma y modela los datos. Usted y el socio comercial evalúan la validez del modelo.

Por último, debe presentar los hallazgos bien. Esto cubre la interpretación del modelo en la organización. El resultado da una idea al socio comercial e informa la acción. Recomiendas la estrategia informada.

Esto cubre el trabajo básico de principio a fin. Se asumen todas las habilidades específicas en lenguajes de programación, fluidez del lenguaje, estrategia comercial y fundamentos en ciencia de datos.

Gilbert Duy Pham Doan

Ser capaz de comprender la diferencia entre qué tipo de matemática se puede aplicar en situaciones de la vida real y qué matemática se ve bien en el papel pero es inútil en situaciones de la vida real. Ser capaz de comprender esta diferencia es que siento la habilidad más esencial que necesitas.

La conclusión de la investigación puede ser estadísticamente significativa, pero si no puede aplicarla, es inútil.

Este es un problema extremadamente común en la industria financiera, la batalla entre un profesional financiero y alguien en la academia que persigue preguntas relacionadas con las finanzas.

Jaehyeon Kim

Los conjuntos de habilidades típicos para los científicos de datos pueden o no estar relacionados con quants.

Si bien los científicos de datos están involucrados en el análisis estadístico aplicado o el aprendizaje automático, lo que se requiere para los cuantos sería más sobre las formas de analizar los precios derivados o las variables relacionadas con él: las herramientas necesarias son la simulación de Monte Carlo, el método de diferencias finitas, el árbol binomial … Para En un contexto teórico, en lugar del análisis estadístico o el aprendizaje automático, la teoría de la probabilidad sería más importante: sería necesario comprender la teoría del precio de martingala.

Además, el análisis de series temporales podría ser muy beneficioso para los cuantos, ya que pueden aplicarse al análisis de riesgos (ARCH o GARCH), así como a la negociación (de alta frecuencia). En la visión de las estadísticas de los frecuentistas, los datos pueden verse como (1) una muestra aleatoria de una población o como (2) la realización de un determinado proceso de generación de datos. La última opinión sería más común y se llamaría proceso estocástico. El análisis del proceso estocástico , que incluye el análisis de series de tiempo, recibiría más atención.

Gilbert Duy Pham Doan

Puede obtener datos, manejar datos, transformar datos para satisfacer sus necesidades, encontrar significado en los datos y comunicar este significado. Por supuesto, aprender las herramientas y el comercio para hacer todo esto ayuda.

No es muy común encontrar personas solteras que conozcan todo esto para especializarse. Esto se aplica a cualquier campo.

Para la industria financiera, debe desarrollar el conocimiento de dominio apropiado y hablar el idioma. Necesita conocer las transacciones básicas, elementos y entidades. Necesita saber cómo funcionan los mercados, cómo se financian las cosas y cómo se hacen los tratos. Cuantos más parámetros pueda trabajar, más información puede obtener.

Jaehyeon Kim

Científico de información de más alto nivel: ontólogo [teórico, también conocido como: filosofía]
Habilidades básicas: lengua materna (inglés, mandarín …) y matemáticas (análisis, estadísticas …)
Habilidades avanzadas: significado / diferencias … Sistemas y solución de problemas

Lo anterior, como sigue, IMO: hoy todos se centran en los datos, una montaña de información de significado nebulosa; IOW, todo lo agrupado se analiza para un valor específico. Esta es una realidad ludita primitiva “la tecnología hace que la cultura … la información” sea buena para ingenieros, arquitectos … aplicación práctica. En realidad, “La información hace cultura … tecnología” es la base más sólida para que el Científico de la Información teórico descubra lo que es práctico (realmente funciona). ¿Qué quiere trabajar con la ciencia aplicada (más paga, menos valor) o ciencia teórica (más valor, menos paga)?

Jaehyeon Kim

More Interesting

¿Qué piensan los científicos de datos experimentados sobre 'El proceso de ciencia de datos' descrito en Harvard CS 109 (2013) (ver imagen)?

Como analista de datos, ¿qué pasos debo seguir para convertirme en científico de datos?

¿Qué clases debo tomar en BITS Pilani si quiero ser un científico de datos?

¿Puedo convertirme en un científico de datos si hago un MBA de una reconocida escuela B después de mi licenciatura en zoología?

¿Con qué propósito un científico de datos pone scripts de shell en el trabajo?

Quiero ingresar en la profesión de la ciencia de datos. ¿Debería estudiar marcos prácticos de programación práctica como Hadoop, Mahout, etc., o debería centrarme en conceptos teóricos y estadísticas detrás del aprendizaje automático, la minería de datos, etc.?

¿Cuál es la forma más fácil de recibir alertas cuando alguien cambia un esquema de base de datos?

¿Qué lenguaje de programación debo aprender a ser un científico de datos?

¿Qué cualidades buscan los científicos de datos en un puesto de trabajo?

¿Cómo puede uno convertirse en científico de datos después de haber sido ingeniero de sistemas?