Daré un tipo básico de respuesta, ya que no trabajo directamente en finanzas. Mis disculpas si subestimo su nivel de habilidad.
Un buen trasfondo en el cálculo, especialmente en la medida en que permite enfoques adaptativos a problemas complejos (y especialmente cuando se trata de aprender sobre la relación entre una función y un gráfico, además de la suma, integración y derivadas, ya que para eso van preocuparse por interpretar sus resultados en más de una dimensión, comprender la naturaleza de las relaciones en los conjuntos de datos y los fundamentos de muchos métodos de estadísticas, comprender la dimensionalidad en las relaciones y comprender la direccionalidad y las tendencias de comportamiento en las relaciones).
La capacidad de aprender al menos suficiente programación para operar R, Matlab o cualquiera de los programas de análisis de datos comunes. En realidad, no te haría daño obtener más que eso, pero dado que estas son herramientas comunes, es una buena idea jugar con ellas. R es gratuito y hay alrededor de un millón de tutoriales disponibles. Tendrá que ser autodirigido con respecto al software de análisis, ya que esa será su arma preferida para manejar datos.
- ¿Qué piensa la gente sobre el artículo 'Data Science is Dead'?
- Papel del científico de datos después de la escuela de posgrado: ¿es mejor probar una empresa pequeña o grande?
- ¿Qué hace un científico de datos en una empresa de publicidad digital?
- Cómo conseguir un trabajo de científico de datos en LinkedIn
- ¿Es el campamento de entrenamiento de Zipfian Academy / Galvanize Data Science un campamento de alta calidad?
La capacidad de inferir términos de búsqueda de material previamente leído. Siempre habrá momentos en que comiences a mirar algo y te des cuenta de que necesitas más información. Una habilidad vital para cualquiera que quiera analizar datos será poder elegir palabras clave para poder redirigir su búsqueda de literatura. Muchos documentos ofrecen palabras clave, pero debe practicar la posibilidad de escanear artículos en busca de términos importantes o centrales en general, porque pasará una buena cantidad de tiempo en la literatura sobre descripciones y operación de motores de búsqueda para encontrar varias cosas. La capacidad de comprender y sumar ideas nunca será algo inútil para saber cómo hacerlo. Tampoco es la capacidad de encontrar más información usando términos repetidos, importantes o centrales de lo que ya tiene. Un investigador o científico de datos debe ser capaz de autodirigirse de esa manera, así como la autodirección en términos de búsqueda de información es una función de la práctica, la experiencia y la paciencia, así que tenga en cuenta que será una habilidad importante para usted. tener.
La capacidad de explicar cosas complicadas a personas con poca alfabetización estadística también será muy importante. Eso es algo que no puedo explicar exactamente cómo hacer, excepto para decir que practico explicar a diferentes tipos de personas para ser flexible. Practico explicando como lo haría a mi abuela, que tiene educación secundaria, como a un estudiante universitario, a un colega, como a un niño pequeño, oa alguien a quien no le gusta el tema. Requiere que puedas entender profundamente, lo que te exige que trates de entender profundamente. Tenga en cuenta que la alfabetización estadística promedio es realmente pobre, y a menudo presentará sus resultados a las personas que le están pagando para que entiendan algo que quizás no entiendan. (No digo que sea bueno en eso, por cierto).
Un buen historial en estadísticas. Si yo fuera usted, estudiaría los enfoques bayesiano y frecuentista: Bayes porque permiten el dinamismo y los enfoques frecuentistas porque permiten cierta simplificación / descomposición. En cuanto a métodos específicos, querrá familiarizarse con lo siguiente:
- métodos básicos para obtener estadísticas descriptivas y cómo interpretarlos comparativamente a análisis más complejos
- Método de Monte Carlo
- Análisis de componentes principales
- Análisis factorial
- cómo elegir proxies
- al menos otro método para descomponer conjuntos de datos complejos
- cómo / por qué usamos modelos ingenuos
- Análisis de red bayesana
- al menos un poco (pero tanto como puedas) de complejidad y teoría de sistemas complejos
- al menos un poco (o tanto como puedas) de teoría general de grafos
- el álgebra lineal y las matemáticas discretas no harían daño aquí, y tampoco lo haría un conocimiento funcional de cómo funcionan las pruebas (necesitará poder leer fórmulas complejas para usar muchos de esos métodos)
- El modelado de ecuaciones estructurales tampoco haría daño
- Análisis de fallas / análisis de supervivencia / análisis de confiabilidad
- Análisis transversales
Pero antes de volverse loco con las matemáticas, comience con algo más simple (algunos de esos métodos son multidimensionales, y tratar de hacerlo sin una base sólida en las cosas más simples es una forma rápida de volverse loco).
Eche un vistazo a OLS y a la ecuación y gráficos de Bayes generados a partir de ellos. La buena noticia es que OLS está modelado a partir de la ecuación de una línea, que debería haber encontrado con bastante rapidez en el estudio de las matemáticas y la optimización, que debería estar en la mayoría de los cursos de cálculo.
La ecuación de Bayes es un poco más complicada, probablemente sea más fácil pensar en ella como un ejercicio para asignar proporción por fracción. Si va a asignar probabilidad, generalmente tiene partes semi relacionadas, que son proporcionales entre sí de alguna manera. En este caso, es creencia previa, creencia después de presentar evidencia, y evidencia o apoyo para esa creencia. Una forma simplista de pensarlo sería que la creencia afecta la probabilidad de que algo ocurra, al igual que la evidencia disponible. Los actores humanos son extraordinariamente influyentes en los sistemas, y están fuertemente influenciados por sus creencias.
En realidad, ambos se usarán muy comúnmente en muchos campos para analizar la probabilidad. Comenzaría, si estuviera comenzando, mirando un único análisis de variables independientes y dependientes en OLS, y luego un análisis bayesano muy simple, y trataría de descubrir cómo explicar lo que estaba sucediendo. Lentamente agregue más y más variables, y continúe. (Recuerde ejecutar estadísticas descriptivas para que pueda orientarse). Y no se preocupe por que parezca un poco loco al principio: las estadísticas son muy diferentes de la forma en que las personas tienden a pensar, y estudiarlas reorganiza su forma de pensar de maneras que se van a sentir raras. *
Hay varios conceptos con los que querrás estar muy familiarizado:
- diferencia
- error (errores de tipo I y II, así como conocimientos básicos de la función de los términos de error)
- intervalo de confianza
- dependencia e independencia
- grados de libertad
- probabilidad y algunos límites prácticos
- la maldición de la multidimensionalidad
- prueba de hipótesis nula (o al menos por qué debe probar contra sus supuestos, así como con ellos)
- colinealidad
- distribuciones de probabilidad y lo que significan sobre los datos y métodos que puede usar
- la idea de variables de control
- cómo configurar un experimento / cómo ensamblar un modelo (puedes llegar muy lejos estudiando lo que ya existe)
- contrafactuals
- robustez
- lo que entendemos por estimación y estimador
Aquí hay algunas falacias / problemas que suceden mucho con las estadísticas que querrás tener en cuenta:
- La paradoja de Simpson
- falacia del jugador
- falacia del fiscal
- dragado de datos
- negando el antecedente
- por qué no debes descartar a menudo datos desfavorables
- qué es una pregunta cargada y cómo genera problemas
- sobregeneralización
- cómo se pueden sesgar las muestras / datos (la respuesta es muy fácil)
- mala interpretación de las estadísticas de frecuencia
- la diferencia entre significación estadística y práctica
Un libro divertido sobre cómo no hacer las cosas, que probablemente debería leer bastante temprano, es Cómo mentir con estadísticas . En cuanto a los textos sobre cómo hacer análisis econométricos específicos, este tipo hace una serie de youtube (Estadísticas / Econometría – Academia Burkey). Deberías (porque no lo he revisado personalmente, estoy obteniendo esto de otra persona) complementar esto con un buen libro de texto sobre econometría. Me han dicho que este libro es bastante bueno como libro para principiantes: Econometría en su mayoría inofensiva: un compañero empirista: 9780691120355: Economics Books @ Amazon.com. También se supone que es un buen libro para principiantes: Una guía para la econometría: 9781405182577: Economics Books @ Amazon.com
Si puede soportarlo desde el principio, pasaría un poco de tiempo con las discusiones sobre por qué muchos estadísticos dicen que uno obtiene información descriptiva, no prescriptiva de las estadísticas, y leo un poco sobre por qué las personas que hacen estadísticas tienden a decir que podemos ‘ t obtener causalidad de ello. Es un poco complicado, pero hay razones importantes para al menos ver las razones que la gente enumera para esto.
Contestaré lo que pueda, pero Quora es realmente un lugar invaluable para aprender sobre estadísticas. Siga a muchas personas que responden en este tema: a menudo proporcionarán fragmentos diarios de información útil sobre interpretación, fórmulas de las que quizás no haya oído hablar, discusiones sobre falacias y problemas, etc.
___________________
* Cuando estaba tratando de aprender esto por primera vez, pasé varias semanas visualizando, sin razón aparente, distribuciones y gráficos sobre objetos cotidianos. Lo mismo ocurre con el cálculo y los sólidos de rotación: por alguna razón, cuando está inactivo, mi cerebro no puede tratar de estimar el volumen de personas, perros, casas, etc., usando sólidos de rotación o simplemente estimando cosas con geometría.
Las matemáticas le hacen cosas extrañas a tu cerebro cuando las estudias intensamente.