No practico la ciencia de datos a diario (es más una habilidad adicional en este momento), por lo que otros pueden tener respuestas más sabias … pero cuando lo hago, la mayor frustración que tengo es obtener buenos datos. A menudo, mi tarea implica el descubrimiento de variables particularmente importantes cuando se trata de cierto tipo de problema, para que esos problemas puedan resolverse. Personalmente, he estado tratando de recopilar datos, por ejemplo, sobre accidentes automovilísticos en un esfuerzo por determinar si el tipo de vehículos involucrados es o no un factor importante. En mi caso, no todos los estados recopilan suficientes datos, mientras que algunos se niegan a divulgarlos, e incluso cuando lo hacen, y son los mismos datos, hay poca o ninguna estandarización sobre cómo esos datos se etiquetan, almacenan, codifican, etc. puede ser una pesadilla ponerlos a todos en el mismo formato y no tener brechas gigantescas que podrían sesgar los resultados para que sean completamente erróneos. Otro tema de importancia nacional sería sobre la violencia armada … y la NRA ha presionado mucho para evitar el estudio de la violencia armada. Entonces, nuevamente, la FALTA de datos significa que no podemos hacer un análisis bueno o significativo y descubrir cuál es la verdad del asunto.
Entonces, TL; DR: Mi mayor motivo favorito es no tener acceso a buenos datos.
- ¿Puedo convertirme en un científico de datos haciendo Ingeniería en Ciencias de la Información?
- ¿Cuáles son los mejores trabajos de analista de datos de nivel de entrada / Big Data / análisis de datos que existen? Específicamente, ¿qué compañías ofrecen la mejor compensación y prestigio?
- Cómo convertirse en un científico de datos en Malasia
- ¿Qué universidades ofrecen una maestría en ciencia de datos o análisis?
- ¿Deberían las personas importantes en matemáticas o estadísticas aprender sistemas distribuidos o diseño de bases de datos para ser un buen científico de datos?