¿Es la ciencia de datos una moda? ¿Cuánto tiempo seguirá creciendo como campo?

La discusión sobre este hilo es bastante representativa del espectro de opiniones sobre lo que realmente significa el término (y título profesional) “científico de datos”:

La primera pregunta en cuestión es “¿ seguirá existiendo una gran demanda de profesionales con la capacidad de trabajar con datos con éxito “?

  • Si esto es lo que queremos saber, la respuesta es un ” ” inequívoco; la creciente demanda de “científicos de datos” es representativa de una necesidad que no disminuirá en el corto plazo. El costo de almacenar, trabajar y obtener información de los datos sigue disminuyendo, lo que significa que la demanda de profesionales que puedan trabajar con esta información y entregar las ideas continuará creciendo.
  • La necesidad de obtener información a partir de los datos para las empresas de tecnología, basadas en gran medida (o exclusivamente) a través de la interfaz móvil y web, es sencilla, pero la explosión de la demanda de científicos de datos (y otros profesionales de datos) en el comercio minorista, telecomunicaciones, marketing, atención médica, educación y Casi todas las demás industrias y sectores públicos sugieren un hecho convincente: el aprovechamiento de los datos es fundamentalmente un ejercicio para utilizar la evidencia disponible para llevar a cabo una toma de decisiones óptima al operar una empresa o institución pública. En este sentido, la pregunta de si continuará existiendo una demanda de expertos que puedan trabajar bien con los datos es como preguntar si seguirá existiendo una demanda de expertos que puedan administrar bien o que puedan garantizar la excelencia operativa en una organización . A medida que una empresa crece, la necesidad de que estas habilidades se mantengan competitivas se convertirá en una necesidad más que un lujo.

Entonces, ¿de qué tipo de “expertos en datos” estamos hablando? Científico de datos, analistas, mineros de datos, estadísticos, …

  • En cierto modo, la respuesta es “todo lo anterior”. Debido a que el campo es tan nuevo, la forma en que usamos estos términos todavía está pendiente, por lo que hay mucho espacio para un debate saludable sobre las distinciones entre los “analistas de datos” tradicionales (o el “minero de datos” menos utilizado) y los “científicos de datos”, o si los científicos de datos son estadísticos renombrados. La distinción que está comenzando a solidificarse en la industria es que los analistas analizan e informan sobre observaciones de datos anteriores , mientras que los científicos llevan esos datos un paso más allá utilizando el modelado estadístico y el aprendizaje automático para sacar conclusiones e ideas sobre datos futuros que aún no se han recopilado. El idioma todavía está cambiando y hay muchos “Científicos de datos” fantásticos con “Analista” en sus títulos.
  • En círculos, trabajo con el término “científico de datos” significa alguien con el conocimiento, las habilidades y la experiencia para crear modelos prescriptivos y predictivos además de informes retrospectivos. En gran parte, esto significa utilizar una gran cantidad de modelado estadístico y aprendizaje automático, por lo que las estadísticas son un punto de partida para aprender ciencia de datos. Sin embargo, Data Science no se trata de la teoría estadística pura más que de la bioinformática, la mecánica estadística o cualquier otra disciplina.
  • Al igual que con la mayoría de las nuevas profesiones (o al menos títulos profesionales), el papel de Data Scientist sigue siendo un poco complicado para una serie de especializaciones importantes. Ya existe una distinción entre el Data Science Modeler, que se enfoca más en diseñar, diseñar y entrenar los algoritmos y generar información de datos, y el Data Science Engineer que se enfoca más en proporcionar la implementación escalable y la arquitectura distribuida necesaria para ejecutar estos algoritmos en producción. La terminología sin duda evolucionará en los próximos años, pero es probable que los científicos de datos de todas las tendencias sigan necesitando tener una familiaridad funcional con los fundamentos importantes en las ciencias de datos: un modelador de ciencia de datos incapaz de pensar y anticipar los problemas de escalabilidad en su código no serán muy efectivos cuando se trata de la producción, y un ingeniero de datos que no esté familiarizado con las estadísticas o los elementos de Machine Learning tendrá dificultades para diseñar sistemas eficientes que aprovechen al máximo los algoritmos del modelador .

Pero, ¿la ciencia de datos es realmente una ciencia?
Para estar seguros, es un nuevo término para un campo en crecimiento. Muchos podrían estar de acuerdo en que fundamentalmente cualquier ciencia se trata de tomar observaciones del mundo real y usar mejores prácticas confiables para comprender esas observaciones y sacar conclusiones comprobables sobre las nuevas observaciones que esperamos hacer. Entonces, aunque Data Science no está en la lista de “ciencias tradicionales” como Física o Biología, que se enfocan directamente en la observación de fenómenos naturales, es similar a Computer Science, una ciencia de sacar conclusiones comprobables sobre fenómenos computacionales. Data Science se trata de extraer conclusiones comprobables sobre conjuntos de datos de todo tipo extraídos de entornos industriales o académicos.

La capacitación de un científico de datos significa desarrollar las habilidades de los estudiantes para pensar y operar como científicos, profundizando en las estadísticas de pruebas rigurosas de hipótesis y mejores prácticas de diseño experimental. Los principales científicos de datos deben tener la experiencia de trabajar con datos del mundo real tomados de la industria para obtener información comprobable sobre esos datos que puedan usarse en el futuro.

Tener habilidades como esta es lo que hace que los científicos de datos expertos sean tan buscados en la industria. Entonces, a medida que un conjunto de habilidades básicas bien definido para los científicos de datos y otros especialistas continúe tomando forma en los próximos años, la pregunta evolucionará más de si se necesita un científico de datos , a una pregunta de qué tipo de experto en datos puede beneficiarse una institución de la mayoría .

Si y no.


El término real “Big Data” es una moda pasajera. Para evidencia, quisiera señalar el hecho de que las compañías web más grandes y ciertas entidades dentro del gobierno de los Estados Unidos han estado utilizando cantidades extremadamente grandes de datos no estructurados durante años antes de que alguien haya oído hablar de “Big Data”. Para ellos, solo eran “datos”. ¿Ha cambiado realmente la escala a la que Google está indexando toda la información conocida o la grabación de la NSA desde antes de que todos comenzáramos a escuchar sobre “Big Data”? Personalmente, no lo creo. Fue alucinante, todavía es alucinante, pero para estos líderes en el campo eso es solo “datos” y lidiar con ellos es solo un día de trabajo.

Además, los grandes bancos y compañías de seguros han estado presionando constantemente contra los límites de las tecnologías comerciales de almacenamiento de datos orientadas a filas durante décadas, y para ellos, esto era solo “datos”. Esta es más el área en la que trabajo, y para mi empresa lidiar con mil millones de líneas de datos transaccionales o domésticos ha sido mundana durante años, y ahora las tecnologías de gama alta pueden hacer análisis ad-hoc en miles de millones de filas en memoria , literalmente en segundos. Para mis colegas más titulares, esto siempre ha sido solo “datos” y “análisis”.


¿Las tecnologías que rodean el almacenamiento, procesamiento y análisis de “Big Data” son una moda? Están promocionados en este momento, pero no creo que sean una moda pasajera. Yo digo que son promocionados por esta razón. Los datos no son mágicos: es solo una cantidad bruta valiosa a partir de la cual a veces se pueden refinar aún más conocimientos específicos valiosos. Cuanto más grandes sean los datos, más recursos necesitará para trabajar, por lo tanto, mejor será el intercambio de valor. No he visto ninguna evidencia de que el tamaño de los datos se correlacione positivamente con su valor.

Sin embargo, he visto mucha evidencia de que el análisis de datos prudente puede crear valor, ya sea conocimiento o monetario, para muchas organizaciones. Por eso digo que las tecnologías que nos permiten almacenar, procesar y analizar grandes cantidades de datos no son una moda. Para las empresas y entidades analíticas líderes, el uso de grandes cantidades de datos ha sido una propuesta de valor favorable durante algún tiempo, y no hay razón para que esa tendencia se desacelere. Con el aumento del rendimiento de las tecnologías requeridas y la disminución de sus precios, creo que es probable que varias organizaciones que luchan por lidiar con sus datos de tamaño mediano hoy en día pasen a utilizar grandes cantidades de datos para aprovechar el valor en los próximos años. Como mínimo, las empresas, los hospitales y las universidades se enfrentarán a una competencia que los impulsará a hacerlo. Otras organizaciones pueden ser más lentas para invertir en la nueva generación de tecnologías de datos y personal, porque son complicadas y costosas, y porque algunas organizaciones más pequeñas no necesitarán un análisis sofisticado para comprender su entorno operativo.

Ayer estaba teniendo la misma discusión con un colega senior. Según él, Data Science y Big Data son solo una moda y un problema de investigación. Lo que las empresas quieren es un producto procesable, algo que genere valor. ¿Y cómo genera valor la ciencia de datos?

Esto me entristeció un poco por la poca gente que entiende el dominio y cómo tienen sesgos inherentes en cuanto a lo que comprende la ciencia de datos.

Para hablar sobre la ciencia de datos en el uso comercial, primero me gustaría definir lo que llamo “La elección”.

Tiendo a ver los buenos negocios como negocios que toman buenas decisiones. Por ejemplo

– Para una empresa de gestión de riesgos, la opción es tomar medidas / no tomar medidas en una tarjeta.
– Para una empresa de marketing, la opción es utilizar la estrategia publicitaria correcta.
– Para una cadena de comercio electrónico, la opción es mostrar productos relevantes a sus usuarios en línea.
– Para una aerolínea, la opción es la estrategia de fijación de precios del boleto.

¿Y cómo hacen estas empresas estas elecciones? ¿Por intuición? Probablemente. Pero no sería mejor si aprendieran del pasado a dejar de cometer los mismos errores una y otra vez. ¿Eso tendría sentido? Y eso es ciencia de datos para ti.

La mayoría de las veces los gerentes discutían sobre todo tipo de preguntas como:

– ¿Data Science solo está creando modelos?
– ¿Llamarías a una tabla dinámica de Excel como Data Science?
– ¿Qué pasa con ETL? ¿Es eso ciencia de datos?
– ¿La ciencia de datos implica pensamiento algorítmico?
– ¿Qué pasa con las visualizaciones de datos para marcos web / portales?
– Evaluación de la hipótesis. ¿Sigue siendo Data Science?
– ¿Alguien que use herramientas de Big Data como Hadoop / Spark se llamaría científico de datos?

Y la respuesta es realmente simple:

“Cualquier observación valiosa que pueda derivarse de datos que no son directamente visibles con solo mirar unas pocas filas es ciencia de datos”.

Puede usar cualquier herramienta, cualquier modelo o cualquier interfaz de visualización. Mientras no clasifique las opciones, no será de valor.

Alternativamente, puede usar cualquier herramienta / modelo / visualización siempre que genere valor a partir de datos, es ciencia de datos.

Entonces, ¿la ciencia de datos está muriendo o es una moda pasajera?

Soy muy optimista con respecto a la ciencia de datos, ya que aprender del pasado se está volviendo realmente importante para que las empresas sigan siendo competitivas. En mi opinión, siempre habría una escasez de personas que pudieran luchar con los datos y ensuciarse las manos para descubrir información valiosa.

Y el juego sería: ¿Quién usa mejor sus datos?

Empresas como Google, Amazon son tan grandes en función de cómo manejan sus datos. En este momento Bing está muy por detrás de Google en el negocio de la publicidad de búsqueda. ¿Porqué es eso? Porque google ha usado sus datos de una mejor manera. Aunque dos doctores. los estudiantes no podrán vencer a Google en su juego, incluso si crean el mejor algoritmo de búsqueda, una empresa como Bing siempre buscaría encontrar este mejor algoritmo y siempre buscaría personas con talento que puedan utilizar los datos.

¿Por qué se subestima la ciencia de datos?

La razón principal por la que las personas subestiman la importancia de la ciencia de los datos es que no es cuantificable. Al ser un proceso de descubrimiento de conocimiento, es muy intermitente y es posible que tenga que esperar para obtener una sola respuesta. Esto lleva a algunas personas a etiquetarlo como un problema de investigación y no merece todo el aprecio que está recibiendo. Pero como dije, todo se trata de “The Choice”. Y si no lo logras, tu competidor lo haría.

En lugar de darte mi opinión, te haré una mejor, te diré lo que piensa Usama Fayyad. Por cierto, hoy estuve en una charla suya (lo cual fue genial por cierto), y alguien de la audiencia tenía una pregunta en líneas similares.

Según él, la ciencia de datos probablemente se promociona hoy, pero luego muchas tecnologías que terminan siendo exitosas pasan por un ciclo Hype. Así es como se ve:


Data Science probablemente esté en algún lugar alrededor del pico en ese gráfico (ouch), pero tiene una larga vida más allá de la fase de la exageración que se apaga. Se quedará debido a cómo nos obliga a pensar en algunos aspectos fundamentales del trabajo con datos: almacenamiento de grandes volúmenes, procesamiento, etc.

¡Espero no haber malinterpretado lo que dijo!

(Usama Fayyad está en Quora !? wow :))

Hola:

No lo creo. Creo que la ciencia de datos está aquí para quedarse para siempre con nosotros. No me sorprenderá incluso si se convierte en el aspecto más importante para determinar el éxito de cualquier negocio, independientemente de en qué industria operen.

He aquí por qué creo que sí.

¡Según IBM, el 90% de los datos que tenemos en el mundo hoy se han generado en los últimos 2 años! Todos los días estamos generando 2,5 bytes quintilianos (2,500,000 terabytes) de datos. Estos datos provienen de todas partes, como redes sociales, sensores, transacciones, imágenes, videos, etc. Se espera que el crecimiento de estos datos crezca exponencialmente en las próximas décadas.

La conclusión es que Data Science está aquí para quedarse y requerirá una gran cantidad de científicos de datos y máquinas para obtener estos datos para obtener información e inteligencia procesables.

¿Qué significa para ti?

  • Si busca empleo con habilidades de Data Science, ML / AI y Big Data, al menos los próximos 10-15 años serán un período de auge para usted, donde gigantes tecnológicos como Google, Facebook, Microsoft, IBM, otras compañías en todo verticales y nuevas empresas en todo el mundo estarán igualmente interesadas en contratar a un talento como usted.
  • Si es un emprendedor con una buena idea relacionada con Data Science, ML / AI, Big Data, tendrá muchas oportunidades para recaudar dinero para impulsar el crecimiento de su negocio. Según una estadística de Kalaari, ¡las empresas de IA han recaudado $ 6B USD desde 2014!

Cualquiera que todavía esté sentado en la cerca y no esté convencido de Data Science, será impulsado por la competencia.

Espero que esto ayude.

¡Salud!

La “ciencia de datos” no es una moda en el sentido de que habrá un crecimiento continuo de la demanda de personas capacitadas con una combinación de habilidades en estadística, informática y matemáticas aplicadas. Por otro lado, no creo que la “ciencia de datos” deba comercializarse como una disciplina que de alguna manera ofrece una perspectiva marcadamente única aparte de estos campos, en lugar de una amalgama de perspectivas de ellos.

Big data tiene que ver con el efecto de red.

Si tiene, por ejemplo, un refrigerador conectado a Internet, puede controlarlo a través de su teléfono inteligente. Vaya cosa.

Pero si tiene un millón de refrigeradores conectados a Internet, puede ver los comportamientos relacionados con cada uno. De repente, sus datos pueden indicar a los supermercados los patrones de pedido con los que deben coincidir. Dígales a las granjas cuántos huevos habrá demanda para esa semana. Y descubra tendencias para predecir las demandas de diferentes productos en el futuro.

Con tres mil millones de personas ahora en Internet y 50 mil millones de dispositivos pronosticados para 2020, los grandes datos están solo en las laderas más bajas de una curva exponencial. No va a desaparecer pronto.

La respuesta a esta pregunta radica en cuáles son las calificaciones o habilidades necesarias para convertirse en un científico de datos. El componente básico de la ciencia de datos o cualquier trabajo son principalmente las habilidades requeridas para el trabajo. Si las habilidades requeridas no se demandan con el tiempo, es una moda pasajera.
Un científico de datos necesita las siguientes habilidades:

http://www.forbes.com/sites/quor

Estas habilidades básicamente definen una ciencia informática importante (pista relacionada con la IA) y una menor en el tipo de fondo de matemáticas / estadísticas. Esto ha estado en demanda durante años y la demanda solo parece crecer. Entonces, no creo que sea una moda pasajera.

Este documento técnico hace un gran trabajo al explicar lo que solía ser la ciencia de datos y las diferencias entre el científico de datos y el artista de datos. Por lo tanto, no diría que es una moda pasajera, pero diría lo que significa la ciencia de datos y el campo está cambiando de manera bastante dramática.

En este informe técnico comenzará a comprender que el científico de datos es un término desactualizado porque la función de trabajo del científico de datos está en un estado de cambio. La luminaria de análisis Jim Sterne, fundador de la Asociación de Análisis Digital, explora el nuevo y convincente papel de “artista de datos” en los negocios.

Jim cree que un “artista de datos debe tener una comprensión firme de la ciencia dura, una comprensión sólida de los objetivos y procesos de negocios, una inclinación por la creatividad y un talento para la comunicación, una combinación muy rara”.

Publicación en blog: Científico de datos, por favor conozca al Artista de datos

Leer más: Anametrix De Data Scientist a Data Artist White Paper

“Ciencia de datos” es la conceptualización de un campo de estudio cuyo sujeto resulta ser datos independientemente de cualquier dominio. Los datos parecen un área temática ‘meta’, pero no es diferente de ‘Computación’ en el campo de la informática. Por supuesto, hay una gran superposición con los campos existentes.

Big Data, implica la construcción de sistemas informáticos que son capaces de manejar grandes cantidades de datos de manera escalable. Esto pertenece convencionalmente al campo de la informática. La minería de datos implica el descubrimiento de información a partir de datos existentes. Esto implica convencionalmente los campos de la informática y la estadística. El aprendizaje automático proviene convencionalmente de la informática. El procesamiento de señales, la teoría de la información, la mecánica estadística y los métodos numéricos provienen de la ingeniería y la ciencia física. La computación de alto rendimiento involucra tanto la informática como los métodos numéricos (a veces llamados ciencia computacional que difiere de la informática). También hay todo tipo de otros campos que se centran más en los esfuerzos humanos, como la ciencia actuarial, la investigación de operaciones y el análisis financiero cuantitativo.

Por supuesto, hay un reconocimiento de que hay un montón de técnicas analíticas que parecen independientes del dominio de estudio. Estas técnicas analíticas se utilizan en esfuerzos científicos donde las teorías se construyen a partir del análisis de datos. Hay una razón por la cual los doctores tienden a ser candidatos ideales para puestos de Data Science porque han tenido experiencia en este tipo de trabajo, independientemente del dominio.

Por lo tanto, un físico puede convertirse en un científico de datos cuando comienza a trabajar en un campo que no sea la física. Es análogo a cuando un físico se convierte en un Quant cuando comienza a usar sus técnicas en el dominio financiero. En esencia, esto es por qué “Data Science” es tan popular. Hay muchas empresas que tienen muchos datos pero no tienen los conjuntos de habilidades necesarias para comprender estos datos. Por lo tanto, actualmente vemos la caza furtiva de las ciencias duras, pero finalmente veremos la ciencia de datos como un elemento fijo en la mayoría de las instituciones educativas. Es importante recordar que los departamentos de informática en su mayoría no existían antes de 1970.

Para mí, la aplicación se ha utilizado antes pero en un plazo diferente y de menor alcance. Ahora con las capacidades de almacenamiento avanzadas, la aplicación creció y fue capaz de proporcionar beneficios a vastas industrias.

Consulte el siguiente enlace para ver ejemplos de aplicaciones de otras industrias en ciencia de datos / big data.

La respuesta de Muhammad Shafiq Safian a ¿Es el big data una moda?

Todavía no, sin duda se convertirá en una burbuja, tal vez en 15-20 años. Por el momento, la gente habla más de eso que de lo que obviamente es viable, dados los problemas comerciales que existen y el potencial intrínseco de la tecnología. Es algo vergonzoso que en el ámbito de las finanzas generalmente estemos detrás, por ejemplo, una empresa dedicada a compartir recetas de pasteles (Pinterest). Pero otras industrias están aún más atrás.

No, no es.

Para tener una idea de lo que estoy hablando, considere los datos generados cada día. Así que consideremos el día típico de una persona normal que pone su despertador en el teléfono para la mañana siguiente, sale a correr y registra su actividad en un dispositivo portátil, compra café usando su tarjeta de fidelidad / crédito, elige el transporte público utilizando una aplicación dedicada y comparte una bonita foto de la mañana en una red social favorita para compartir fotos. El día continúa respondiendo a las llamadas entrantes, SMS, mensajes instantáneos y correos electrónicos, creando así más y más datos.

Esto continuará con IoT aún más, ya que los dispositivos se comunicarán entre sí.

Es por eso que la ciencia de datos no es una moda mientras se sigan generando grandes cantidades (y diferentes tipos) de datos.

Cualquier relación comienza como un acuerdo mutuo.

Ambos iniciaron un hermoso viaje con pura intención y amor.

Recuerde que el matrimonio es un viaje en desarrollo continuo a menudo lleno de desafíos y obstáculos. Los necesitas para crecer y experimentar la vida. Acepta eso. Ninguna vida o relación o humano es perfecto.

Entonces, la pareja que realmente puede enfrentar tiempos de adversidad son los que pueden cometer mucho mejor que otros. Realmente realmente hablo. Cuando las cosas son buenas y malas.

Entonces, saber que la comunicación es clave. Tal vez tome un tiempo para estar solo y escuchar a su esposa.

Y quiero decir realmente escuchar. ¿Está realmente actuando de la manera que sientes que es? ¿Podría ser un problema que aún no se ha dado cuenta que viene de su lado o de algún otro lado?

Ella podría estar dando pistas sutiles sobre por qué los dos se sienten así.

Encuentro el correo electrónico. Los hombres de EASYHACKER15 en Gmail saben exactamente cuáles son sus defectos y los ignoran intencionalmente solo porque piensan que su esposa debería tolerar su basura o por ignorancia extrema. Cualquiera que sea el caso. Conocete a ti mismo.

En algunos casos, también podría ser un sentimiento basado en una sustancia no real. Una fase temporal que pasará como los ciclos de las estaciones.

Entonces, para recapitular.

Te sugiero que discutas tus sentimientos abierta y honestamente. Si es difícil, intente contactar a un profesional por correo electrónico EASYHACKER15 en gmail conn como hacker o escucha de terceros.

Comprenda que nunca debe establecer sus expectativas demasiado altas sobre lo que espera de su matrimonio. En cambio, vea lo que puede ofrecerle a la relación.

Asegúrese de considerar todos los factores y / o consecuencias relevantes al acercarse a su esposa. Siempre es un asunto muy sensible, así que habla con tu esposa con compasión, respeto y todo el amor que puedas mostrar.

Estos son solo consejos y pautas.

Siempre confía en ti mismo y ve con lo que tu corazón te está diciendo, después de todo te casaste con esta hermosa alma por una razón.

Espero que esto pueda dar alguna idea

La “ciencia de datos” no es realmente ciencia. Creo que “Data Mining” es el campo al que te refieres, que existía mucho antes de que apareciera la “ciencia de datos”.

. El análisis depende de muchos otros factores / parámetros. BIG DATA es un volumen abt. La ciencia de datos no es solo un volumen absoluto. Cómo se dispara un rifle en diferentes condiciones, puede almacenarlo en una base de datos de 100 GB, pero para descubrir las lagunas, uno necesita hacer un análisis iterativo y para eso no necesita GRANDES datos.

Big Data, SOA, ESB, Transacciones distribuidas, todas estuvieron presentes desde el comienzo de Comp Science. Después de pasar por todas las tecnologías de big data en profundidad, lógicamente en la implementación en el mundo real, son tan caras como cualquier herramienta / software que existía antes de estos FAD (incluidos los datos estructurados / semiestructurados / no estructurados).

Si se realiza la progresión, es en el caso de la federación de datos, fragmentación, compresión, índices lógicos, cambios / migración de bases de datos en línea, con un tiempo mínimo de base de datos, etc.

Esto es como preguntar si las matemáticas, la estadística, la teoría de la probabilidad y la informática pasarán de moda. La necesidad de lo que proporciona la ciencia de datos continuará prosperando independientemente de cómo lo llamemos. El mundo no dejará de recopilar datos repentinamente, por lo tanto, la ciencia de datos continuará.

si, absolutamente. lo que significa es “procesar grandes cantidades de conjuntos de datos de un solo tipo o de definición limitada”. algo así como comenzaría a usar una aplicación excell modificada para analizar solo datos que sean de tipo entero y de un máximo de 140 caracteres. y luego desarrolle un gran almacenamiento para hacer precisamente (y solo) eso de la manera más eficiente. o piense en las palabras clave de Google (un subconjunto muy limitado de datos posibles). o tweets. ahí tienes 🙂 por supuesto, las personas aplican todo tipo de significado metafísico al término, ya que está asociado con algunas de las tecnologías internas de las compañías de Internet más grandes. Por otra parte, un niño en la India podría creer en esto lo suficiente como para crear realmente algo aplicable para un uso más general, y, por lo tanto, podría ser la próxima gran cosa (que Google compra). quizás algún día un maestro de inteligencia artificial que lo abarque todo combinará procesamiento cuántico, hub, big data, semántica, internet de las cosas e internet de las personas y resolverá todos los problemas del mundo (optimizando cómo piensas y matando nodos, personas que piensan negativamente )

Con toda honestidad, es nada menos que estadísticas glorificadas en exceso mezcladas con algunas investigaciones de CS. El término ciencia implica observación y experimentación con fenómenos naturales. Los “científicos” de datos no exploran el verdadero significado de los datos (eso es epistemología), no desarrollan técnicas para la interpretación de datos (estadísticas), no crean los algoritmos necesarios para su trabajo (eso es CS), simplemente usan un montón de métodos ya establecidos para analizar con “big data”.

Sinceramente, detesto el uso de esta palabra: cada uno de ellos usa “datos” para describir sus datos y los datos que tienen que pasar para llegar a los datos. ¿Ves lo molesto que se pone? Eso está bien, pero ¿qué tipo de información están procesando? Los datos pueden significar literalmente cualquier cosa, desde documentos contables hasta la cantidad de errores en un programa determinado. ¿Qué haces cuando encuentras datos que no entiendes? Si le preguntas a un científico de datos “Oh, ¿estás usando un ANN para con respecto a ? Genial, ¿cuántas capas tiene? ¿Qué tipo de ANN? ¿Utilizaste la propagación hacia atrás? Describe cómo desciende el gradiente funciona “, lo más probable es que se queden quietos y no respondan.

TL; DR El hecho de que algo sea una moda pasajera no lo convierte en ciencia (o necesaria).

Consulte este artículo sobre Big Data empleado en escuelas, Big Data, las escuelas pueden ser inteligentes – Blog PenPencilEraser

More Interesting

¿Cómo es ser un científico de datos en un banco de inversión?

¿Qué carrera es más prometedora: científico de datos, DBA o big data de Hadoop?

¿Cómo debe manejar un científico de datos las implementaciones?

Cómo convertirse en un científico de datos del desarrollador de software

¿Cómo puede un científico de datos ayudar al Partido Demócrata de San Francisco en esta elección?

No soy de un fondo de informática. ¿Es posible para mí hacer una carrera en ciencia de datos?

Como recién graduado, tuve la oportunidad de trabajar en un proyecto de Big Data, mi función actual es la de probador, pero estoy interesado en el desarrollo. ¿Qué tengo que hacer?

¿Cuál es la mejor configuración de Python para un científico de datos?

¿Las preguntas de la entrevista de Google destinadas a evaluar las habilidades de 'resolución de problemas' son realmente efectivas para separar a los candidatos buenos de los malos?

Cómo prepararse para trabajos de ingeniero de datos en Amazon / Google / Facebook / Quora

¿Cómo es pensar como un científico de datos?

¿Qué hay de hacer una maestría en ciencia de datos versus trabajar en una multinacional en India? ¿Cómo varía el salario si quiero volver a la India versus un salario después de 2 años en una multinacional?

¿Por qué el mundo está presenciando una gran brecha entre la oferta y la demanda con respecto a los científicos de datos?

¿Cómo y dónde aprendo el aprendizaje automático? ¿Cómo puedo comenzar como científico de datos?

¿Qué puede aconsejarle a un joven estudiante de estadística para que se convierta en científico de datos y / o ingeniero de aprendizaje automático?