¿Qué hacen los científicos de datos en Microsoft?

Eso realmente varía. Microsoft es una compañía tan grande, y la ciencia de datos es un campo tan grande.

Según su página de empleo profesional, esto es GENERALMENTE lo que esperan de todas sus posibles contrataciones de científicos de datos:

“Estamos buscando científicos aplicados a los que les apasione aplicar técnicas de aprendizaje automático y minería de datos a una variedad de aplicaciones interesantes para empresas y consumidores. Aplicará una gama de técnicas de aprendizaje automático que incluyen modelado predictivo, minería de texto e imágenes, recomendaciones, agrupamiento , detección de anomalías, métodos de pronóstico, aprendizaje profundo y otras técnicas estadísticas avanzadas. Trabajará en todos los aspectos del diseño, desarrollo y entrega de soluciones habilitadas para el aprendizaje automático, incluida la definición de problemas, adquisición de datos, exploración y visualización de datos, ingeniería de características, experimentación con Algoritmos de ML, evaluando y comparando métricas, implementando los modelos, mejorando iterativamente la solución, construyendo las herramientas para este proceso, etc. Trabajará con datos de diversas fuentes de datos estructurados y no estructurados, tanto en modo de lote como de transmisión, y en varios formatos, incluyendo tabular, imagen / video, audio, texto y series de tiempo. , interactuará con un equipo de expertos en aprendizaje automático, sistemas distribuidos, gestión de programas y equipos de productos asociados, en la visión, planificación de escenarios / características, ejecución y entrega de soluciones escalables como un servicio en la nube.

Calificaciones
• Doctorado en Ciencias de la Computación, Ingeniería Eléctrica, Estadística, Física, Matemáticas, Investigación de Operaciones o campo técnico equivalente, o maestría con más de 3 años de experiencia en la industria para Científicos, 4+ años después de Ph.D o 7+ años después MS para Senior Scientist, 7+ años post Ph.D o 10+ years post MS para Principal Scientist.
• Conocimiento de las técnicas de aprendizaje automático y minería de datos en una o más áreas de métodos de modelado estadístico, series de tiempo, minería de texto, optimización, recuperación de información.
• Capacidad para realizar prototipos de análisis estadísticos y algoritmos de modelado y aplicar estos algoritmos para soluciones basadas en datos a problemas en nuevos dominios.
• El conocimiento y la experiencia trabajando con sistemas informáticos distribuidos es una ventaja
• Habilidades de desarrollo de software en uno o más lenguajes de alto nivel (C # / C / C ++ / Java / F #), uno o más lenguajes de scripting (Python / Perl / Shell) y herramientas comunes de ML (Weka, R, RapidMiner, KNIME, scikit , SAS, SPSS, ModelBuilder, etc.)
. Capacidad para desarrollar soluciones de aprendizaje automático de grado de producción de extremo a extremo “.

Diría que se espera una variedad de tareas típicas de los científicos de datos .

Estas tareas son, por supuesto, relevantes para la línea de negocios de Microsoft .

Algunas de las cosas en las que puedo pensar:

  • Mejorando Cortana [1] (asistente personal)
  • Trabajar para mejorar la búsqueda y la recomendación ( Bing [2]) (búsqueda)
  • Agregar capacidades de aprendizaje automático a Holo Lens [3] (realidad aumentada)
  • Mejore y diseñe los servicios de aprendizaje automático Azure [4] (nube)
  • Analiza diferentes métricas clave de negocio

Por supuesto, hay docenas de otras cosas que me he perdido e incluso cosas que son de alto secreto.

Si quieres tener una mejor idea, dirígete a estos sitios web:

  • Iniciativa de ciencia de datos – Microsoft Research
  • Aprendizaje automático | Microsoft Azure
  • Galería Cortana Intelligence
  • Aprendizaje automático

Como de costumbre, asegúrese de seguirme para obtener nuevas respuestas: http://quora.com/profile/Yassine

Notas al pie

[1] Cortana (software)

[2] Découvrez BING, une nouvelle manière de chercher

[3] Microsoft HoloLens

[4] Microsoft Azure: plataforma y servicios de computación en la nube

More Interesting

Análisis de datos, ciencia de datos, análisis web, análisis de negocios: ¿Cuáles son los salarios típicos de los "científicos de datos" para las nuevas empresas en el Área de la Bahía?

¿Cuáles son las principales cosas en las que debemos centrarnos más antes de comenzar como científicos de datos más recientes?

Si no tengo mucho tiempo y soy bueno en Python, ¿cómo puedo convertirme en un científico de datos rápidamente? ¿Qué libros son los mejores para mí?

¿Por qué los hospitales no invierten masivamente en científicos de datos, ya que están sentados en una pila de datos?

¿Qué debo hacer para mejorar mis habilidades y conseguir un trabajo como científico de datos?

¿Puedo ser el mejor científico de datos sin matemáticas?

¿Cuáles son las mejores reuniones de ciencia de datos / big data en el área de la Bahía de San Francisco?

¿Qué habilidades de programación se requieren para un científico de datos?

Como científico de datos, ¿te acaban de dar los datos? En caso afirmativo, ¿en qué formato se suele dar? Si no se le proporcionan los datos, ¿cómo los recupera? ¿Cuáles son sus primeros pasos cuando se adquieren los datos?

¿Cuáles son las habilidades necesarias para realizar una pasantía como científico de datos?

¿Por qué SAS es insuficiente para convertirme en científico de datos? ¿Por qué necesito aprender Python o R?

¿Vale la pena cambiar de desarrollador de software a científico de datos?

¿Cuál es la mejor manera de convertirse en un científico de datos para alguien con experiencia en comercio y 3.5 años de experiencia corporativa?

¿Quiénes son las personas que trabajan en el campo de la ciencia de datos / big data en India? ¿En qué habilidades y tecnologías trabajan y cómo las aprendieron?

¿Hay empresas que ofrezcan trabajos de formación remunerados en ciencia de datos?