¿Cuáles son algunas preguntas de la entrevista de ciencia de datos? ¿Incluyen preguntas de algoritmos canónicos tales como búsqueda, gráficos, estructuras de datos, etc.?

Las entrevistas con científicos de datos en diferentes compañías variarán entre el análisis de datos y la programación más pesada. Es importante leer cuidadosamente el papel, ya que el título de “científico de datos” realmente puede significar varios trabajos diferentes. Explicaré a continuación las diferencias en las entrevistas entre científicos de datos que realmente son ingenieros de aprendizaje automático, ingenieros de datos o analistas de datos. Tenga en cuenta que la posición también puede ser una mezcla de más de uno de estos.

Científico de datos como analista de datos

El trabajo de un analista de datos es analizar los datos y presentarlos de manera efectiva. Analizará los resultados de las pruebas A / B y, a menudo, hará recomendaciones basadas en datos. Para estos roles, un título en ciencias de la computación a menudo es innecesario, y muchas de las habilidades requeridas podrían adquirirse en el trabajo. En muchos casos, cierta experiencia en SQL o R sería suficiente para pasar una entrevista.

Las habilidades en análisis y presentación de datos son realmente importantes aquí. Los entrevistadores a menudo le pedirán que les explique un proyecto o idea de ciencia de datos o ingeniería en términos que un científico o ingeniero que no sea de datos pueda entender. A menudo le presentarán los resultados de una prueba A / B y le pedirán que analice lo que sucedió. O podrían preguntarle cómo determinaría si la característica X mejora la métrica Y, a lo que podría considerar una prueba A / B, entre otras cosas.

Realmente no se le harán preguntas difíciles de codificación para los tipos de roles de analista de datos. Si se requiere codificación en un lenguaje de scripting o SQL en el trabajo, es posible que se le hagan preguntas básicas de codificación a nivel de un curso de programación de introducción o estructuras de datos, y probablemente también algunas preguntas SQL.

Científico de datos como ingeniero de aprendizaje automático

En algunos casos, un científico de datos está trabajando en sistemas de recomendación, alimentación / clasificación, búsqueda y productos que utilizan el aprendizaje automático. Tener una sólida base de programación es realmente importante aquí porque estarás programando durante la mayor parte de tu día. La programación que se prueba generalmente está relacionada con estructuras de datos y algoritmos, y a menudo también con alguna idea de probabilidad o estadística. Por lo general, no se lo probará en áreas como sistemas operativos, redes o desarrollo de aplicaciones, porque esos problemas probablemente serían menos importantes para usted que para un ingeniero de software tradicional, pero a menudo se espera que tenga una sólida comprensión de los algoritmos y diferentes enfoques, como la programación dinámica. También querrá poder explicar diferentes modelos de aprendizaje automático y saber cuándo usar diferentes, cuáles son los beneficios y los inconvenientes, etc.

ML Engineer es el caso más probable en el que se requiere un doctorado, por lo que si su entrevistador se preocupa por su investigación en uno de estos escenarios, es para este puesto.

Científico de datos como ingeniero de datos

En las startups con pequeños equipos de datos, el científico de datos probablemente trabajará en la construcción de la infraestructura de datos. Sin una infraestructura sólida todavía en su lugar, no tendría el tiempo o la potencia informática para implementar modelos complicados de aprendizaje automático. En este caso, la experiencia en ingeniería es realmente lo más importante, y las entrevistas tienden a reflejar eso al hacer preguntas de codificación como en una entrevista de ingeniería de software. La probabilidad y las estadísticas se enfatizan menos en las entrevistas allí porque será menos importante para diseñar la infraestructura, pero un pequeño porcentaje de sus preguntas podría referirse a eso o al aprendizaje automático de su afirmación de tener experiencia en él.

Las nuevas empresas a menudo serán más hacky y menos centradas en la investigación que en las compañías más grandes que están listas para contratar personas para roles como el Ingeniero ML o un científico de datos / investigación. Me han informado que en estas entrevistas es mejor no centrarse en su investigación. Cuando construye infraestructura, no tiene tiempo para elegir el mejor modelo de aprendizaje automático o la mejor selección de características. Su entrevistador quiere saber que puede moverse rápidamente y puede trabajar en muchos proyectos a menudo al mismo tiempo, desde la infraestructura hasta el análisis y el científico: usted, y tal vez un par de personas, son la persona clave para todas las necesidades relacionadas con los datos.

Desafortunadamente, la ciencia de datos es tan nueva y tan pocas personas realmente la entienden que tienes que estar preparado para cada pregunta bajo el sol. Desearía estar bromeando, pero no lo estoy. Recibirá preguntas al codificar un trabajo de MapReduce, a explicar la diferencia entre las diversas bases de datos NoSQL, a explicar qué es una máquina de vectores de soporte, a “cómo explicaría cómo funciona una red neuronal a su abuela”, a un simulacro discusión grupal en mesa redonda sobre un problema que se espera que lidere.

Una vez un entrevistador me hizo una pregunta realmente difícil. Me senté allí tratando desesperadamente de encontrar algo inteligente (descarté algunas ideas que derribaron) antes de que finalmente uno de ellos dijera “No te preocupes si no puedes resolverlo. Lo hemos estado intentando durante meses y no he llegado a ninguna parte. Esperábamos que nos dieras algunas ideas nuevas para probar “.

A menudo, se le preguntará sobre problemas específicos en los que ha trabajado, cuáles fueron los desafíos y qué resultados generó. Estos están diseñados para demostrar con qué problemas ha tenido experiencia, cuál fue su proceso de pensamiento, cómo lidió con la adversidad, qué tan bien se comunica y un intento de eliminar a aquellos que simplemente tomaron algunos MOOC y ahora se han bautizado a sí mismos. científicos de datos.

Para la segunda parte de su pregunta, dudo que vea demasiadas preguntas sobre algoritmos de informática pura como ese. Definitivamente debe saber cómo funcionan los algoritmos de ciencia de datos (por ejemplo, regresión logística, redes neuronales, CART). Definitivamente van a querer escuchar sobre su experiencia de investigación / proyecto, por lo que si ha pasado un tiempo, debe desenterrar sus informes y actualizar su memoria.

Al final, solo tienes que ser honesto sobre lo que sabes y lo que no sabes y dejar que las fichas caigan donde puedan. Una compañía me rechazó porque estaban preocupados de que mi conocimiento de SQL no estuviera cerca de los otros tipos de bases de datos y no me aceptarían como un igual (BTW, en ninguna parte de la descripción del trabajo se mencionó SQL). La gente me ha hecho preguntas sobre ingeniería de datos (por ejemplo, ¿cómo mantendría un clúster Hadoop?). La lista sigue y sigue y no hay forma de que pueda prepararse para todo.

Mi consejo es concentrarse en lo que ha hecho en el pasado, las áreas específicas en las que le gustaría trabajar en su nuevo trabajo, y ser honesto cuando se enfrente a preguntas que están fuera de su experiencia y / o irrelevantes para su carrera aspiraciones

Buena suerte. Hasta que haya una mejor comprensión de lo que realmente es la ciencia de datos, debe esperar lo inesperado.

Valor p
¿Cuál es el valor P y es diferente del error tipo I.
Search Engine Metrics
¿Cuáles son las métricas para evaluar un sitio web de motor de búsqueda?
Colisiones de hormigas
Tres hormigas están sentadas en las tres esquinas de un triángulo equilátero. Cada hormiga comienza al azar, elige una dirección y comienza a moverse a lo largo del borde del triángulo. La probabilidad de que ninguna de las hormigas choque = [? /? ] Seguimiento: las hormigas k se sientan en las esquinas k de un polígono equilátero. Cada hormiga comienza al azar, elige una dirección y comienza a moverse a lo largo del borde del triángulo. La probabilidad de que ninguna de las hormigas choque = [? /? ]
Agregación de ventana deslizante de SQL
Dada una tabla con dateid, adid, impresiones, particionada por dateid, necesitamos calcular la impresión total para un adid en los últimos 28 días. El desafío aquí es que cada partición tiene cerca de 4 mil millones de filas y queremos evitar escanear 28 particiones todos los días. ¿Cómo lo optimizará para que no tenga que escanear 28 particiones todos los días?
Informe de ventas SQL
Dada la siguiente tabla: CREAR TABLA SI NO EXISTE entrevistas_ventas COMO pila SELECT (17, ‘US’, ’01 / 01/2014 ‘, 5,’ US ‘, ’01 / 02/2014’, 8, ‘US’, ‘ 01/02/2014 ‘, 5,’ US ‘, ’01 / 03/2014’, 10, ‘CA’, ’01 / 01/2014 ‘, 3,’ CA ‘, ’01 / 02/2014’, 2 , ‘CA’, ’01 / 02/2014 ‘, 2,’ FR ‘, ’01 / 01/2014’, 6, ‘FR’, ’01 / 02/2014 ‘, 6,’ FR ‘, ’01 / 05/2014 ‘, 4,’ FR ‘, ’01 / 05/2014’, 7, ‘GB’, ’01 / 01/2014 ‘, 2,’ GB ‘, ’01 / 02/2014’, 4, ‘ GB ‘, ’01 / 08/2014’, 10, ‘JP’, ’01 / 06/2014 ‘, 8,’ JP ‘, ’01 / 06/2014’, 1, ‘JP’, ’01 / 07 / 2014 ‘, 8) AS (país, fecha, ventas_amt) DESDE dim_one_row: crecimiento; Devuelve todo el país, la fecha y la sales_amt donde sales_amt> = 8 Devuelve el total de sales_amt por país Devuelve el total de sales_amt por país y día donde el total sales_amt> = 10
Coleccionista de cupones
Hay 100 bolas con la marca # 1 – # 100 en cada una de ellas. Elija aleatoriamente una bola y la marcó con una estrella. (sin saber el # en él.) Repita este proceso 100 veces. Si el objeto elegido ya tiene una estrella, vuelva a colocarlo. Y comienza el siguiente proceso. Después de repetir este proceso 100 veces, obtén la pelota con el # 1, ¿cuál es la probabilidad de que no haya sido marcada con una estrella? ¿Cuál es la cantidad de veces que necesita repetir este proceso si desea marcar todas las bolas?
Ceros al final
Cuente cuántos 0 finales (¡100!)
Estimación diaria del número de papas fritas vendidas en McDonalds
Estime la cantidad diaria de papas fritas vendidas en McDonalds
Regresión logística básica
Escriba la fórmula para la regresión logística. ¿Cómo determinar los coeficientes dados los datos?
Regresión lineal básica
¿Cómo diagnostica cómo su modelo de regresión lineal se ajusta a los datos?

Mindmajix proporciona las principales preguntas de la entrevista de ciencia de datos.

PREGUNTAS DE ENTREVISTA DE CIENCIA DE DATOS

P. ¿Qué es la ciencia de datos?

Data Science es una nueva área de especialización desarrollada por el Departamento de Matemáticas y Estadística de la Bowling Green State University. Este campo integra matemáticas, estadísticas y ciencias de la computación para prepararse para la creciente necesidad de científicos de datos. Los estudiantes que desean realizar estudios en Ciencias de datos deben declarar una especialización en matemáticas como estudiantes de primer año, en previsión de completar la especialización en los años tres y cuatro.


P. ¿Cuáles son los requisitos de un programa de ciencia de datos?

La especialización de Data Science requiere tres semestres de cálculo (MATH 1310, MATH 2320 y MATH 2330 o MATH 2350), álgebra lineal (MATH 3320), introducción a la programación (CS 2010), probabilidad y estadística I (MATH 4410) y regresión análisis (STAT 4020).


P. ¿Qué hace un científico de datos?

Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadística, análisis y matemáticas.

Para más información, haga clic en el enlace de abajo.

http://mindmajix.com/data-scienc

Parte 1: ¿Cuáles son algunas preguntas de la entrevista de ciencia de datos?

Estoy trabajando en un proyecto en el que hemos recopilado más de 150 preguntas de entrevistas de ciencia de datos. Compruébalo: Preguntas de la entrevista [MockInterview.co]

Parte 2: ¿Incluyen preguntas de algoritmos (gráficos, estructuras de datos, etc.)?

Las entrevistas de ciencia de datos pueden incluir preguntas sobre algoritmos. Depende de

1) Empresa que solicita

2) el tipo de científico de datos que está contratando (ingeniería, ML o análisis centrado)

3) La persona que lo entrevista (ingeniero de software, científico de datos, gerente, etc.)

si prefiere que se centren más en su experiencia matemática y de investigación y le pregunten sobre algoritmos de SE, pregúnteles por qué se centran en algoritmos (gráficos, estructura de datos, etc.). En mi puesto actual, durante el proceso de la entrevista, me hicieron preguntas que pensé que no tenían “sentido”. Traté de responderlas lo mejor que pude y cuando fue mi turno de preguntas: traté de resolver el contexto de estas preguntas. Llegué a saber que el entrevistador solo estaba reemplazando a otra persona (que podría estar ocupada / fuera) y no tenía contexto para el rol / equipo que estaba solicitando. No creo que haya hecho un gran trabajo en esa parte de la entrevista, pero aún así obtuve el trabajo. Por lo tanto, es su deber buscar los roles que aprovechan las habilidades que tiene y pasar roles que se centran en; y puede transmitir roles que no se centran en cosas en las que desea centrarse.

Como señala el autor anterior, realmente depende de las responsabilidades que se esperan del rol para el que está entrevistando. En mis años como científico de datos en Ask.com, trabajamos (naturalmente) con lenguaje natural casi exclusivamente.

Nuestras responsabilidades abarcaron desde clasificar la intención de las consultas de los usuarios entre una variedad de taxonomías disjuntas, hasta mejorar la clasificación de nuestros resultados de búsqueda para presentar los resultados más relevantes en los principales ordinales. También trabajamos en el problema ocasional de aprendizaje no supervisado para obtener información sobre nuestra montaña de datos archivados y producir las visualizaciones necesarias para transmitir eficazmente nuestros hallazgos a la gerencia.

Ejecuté ese rol en particular durante unos años y me beneficié de un profundo conocimiento del agrupamiento de K-Means, del modelado de temas usando LDA y LSI, de la clasificación usando Naive-Bayes y Regresión logística, y de sistemas híbridos de recomendación que aprovechan tanto el filtrado colaborativo como el filtrado basado en contenido.

Hay varias habilidades comúnmente requeridas en una multitud de roles de ciencia de datos. Todo esto tiene que ver con el diseño experimental y son los precursores dependientes de su conocimiento específico de dominio. Incluyen ingeniería de características, selección de características, descorrelacionar su matriz de diseño, selección de modelos, evaluación de modelos y selección de la función de adecuación más adecuada para las necesidades del negocio.

El tipo de pregunta que encontrará dependerá de la compañía y el oficial de la entrevista.
1, Habilidades de diseño de algoritmos.
Encuentra los números más grandes del top-k entre N elementos.
2, los detalles de los algoritmos de aprendizaje automático
¿Por qué el lazo puede usarse como selección de características?
¿Cómo determinar el valor de K cuando se usa K-means?
3, experiencia del proyecto
¿Algún proyecto? ¿Alguna vez anticipaste algunos concursos?
4, habilidades de codificación

More Interesting

¿Cuánto cuestan las preguntas formuladas en la entrevista relacionadas con el perfil del trabajo? ¿Preguntas sobre estructuras algorítmicas y de datos especialmente?

¿Cuáles son las preguntas de la entrevista formuladas en el software Hypermesh?

¿Qué preguntas se hacen durante la entrevista telefónica de Amazon para un puesto en Hyderabad?

Cómo resolver de forma recursiva el problema de 'subir escaleras' en Leetcode

¿Cuáles son las preguntas formuladas en las entrevistas relacionadas con la creación de redes?

¿Qué debo esperar en una entrevista de ingeniero de software en Google y cómo debo prepararme?

¿Cómo se manejaría mejor una pregunta de entrevista de programación como: cómo puede transferir un archivo extremadamente grande a través de una red y cómo puede optimizar el proceso?

¿Se hacen con frecuencia preguntas sobre patrones de diseño durante las entrevistas de codificación en grandes empresas tecnológicas como Google y Amazon?

¿Las entrevistas técnicas para puestos de ingeniería de software a tiempo completo son más difíciles para los estudiantes de posgrado que para los estudiantes de pregrado?

¿Qué tipo de preguntas se hacen en la entrevista para la admisión a AFMC Pune?

¿Cómo puedo hacer una entrevista técnica en una empresa de ciencia de datos / análisis de datos dentro de un fin de semana?

¿Cuáles son las razones por las que solo 1 de 7 candidatos recibe una oferta después de una entrevista en el sitio de Google?

¿Cuál es la forma más fácil de aprender C ++ y estructuras de datos?

¿Vale la pena tomarse un pequeño descanso en la carrera para prepararse bien para entrevistas para trabajos aún mejores?

Cómo prepararse para las preguntas de la entrevista técnica de TCS si soy ingeniero eléctrico