¿Cuántos algoritmos de aprendizaje automático, y a qué profundidad, debo saber para entrevistar con confianza para un puesto de científico de datos de nivel de entrada?

Creo firmemente que la mayoría de los roles de ciencia de datos requieren un doctorado.

Debe comprender todas las posibles permutaciones y matices de la SVD y sus implicaciones para el operador de proyección tanto en el espacio de fila / columna como en la geometría de subespacios / subespacios ortogonales.

Debería poder escribir el hessian / gradiente de la regresión logística y comprender lo que sucede bajo una separabilidad débil / fuerte.

Debería poder anotar las condiciones KKT de cualquier programa convexo L1 e inmediatamente señalar qué causa el umbral (también para SVM … por qué se eliminan algunos puntos de datos).

debe tener la visión matemática para desarrollar un algoritmo que se adapte a sus necesidades o saber cuándo será suficiente un método estándar.

No hay almuerzo gratis y los mejores científicos de datos (incluso nuevos graduados de nivel de entrada) pueden responder todo lo anterior y más.

Desde mi experiencia de ser entrevistado para funciones de minería de datos / ciencia de datos / aprendizaje automático, realmente no necesita un doctorado si ha realizado proyectos interesantes. Por supuesto, algunos roles específicos pueden pedirlo, pero no todos.

Además, creo que no sería inteligente que alguien lo evaluara con base en el conocimiento aleatorio de ML, sino quizás en los conceptos básicos (kNN, árboles de decisión, regresión logística, SVM, perceptrón, …) y, en un nivel más profundo, en el algoritmos que ya has estudiado y con los que has trabajado. Si ha trabajado con varios modelos y pudo comprenderlos e implementarlos profundamente, es probable que pueda hacerlo con otros modelos. Mis entrevistas han variado desde pedir implementar árboles de decisión / knn hasta explicar mis proyectos y las decisiones que tomé. Normalmente se centran en un problema que la empresa está tratando de resolver (o incluso que ya tienen una solución) y se preguntan cómo abordaría el problema, las compensaciones de las ideas que doy y cómo recopilar los datos.

More Interesting

Quiero convertirme en científico de datos. Un amplio campo extendido. Tengo conocimiento sobre ML. ¿Cuáles son otros temas / materias requeridos que debo aprender?

¿Ser científico de datos ayudaría a uno a prepararse para convertirse en ingeniero de aprendizaje automático?

¿Qué característica es más importante para un científico de datos: habilidades de codificación o habilidades de comunicación?

Soy un graduado en ciencias de la computación. ¿Puedo convertirme en un científico de datos?

Un estudiante de IIT que tiene un IPC bajo de 5, pero tengo interés en Data Science. ¿Cómo podría prepararme para conseguir un buen trabajo en el campo de la ciencia de datos?

¿Es un doctorado no matemático / CS inútil para la ciencia de datos?

Como científico de datos, ¿cómo aprendo a 'escribir código de producción'?

¿Pueden algunos científicos de datos aquí encontrarnos con el trabajo real y los pros y contras involucrados en los trabajos de proyectos de Big Data y guiarnos con qué cursos, paquetes de pago, etc., elegir?

¿Con qué propósito un científico de datos pone scripts de shell en el trabajo?

¿Es preferible o bueno tener certificaciones en análisis predictivo y aprendizaje automático para que un científico de datos permanezca en la competencia?

¿Qué hacen los expertos en productos en Palantir? ¿Son similares a los gerentes de producto de otras compañías?

¿Cómo es ser un científico de datos independiente / independiente?

¿Cuál es mejor nube o big data?

¿Las empresas de Silicon Valley contratan a especialistas en ciencia de datos o expertos específicos para el procesamiento del lenguaje natural, la conducción automatizada, etc.?

¿Qué flujo crees que será el mejor para convertirte en un científico de datos?