¿Cómo se conectan los campos del científico de datos, el aprendizaje automático y el procesamiento del lenguaje natural?

PNL = construir sistemas que puedan entender el lenguaje ⊊ AI
ML = construir sistemas que pueden aprender de la experiencia ⊊ AI
PNL ⋂ ML = construir sistemas que pueden aprender a entender el lenguaje (Fuente – Jason Eisner)

PNL: etiquetado de pos, clasificación de texto, clasificación / agrupación de documentos, Word2vec, Doc2vec, detección de spam, estos se realizan mediante algoritmos de aprendizaje automático. Data Scientist es solo un perfil de trabajo si está haciendo trabajos relacionados con PNL que su designación podría ser NLP Data Scientist.

Algoritmos de PNL

  • Algoritmos de regresión
  • Algoritmos basados ​​en instancias
  • Algoritmos de regularización
  • Algoritmos de árbol de decisión
  • Algoritmos Bayesianos
  • Algoritmos de agrupamiento
  • Algoritmos de redes neuronales artificiales
  • Algoritmos de aprendizaje profundo
  • Algoritmos de conjunto

¿Dónde puedes usar PNL?

  • Resume bloques de texto
  • Generar automáticamente etiquetas de palabras clave
  • Identificar el tipo de entidad extraída.
  • Reduce las palabras a su raíz

La PNL se preocupa por comprender el lenguaje natural (como lo usan los humanos).

El aprendizaje automático se trata de sentarse en los datos y usarlos para predecir.

La PNL estadística es la parte de la PNL relacionada con el ML. Es una parte importante de la PNL. Además de la estadística PNL, la PNL también trata sobre la extracción de información, que puede resolver ciertos problemas independientemente del aprendizaje automático, pero el alcance es limitado. Se utiliza principalmente para crear datos para el aprendizaje automático.

Data Science es un campo más amplio ML es una parte de Data Science. Se trata de analizar datos, ML es el aspecto donde se analizan los datos para hacer predicciones.