Empezando con NLP en AWS desde cero — NLP Series parte 1 | por Carlos Cortez | Breaking the Cloud

Escucha en modo AudioBlog este artículo

La curva de Aprendizaje

La curva de aprendizaje es larga y puede volverse compleja si quisiéramos. Para eso existen los flujos y los frameworks que nos van a ayudar a saber en qué parte estamos ahora mismo.

¿Recuerdan CRISP-DM?

Es un framework para realizar minería de datos, lo que ahora se conoce más como Machine Learning, Deep Learning, Data Science, etc..

Lo indispensable para empezar en AWS

Siempre a cada lugar que vayamos, guardemos en el bolsillo esta dupla:

Modelos pre-entrenados

Los modelos pre entrenados nos ayudan a acortar tiempo de investigación, de entrenamiento y de análisis, y no empezar a inventar lo que ya existe. y para ello podemos usar servicios en la nube.

Construir tus propios modelos:

Una vez entendamos muy bien los servicios autoadministrados en la nube de NLP, podemos pasar al siguiente nivel ya se con Amazon Sagemaker.

Librerías NLP Open Source

Mencionaré estos por ahora y seguro conoceremos más de 2 de esta lista durante los próximos meses:

  • Spark NLP
  • CoreNLP
  • SpaCy
  • Pytorch
  • Tensorflow
  • etc..

Tools e IDEs

Desde ahora empezaremos a conocer y aprender paso a paso, cómo es trabajar en la nube con una IDE para Ciencia de Datos, y conocer los servicios de AI en AWS.

  1. Jupyter Notebooks / Jupyter Lab
  2. Databricks
  3. Colab de Google
  4. entre otros…

Despliegue de mis modelos en la nube

Aún no es momento de pensar en desplegar, y sí, encontraremos muchísimas maneras de hacerlo, desde la más antigua, a la más moderna.

  • Contenedores (como AWS ECS, EKS, Fargate)
  • Sin Servers (Funciones como Servicio)

Think Serverless First

Ahora podemos empezar a trabajar sin tener que correr servidores usando AWS Lambda, AWS Step Functions, Sagemaker Pipelines, AWS CodePipeline, que son servicios ya desplegados en la nube que podemos utilizar para agilizar nuestro desarrollo y puesta en marcha.

Amazon Comprehend y sus superpoderes

Imaginas algo tan sencillo como escribir algunas líneas de código para crear un detector de palabras y extracción de frases en tan solo unos minutos en vez de muchas horas de investigación? Es posible si empiezas a sacarle provecho a Amazon Comprehend, un poco de Python y un par de gotitas de Serverless

response = client.detect_key_phrases(Text=’string’,LanguageCode=’en’|’es’)

¿Con qué continuamos?

La ingesta de datos y el text Analytics, es parte de las bases importantes para comprender NLP, así que en el siguiente post, empezaremos a construir nuestra primera ingesta de datos de una web, para poder obtener datos, textos, títulos, en un data frame para jugar.

Rompiendo se aprende

Suscríbete a mi canal, Breaking the Cloud y Al día con AWS en https://cortez.cloud

🔥🔥 Sígueme en mis redes 🔥🔥

follow <- me()

🔥🔥 Acerca de mí 🔥🔥

Cortez.Cloud/whoami

AWS UG Leader Perú / AWS ML Community Builder / Senior Cloud Architect

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store