¿Puede la inteligencia artificial escribir un blog? ¿Por qué ha crecido tanto el procesamiento del lenguaje natural? ¿Qué usos tiene?
No se nos ocurre mejor forma de arrancar este artículo que dejar que sea la propia inteligencia artificial la que escriba su introducción. Para ello, démosle unas pocas palabras para definir el tema:
[Escrito por un ser humano ->]: “La entrada del blog en este caso va a tratar del procesamiento del lenguaje natural (PLN) “.
Y asombrémonos con lo que nos devuelven los algoritmos:
[Primeros párrafos propuestos por las tecnologías que vamos a presentar aquí ->]: “El procesamiento del lenguaje natural (PLN) es una rama de la inteligencia artificial que se dedica al estudio de la manera en que los seres humanos procesamos la información que nos llega a través del lenguaje. Se trata de un área de investigación muy compleja, ya que el lenguaje es una herramienta muy potente para comunicarnos y transmitir información.
Los sistemas de procesamiento del lenguaje natural tratan de imitar el modo en que los humanos procesamos la información, es decir, se esfuerzan por analizar el significado de las palabras y construir una representación del mundo que nos permita interpretar el lenguaje de forma natural.
Los avances en este campo de la inteligencia artificial han permitido desarrollar sistemas que son capaces de comprender el lenguaje de forma bastante natural, lo que…”
Todo esto lo ha escrito una inteligencia artificial, concretamente un modelo de lenguaje denominado GPT-3, de OpenAI. Si te ha sorprendido, y estamos seguros de que sí, queremos aprovechar este artículo para contextualizar estas tecnologías y sugerir algunas de sus principales aplicaciones.
Modelos de Lenguaje
Los últimos años han supuesto una verdadera revolución de este campo de la inteligencia artificial, cuyos pilares son la ciencia de datos, la analítica predictiva y la lingüística computacional. Uno de los motivos principales de su despegue es la aplicación de técnicas Deep Learning, en particular de redes neuronales con arquitecturas basadas en Transformers (las utilizadas por GPT-3 o BERT), que son las que han revolucionado los modelos de lenguaje tradicionales.
Estos modelos, que inicialmente no eran mucho más que el análisis probabilístico de la aparición sucesiva de diferentes palabras en un idioma, se han convertido en impresionantes redes neuronales que abarcan más de 175.000 millones de parámetros (en el caso de GPT-3) y que han demostrado capacidades sorprendentes de entender y emular el lenguaje humano. Para que esta clase de modelos tenga un rendimiento tan alto, por norma general se entrenan con cantidades ingentes de documentos (denominados corpus) de forma que son capaces de predecir las palabras que podrían extender un texto, e incluso realizar tareas lingüísticas o abordar temas que no están contenidos en ese conjunto de textos con el que han sido entrenados.
No vamos a profundizar en la tecnología que hay detrás, que quedaría fuera del alcance de un blog como este, pero sí apuntar que, cuando uno se inicia en este híbrido de lenguaje y matemáticas hay aproximaciones que, incluso desde una perspectiva no técnica, resultan verdaderamente fascinantes. A modo de ejemplo:
- Los word embeddings, las palabras de un vocabulario transformadas en vectores, suelen ser una de las primeras etapas de la red neuronal que está detrás de cualquier modelo de lenguaje moderno.
Estos embeddings se construyen a partir de un principio muy básico: que el significado de una palabra está directamente relacionado con las palabras que aparecen a su alrededor en los textos. Así construidos, uno descubre cómo operaciones sencillas con esos vectores-palabra, generados sin ningún conocimiento del idioma, dan resultados semánticamente razonables (ej. el clásico “rey + mujer = reina”).
- Los modelos de atención, verdadera esencia de la arquitectura transformer, son los componentes que hacen posible que la red neuronal aprenda un hecho esencial del lenguaje: que en los textos las palabras se referencian unas a otras a distancias que pueden ser muy variables (ej. en “la casa” hay una concordancia de género en palabras adyacentes, pero en “Juan fue a su casa” “Juan” y “su” tienen una relación evidente sin estar situadas una al lado de la otra).
A los lectores más apasionados por el tema queremos recomendarles el imprescindible Speech and Language Processing, de Dan Jurafsky y James H. Martin, disponible en stanford.edu
Más allá de los modelos, arquitecturas o algoritmos que se encuentran detrás del procesamiento del lenguaje natural, es especialmente interesante analizar la gran cantidad de retos que estas técnicas permiten atender desde un punto de vista empresarial o de negocio.
Aplicaciones de Negocio
ANÁLISIS DE SENTIMIENTOS – MONITORIZACIÓN DE REDES SOCIALES
A través de diversas técnicas o modelos pre-entrenados se puede llevar a cabo el análisis de textos en redes sociales, reseñas u otra clase de comentarios creados por usuarios en sitios web, y extraer información valiosa. Por ejemplo, si dichos comentarios son positivos o negativos, o si son subjetivos u objetivos.
Esto permite detectar noticias o comentarios negativos para poder atenderlos, mitigarlos o ponerles remedio en un servicio de atención al cliente. Del mismo modo, el análisis de esas evaluaciones nos llevaría a obtener conclusiones sobre la opinión de los clientes sobre el servicio o producto, de forma que posteriormente se puedan tomar mejores decisiones en base a las preferencias o expectativas de los clientes.
Otro caso de negocio interesante es la valoración de proveedores. Las empresas podrán automatizar la recogida y evaluación de gran cantidad de información relevante sobre posibles proveedores antes de comenzar a trabajar con ellos.
CHATBOTS
Los avances en PLN logran que la atención al cliente a través de bots sea más precisa y satisfactoria. Mediante GPT-3 podemos desplegar bots que presentan una inteligencia realmente profunda, pues no responden con frases almacenadas a modo de árbol de decisión, sino que generan texto de apariencia casi humana en la interacción con el usuario.
RESUMEN DE TEXTOS
Con la finalidad de reducir el tiempo de síntesis, a través de estas técnicas se pueden lograr resúmenes de textos muy largos en los que se identifican y exponen de manera concisa los temas y las ideas principales de dicho texto.
Actualmente se presenta en dos modos: extractivo y abstractivo. El tipo de resumen extractivo se centra en señalar las frases o párrafos más relevantes del texto, mientras que el resumen abstractivo genera nuevo texto partiendo de los conceptos de mayor importancia.
CLASIFICACIÓN DE TEXTOS
Haciendo uso del procesamiento del lenguaje natural, y mediante técnicas de aprendizaje supervisado, se pueden categorizar textos o transcripciones de audio para etiquetar de manera global, o por secciones, los temas a los que hace referencia, logrando una segmentación precisa de categorías en cada una de las porciones de un texto no estructurado.
ANÁLISIS DE MERCADO – INTELIGENCIA DE MERCADO
La aplicación de PLN combinado con técnicas de web scrapping permite rastrear la evolución del mercado y de los competidores, descubriendo tendencias, demandas no satisfechas y posibles movimientos de la competencia.
Por otra parte, las campañas de imagen para construir, reforzar y mejorar la valoración pública de una marca, producto o servicio pueden ser diseñadas y afinadas con más eficacia si evaluamos simultáneamente, mediante PLN, el impacto de dichas acciones en los textos que genera el público objetivo de esas campañas.
ANÁLISIS DE ENCUESTAS – ANALISIS DE FEEDBACK
Cada vez es más frecuente la posibilidad de dar feedback de un producto o servicio tras su uso o consumo. Ante el enorme volumen de datos, solo el análisis automatizado mediante técnicas de procesamiento del lenguaje natural hará posible la extracción de conclusiones valiosas para mejorar las decisiones posteriores relativas a esos productos o servicios.
Además de estos casos y aplicaciones, PLN ha mejorado múltiples soluciones relacionadas directamente con el lenguaje, como la traducción de textos, el reconocimiento de texto escrito a mano, la corrección gramatical y ortográfica, o la predicción de textos o palabras.
Sin duda, el procesamiento del lenguaje natural será un campo muy relevante de la inteligencia artificial en los próximos años. De hecho, si hacemos una búsqueda en “dimensions.ai”, base de datos de publicaciones científicas, podemos observar el aumento de la cantidad de artículos que contienen las siglas “NLP”:
En resumen, todo apunta a que en el futuro el contenido de las interacciones lingüísticas (texto, voz, etc.) será una fuente de información valiosa para los negocios; y será cada vez más habitual la interacción con inteligencias artificiales del mismo modo que hoy empezamos a interactuar con asistentes virtuales en nuestro día a día.
Quién sabe, ¿llegará el día en el que este blog lo escriba en su totalidad una inteligencia artificial? Más aún, ¿estás seguro de que este texto que acabas de leer no lo ha escrito una máquina?