«Se intentará descubrir cómo hacer que las máquinas utilicen el lenguaje, formen abstracciones y conceptos, resuelvan tipologías de problemas actualmente reservados para los humanos y se mejoren a sí mismas». Estos eran los objetivos del primer proyecto que, en 1956, ponía nombre a una nueva área de la investigación: la inteligencia artificial (IA). Después de más de seis décadas, este sintagma se ha popularizado hasta tal punto que la FundéuRAE lo escogió como palabra del año en 2022. Es precisamente el primero de estos objetivos, el hacer que las máquinas utilicen el lenguaje, el que ha conseguido que la IA se visibilice en nuestra vida cotidiana.
Los modelos lingüísticos de gran tamaño (LLM, del inglés, large language model) han habilitado tareas de procesamiento de lenguaje natural (PLN) que hace apenas cinco años eran inabordables. Generar un resumen, realizar un ensayo breve, redactar tuits, parafrasear un texto para que lo entienda un niño o crear un relato, son ejemplos de tareas que cualquiera de nosotros puede realizar sin más que darle la instrucción oportuna a uno de estos LLM, como ChatGPT. Esta capacidad de tratar el lenguaje se extiende a otros formatos como crear imágenes o vídeos a partir de una descripción textual, poder realizar preguntas sobre una imagen o reproducir audios emulando la voz de una persona. Conocido como IA generativa.
El acceso a la información también se ha simplificado hasta tal punto que una pregunta en lenguaje natural (“¿Qué tengo que hacer cuando hay un descuadre en la caja?”) recibe una respuesta concisa (“Revise una vez más el balance y, en caso de seguir descuadrada, notifique a su responsable”) que sintetiza información extraída de fuentes heterogéneas (documentos en PDF, Word, presentaciones, hojas de cálculo, audios, vídeos…). En mi opinión, esto supone un cambio de paradigma que multiplica las posibilidades de la gestión de conocimiento en departamentos legales o de RR HH, en actividades formativas o en atención al cliente, por citar cuatro ejemplos relevantes.
La digitalización ha ido transformando con paso firme la manera de trabajar de las organizaciones. Esta transformación digital ha consistido, principalmente, en convertir procesos de negocio que ocurrían en el mundo analógico en su versión digital. Una vez digitalizada la información, se abre un abanico de posibilidades inconcebibles en la versión analógica.
«La digitalización ha ido transformando con paso firme la manera de trabajar de las organizaciones, convirtiendo procesos de negocio que ocurrían en el mundo analógico en su versión digital».
Es aquí donde creo que los LLM, en particular, y la IA generativa, en general, suponen un antes y un después en el acceso y procesamiento de la información dentro de las organizaciones. Conseguir aprovecharse de esta nueva tecnología termina repercutiendo en mejoras competitivas, ya que es un revulsivo para la eficiencia de los profesionales de la misma manera que la poción mágica que tomaba Astérix cuando se enfrentaba a los romanos.
El siguiente paso de esta transformación es la automatización de tareas repetitivas. En esta digitalización hay procesos que, en un primer paso, se han diseñado como una mera traducción de su equivalente en papel. Esto suele ocurrir en procesos donde se maneja documentación digitalizada, pero en un formato que requiere una inspección manual. Estos procesos los encontramos habitualmente en la incorporación de un cliente o de un empleado, en procesos de diligencia debida, en el cumplimiento de cláusulas contractuales, en la recepción o emisión de mercancías, en la facturación de las mismas… En procesos donde todavía hay que rellenar o cotejar manualmente información.
Este tipo de procesos pueden ser automatizados gracias a una técnica específica de la IA que se denomina aprendizaje automático (ML, del inglés, machine learning). El ML permite desarrollar sistemas informáticos que aprenden a realizar una tarea a partir de ejemplos. Para ello, se recopila un conjunto de pares de entradas (por ejemplo, contratos) y salidas esperadas (por ejemplo, cláusulas mal redactadas o abusivas dentro de cada contrato). Tanto la entrada como la salida tienen que ser seleccionadas de manera que se asegure que para cada entrada del conjunto de datos siempre se dispone de la salida correcta, en un proceso se suele realizar manualmente.
Las técnicas de machine learning infieren, a partir de estos ejemplos, un algoritmo capaz de determinar para una nueva entrada que no pertenece a los ejemplos, la salida correcta (por ejemplo, dado un nuevo contrato, la IA identifica las cláusulas afectadas). Dependiendo de la complejidad de la tarea, el volumen de ejemplos varía entre cientos y miles de pares. Estas tareas de PLN también descansan en modelos lingüísticos, como RigoBERTa, el modelo desarrollado específicamente para el español en el Instituto de Ingeniería del Conocimiento (IIC).
«En tres décadas, en el IIC hemos acometido numerosos proyectos de machine learning: desde la detección del abandono de clientes a la predicción de rotación y accidentes laborales, pasando por la detección temprana de sepsis».
Esta manera de desarrollar software es más efectiva para algunos problemas que son demasiados complejos o tienen demasiadas alternativas como para programarlos con reglas. Desde mi punto de vista, tiene una gran ventaja, ya que es más sencillo mostrar cómo se hace una tarea que detallar cada uno de los pasos necesarios para acometerla. Además, en los ejemplos que hemos visto, incluyendo la IA generativa, no es posible describir mediante reglas todos los pasos del proceso que se quiere automatizar. En estos casos, no queda otra que recurrir a una buena selección de ejemplos de entrada y de salida que permitan alimentar un algoritmo de ML.
Concluyo. La IA se aplica en multitud de tipologías de problemas, actualmente reservados para los humanos, más allá del procesamiento de textos. Durante las más de tres décadas de vida del IIC hemos acometido también muchos proyectos de machine learning. Incluida la detección del abandono de clientes, la priorización de leads, la predicción de rotación y accidentes laborales, el mantenimiento predictivo de maquinaria e infraestructuras energéticas, la detección de anomalías en facturas, la predicción de morosidad y prescripción de acciones para recuperar deuda, la optimización de la gestión o la detección temprana de sepsis.
Invito al lector interesado a consultar más de nuestros casos de éxito, que muestran las infinitas posibilidades de la inteligencia artificial.
Pablo Haya es director de Business & Language Analytics en el Instituto de Ingeniería del Conocimiento.