El Club CDO Spain & Latam celebró el 28 de marzo una sesión para conversar con los miembros de la comunidad acerca de Cómo ChatGPT puede revolucionar tu industria.
Quico Machín, CDAO del Instituto de Empresa fue speaker estrella y protagonista para explicarnos su visión y testimonio práctico de la revolución que esta tecnología esta generando en el sector educativo y como se puede implementar en otras industrias.
Numerosos compañeros del Club tuvieron la oportunidad de participar en el evento digital y se nos quedó corto así que aprovechamos el blog de la web del Club CDO para seguir generando contenido de valor para los profesionales de Data & Analytics
IA generativa un salto exponencial para las empresas
La inteligencia artificial ha experimentado un enorme crecimiento en los últimos años, especialmente en el ámbito del procesamiento del lenguaje natural. Entre las diversas aplicaciones de la IA, los modelos de lenguaje han sido objeto de especial atención, sobre todo después del lanzamiento de ChatGPT a finales de noviembre de 2022. Esto ha significado una explosión de notoriedad en todo el mundo y ha hecho que mucha gente se interese y divulgue sobre ChatGPT.
En el mundo de la inteligencia artificial es común escuchar términos como ChatGPT, GPT y LLM (large language model) para referirse a diferentes tipos de modelos de lenguaje. Sin embargo, es importante aclarar que estos términos no son intercambiables y cada uno tiene características y aplicaciones específicas. Por esta razón, creo que es importante que empecemos el artículo aclarando estos términos para que todos podamos partir de un punto inicial común.

¿Qué es el LLM y GPT?
Comencemos por el concepto de LLM, que significa “Large Language Model“. Los LLMs son modelos de lenguaje pre entrenados que se utilizan para diversas tareas, como la generación de texto y la traducción automática. Existen diferentes tipos de LLM, como LLAMA de Facebook AI, que ha demostrado una mayor capacidad para responder preguntas generales y de conocimiento común, y BARD de Google, que ha sido diseñado para tareas de generación de lenguaje natural, como el resumen de textos.
Otro modelo de LLM destacable y considerado el más popular y usado, al menos hasta la fecha de hoy (abril 2023) es GPT, desarrollado por OpenAI. GPT, o “Generative Pre-trained Transformer“, es un modelo de lenguaje autónomo que ha sido pre entrenado con grandes conjuntos de datos para generar texto coherente y significativo. GPT ha sido utilizado para diversas aplicaciones, como la generación de textos creativos y la mejora de la eficiencia del procesamiento del lenguaje natural.
La revolución de ChatGPT
Finalmente, ChatGPT es una implementación específica de GPT que ha sido entrenada para tareas de conversación, como la generación de respuestas coherentes y naturales en un chatbot. Esto lo hace particularmente útil en aplicaciones de asistencia virtual y atención al cliente.
El auge de ChatGPT lo ha convertido en la aplicación de más rápida adopción de la historia (incluso por delante de tiktok) y ha provocado que su modelo GPT sea el más famoso entre los distintos LLMs. Véase la siguiente gráfica:

Expectativas y detractores de ChatGPT
ChatGPT despierta grandes expectativas en todo el mundo, pero también tiene detractores, como aquellos que opinan que mata la creatividad humana o aquellos que piensan que una solución de este tipo no es sostenible por la cantidad de energía que consume. El consumo energético es complicado de calcular, de hecho, ChatGPT no te responde a esta pregunta, pero estimaciones de investigadores de Google estiman que para el entrenamiento de GPT3 se consumió 1.287 MWh y generó emisiones de más de 550 toneladas de carbono. Sabiendo que un coche en España emite anualmente 4.6 toneladas métricas de CO2 por año, vemos que el impacto de CO2 para el entrenamiento de GPT3 supuso lo mismo que la emisión de CO2 de 120 vehículos en un año.
Pero el dato de consumo de infraestructura cloud en términos monetarios (que quizá sea el concepto que la mayoría de lectores de este artículo valoren más) es de 100.000 dólares diarios. Sólo para satisfacer las preguntas de los usuarios a ChatGPT (este dato está estimado en marzo de 2023).
Otro dato que se conoce de GPT es el número de parámetros pre entrenados de sus algoritmos basados en redes neuronales. En GPT3 es de 175 billones de parámetros mientras que en GPT4 se estima que son 100.000 billones. Pero ¿qué son esos parámetros? Son valores numéricos de los pesos que se asignan a las conexiones entre las neuronas de la red neuronal en la que se basan los algoritmos de modelos de LLM como GPT, los cuales se determinan durante el proceso de entrenamiento. Estos parámetros determinan cómo el modelo procesa y genera texto en función de la entrada de texto que recibe.
Una vez entendido ya todos los conceptos que resuenan ahora sobre IA aplicado al lenguaje, vamos a ver las diferentes formas de poder instanciar este tipo de servicios a nivel empresarial. El modo más simple sería a través de una llamada a la API directamente de OpenAI o a través de una instancia de OpenAI a través de la nube de Azure de Microsoft. Por otro lado, también tenemos la posibilidad de bajarnos los modelos de LLM desde Hugging Face y montarlos en una infraestructura propia gestionada por nuestra empresa. De todos modos, en función del caso de negocio que estudiemos aplicará más una u otra opción.
Para terminar, me gustaría hacer una reflexión importante: los LLM y en particular GPT a través de ChatGPT no resuelve todos los problemas del mundo, ¡no nos puede llevar a la luna!
Es una herramienta que nos ayuda con todo lo relacionado con el lenguaje natural usando una base de conocimiento enorme.
GPT3 o ChatGPT no están diseñados para la automatización de procesos, aunque podrían ser de ayuda en este sentido con la combinación de otros módulos creados para este objetivo. Pero en sí, por sí solo, no resuelve la automatización.
Este post ha sido creado por Quico Machín, CDAO del Instituto de Empresa y miembro del Club CDO Spain & Latam