La inteligencia artificial (IA) es un tema candente en el mundo empresarial desde hace años. Los visionarios nunca se cansan de pintar el futuro con los colores más deslumbrantes. Bill Gates predijo recientemente que la IA cambiará significativamente la asistencia sanitaria en cinco años: la fantasía de la IA sigue alimentándose.
Los primeros intentos de aplicación de la IA y del aprendizaje automático no siempre fueron satisfactorios. Pero con ChatGPT de OpenAI (GPT-3, GPT-4), esto cambió de golpe a finales de 2022. Una IA convincente, disponible de manera gratuita y que ofrecía buenos resultados... un cóctel perfecto que volvió a dar pábulo a las ensoñaciones. De repente, la IA Generativa (IAGen) estaba en boca de todos. Más de 100 millones de personas utilizan ya ChatGPT casi a diario y están entusiasmadas con las posibilidades de creación de contenidos y los resultados generados por la IA. El chatbot hace más que cualquier búsqueda en Internet, puede combinar y condensar la información, generar código y mantener conversaciones entretenidas. Tecnología que inspira.
La IA generativa es una subárea de la inteligencia artificial (como el NLP, la visión artificial y el análisis predictivo), por lo que el nombre ya indica para qué estaba pensada originalmente la IAGen: generar nuevos contenidos tales como textos, imágenes, vídeos, etc., para los que se ha entrenado previamente con patrones y datos similares. El objetivo es imitar los patrones y estilos encontrados en los datos de entrenamiento para replicarlos de distintas formas y crear nuevos contenidos. Esencialmente, la IAGen cierra la brecha entre la introducción de datos y la salida creativa. Permite a la IA no solo analizar, sino también crear.
¿Qué pasaría si las empresas dispusieran de asistentes y herramientas digitales potentes respaldados por IA? ¿Y si los empleados pudieran liberarse de tareas tediosas, tales como búsquedas en la intranet, la realización de informes de proyectos y la preparación de presentaciones? ¿Cómo impactaría eso en la productividad de la empresa?
Ya en 2019, Bloomberg informó de que el 30 % de sus contenidos periodísticos se generaban con IA. A principios de abril de 2023, la empresa causó un gran revuelo con su modelo de lenguaje a gran escala BloombergGPT. Los equipos de IA utilizaron PyTorch para su desarrollo, una herramienta de aprendizaje profundo basada en Python. El resultado fue un total de 363.000 millones de tokens para entrenar el modelo.
El equipo de Bloomberg recurrió a Amazon Web Services para entrenar su modelo básico. Alquiló 64 servidores, cada uno con 8 GPU NVIDIA A100. Estos funcionaron durante 53 días seguidos (!) para entrenar el modelo. El resultado: un modelo básico especial para el mercado financiero, un tipo completamente nuevo de herramienta de investigación y análisis financiero que ahora puede seguir perfeccionándose continuamente. Revoluciona la oferta de Bloomberg.
Por otra parte, el ejemplo de Bloomberg muestra muy claramente el esfuerzo que supone diseñar sistemas de IA. Las organizaciones no solo necesitan conocimientos técnicos, sino también los datos adecuados y las extensas capacidades informáticas necesarias para el entrenamiento. El cloud es la mejor opción para ello desde una perspectiva técnica y empresarial. Los modelos básicos son el quid del desarrollo de la IA. La mayor parte de los esfuerzos económicos y de tiempo se destina a la realización de estos modelos básicos de IA, por ejemplo en los modelos de lenguaje grandes. El ajuste fino de los modelos y el esfuerzo de inferencia son relativamente bajos en comparación.
Esto está cambiando con la disponibilidad de modelos básicos preentrenados o modelos de lenguaje a gran escala (Large Language Models, LLM). Las empresas que deseen desarrollar IA específicas para sus escenarios de aplicación ya no tienen que dedicar sus esfuerzos a inventar algo totalmente nuevo. Pueden utilizar los modelos básicos existentes y seguir desarrollándolos para sus tareas específicas.
Los clouds como AWS ofrecen todas las herramientas necesarias para el entrenamiento y desarrollo de las IA (fig. 1). Esto acelera enormemente la prestación de servicios de IA. Además de infraestructuras y marcos especialmente diseñados, AWS también ofrece acceso a varios modelos básicos. Una de las ventajas de trabajar con modelos básicos preentrenados procedentes del cloud es la sencillez con la que se puede desplegar una prueba de concepto en un entorno productivo.
Entre los modelos básicos se encuentran los modelos propios de la empresa Titan Text y Titan Embeddings, así como Jurassic-2, Claude y Stable Diffusion, publicados por conocidas start-ups de IA. Llama-2 también está disponible. Las empresas pueden utilizar estos modelos básicos para desarrollar sus propias soluciones de IAGen con total rapidez. Amazon Bedrock permite a los usuarios acceder a los servicios de IA a través de una API. No es necesario crear una infraestructura propia. Gracias a la amplia selección, se puede elegir el modelo básico adecuado en función de la finalidad de la IA generativa que se vaya a desarrollar.
La velocidad a la que se desarrollan actualmente la IA y la IA generativa es impresionante. La calidad de los servicios de IA disponibles también aumenta cada vez más. Las empresas que ignoren el fenómeno de la IA —especialmente ante la inminente escasez de mano de obra cualificada— perderán mucha competitividad en los próximos años. Actualmente es importante desarrollar una estrategia para el uso de la IA e identificar escenarios de aplicación. Pero, además de estas cuestiones futuras, las empresas deben sobre todo adquirir experiencia en el trato con la IA, como usuarios y como desarrolladores.
Solo en contadas ocasiones es sensato y necesario desarrollar modelos básicos propios desde cero. La disponibilidad de muchos componentes requeridos reduce considerablemente los esfuerzos de desarrollo. Ahora es más importante implicar a los expertos en procesos en el desarrollo de las IA. Solo la cuestión de los datos sigue siendo esencial. El entrenamiento y el ajuste preciso con datos internos serán esenciales para los sistemas específicos de IA destinados a apoyar los procesos empresariales. Estos datos constituyen la propiedad intelectual de la empresa. Hay que evitar a toda costa la pérdida de datos durante el entrenamiento. Los conceptos de seguridad son esenciales para conseguirlo.
Con la prueba de concepto Pathfinder, T-Systems ofrece a los interesados un sencillo acceso al mundo del desarrollo de IAGen con AWS. En un entorno aislado y seguro, el personal puede probar las posibilidades de la IAGen durante quince días y conversar con sus propias fuentes de datos utilizando modelos básicos como Llama-2, Titan y Claude. Los datos internos permanecen en el entorno de AWS del cliente, con acceso completo a toda la cartera de servicios de AWS para el desarrollo de IA.