Un agente de IA es una herramienta versátil diseñada para manejar tareas y procesos de manera autónoma. Piensa en él como un asistente altamente inteligente que agiliza los flujos de trabajo, utilizando un conjunto de procesos de alta tecnología para ayudarte a lograr tus objetivos.
Aunque los chatbots o herramientas generativas podrían venir a la mente cuando piensas en agentes de IA, van más allá del simple procesamiento del lenguaje y la generación de imágenes. Pueden tomar decisiones, realizar acciones reactivas e interactuar con sistemas externos, como gestionar tu calendario o comunicarte con plataformas de atención al cliente.
Aquí tienes una guía sobre qué son estos agentes, cómo operan y qué tipos de agentes de IA existen.
Componentes de un sistema de agente de IA
Los agentes de IA tienen diferentes componentes que forman su cuerpo o software, cada uno con sus propias capacidades.
- Sensores: permiten que el agente perciba su entorno para recopilar percepciones (entradas del mundo: imágenes, sonidos, frecuencias de radio, etc.). Estos sensores pueden ser cámaras, micrófonos o antenas, entre otras cosas. Para los agentes de software, podría ser una función de búsqueda en la web o una herramienta para leer archivos PDF.
- Actuadores: ayudan al agente a actuar en el mundo. Pueden ser ruedas, brazos robóticos o una herramienta para crear archivos en una computadora.
- Procesadores, sistemas de control y mecanismos de toma de decisiones: componen el “cerebro” del agente. Los he agrupado juntos porque comparten funciones similares, pero no todos pueden estar presentes en un sistema de agente de IA. Procesan información de los sensores, idean el mejor curso de acción y emiten comandos a los actuadores.
- Sistemas de aprendizaje y base de conocimientos: almacenan datos que ayudan al agente de IA a completar tareas; por ejemplo, una base de datos de hechos o percepciones pasadas, dificultades encontradas y soluciones halladas.
Dado que la forma de un agente de IA depende en gran medida de las tareas que realiza, es posible que algunos agentes de IA tengan todos estos componentes y otros no. Por ejemplo, un termostato inteligente puede carecer de componentes de aprendizaje, teniendo solo sensores básicos, actuadores y un sistema de control simple. Un coche autónomo tiene todo en esta lista: necesita sensores para ver la carretera, actuadores para moverse, toma de decisiones para cambiar de carril y un sistema de aprendizaje para recordar cómo navegar por las partes más complejas de la ciudad.
Tipos de agentes de IA
Esta lista está en constante expansión, pero aquí está la forma en que actualmente dividiría el panorama de los agentes de IA.
Agentes de IA generales
- Agentes de reflejo simple: buscan un estímulo en uno o un pequeño conjunto de sensores. Una vez detectado esa señal, la interpretan, toman una decisión y producen una acción o salida. Puedes encontrar estos agentes en termostatos digitales simples o en la aspiradora inteligente que actualmente está asustando a tu perro.
- Agentes de reflejo basados en modelo: mantienen un estado interno activo, recopilando información sobre cómo funciona el mundo y cómo sus acciones lo afectan. Esto ayuda a mejorar la toma de decisiones con el tiempo. Los encontrarás pronosticando las necesidades de inventario en un almacén o en el coche autónomo que ahora está estacionando frente a tu ventana.
- Agentes basados en metas: crean una estrategia para resolver un problema en particular. Generan una lista de tareas, toman medidas para resolverla y entienden si esas acciones los acercan al objetivo. Puedes encontrar estos agentes derrotando a campeones humanos de ajedrez y en aplicaciones de agentes de IA, de las que hablaré en un momento.
- Agentes basados en utilidad: generan las posibles salidas de decisiones en circunstancias con muchas alternativas viables. Ejecutan cada posibilidad y la puntúan según su función de utilidad: ¿Es la mejor opción la más barata? ¿La más rápida? ¿La más eficiente? Es muy útil para ayudar a identificar la opción ideal y quizás superar episodios de parálisis por análisis humana. Los puedes ver optimizando el tráfico de tu ciudad o recomendando los mejores programas para que veas en la televisión.
- Agentes de aprendizaje: como su nombre indica, aprenden de su entorno y comportamiento. Utilizan un generador de problemas para crear pruebas y explorar el mundo, y un elemento de rendimiento para tomar decisiones y actuar según lo aprendido hasta el momento. Además, tienen un crítico interno para comparar las acciones tomadas frente al impacto observado en el mundo. Estos agentes están previniendo el spam que llega a tu bandeja de entrada.
Chatbots de IA agentivos
La inteligencia de los modelos sigue aumentando de manera drástica, y los marcos para la gestión del conocimiento y las interacciones con sistemas externos también mejoran de manera constante.
Esto lleva a los ahora clásicos chatbots de IA, como la versión de ChatGPT de 2023, a un nuevo nivel de funcionalidad y potencia. Aquí están las principales diferencias entre los chatbots antiguos y los nuevos chatbots agentivos:
- Los nuevos chatbots agentivos pueden conectarse a bases de conocimiento en vivo, respondiendo con salidas contextualmente conscientes, lo que mejora la precisión de las respuestas (generación aumentada por recuperación, o RAG). Los chatbots antiguos solo dependían de la experiencia preentrenada.
- Los nuevos chatbots agentivos pueden detectar las intenciones del usuario de manera más precisa y activar llamadas a funciones, lo que les permite interactuar con sistemas externos. OpenAI introdujo esta funcionalidad en junio de 2023, abriendo el camino para la búsqueda web, por ejemplo. Los chatbots antiguos no podían acceder a herramientas externas.
- Dependiendo de la configuración, los nuevos chatbots agentivos pueden tomar múltiples turnos para responder a una solicitud o alcanzar un objetivo, haciendo cola para realizar múltiples acciones si deciden que esto aumentará la calidad de la salida. Los chatbots antiguos trabajaban con un sistema basado en un solo turno, donde tú enviabas un mensaje, el bot calculaba la respuesta y la devolvía.
Las plataformas para construir estos chatbots de IA agentivos son accesibles: los usuarios no técnicos pueden crear chatbots de IA agentivos útiles sin necesidad de mirar nunca Python o JavaScript.
Agentes de uso de computadoras (CUA)
¿Qué pasaría si tuvieras un LLM que pudiera usar tu computadora y hacer las tareas aburridas por ti? Aquí está: los agentes de uso de computadoras combinan el poder de la IA con el conocimiento sobre el uso de la computadora: escribir, señalar y hacer clic, navegar por sitios web, para pedir Ubers, pedir pizza y convertir la administración aburrida en administración completada.
Actualmente, existen dos métodos para implementar CUA:
- El primero, el más arriesgado, es permitir que el LLM tenga acceso completo a tu máquina. Puede hacer todo lo que tú puedas hacer en tu computadora, incluidas las equivocaciones.
- El segundo, el mejor hasta ahora, es configurar una máquina virtualizada, ya sea localmente o en un servidor remoto, para que la IA tenga su espacio separado para asombrar o decepcionar sin mayores consecuencias.
Sistemas multiagentes
Y si tienes una tarea realmente compleja por completar, como dirigir todo un negocio con IA, puedes combinar estos agentes en sistemas multiagentes. Puedes tener un agente de IA como sistema de control, generando una lista de tareas y delegándolas a otros agentes de IA especializados. A medida que completan estas tareas, la salida se almacena y es analizada por un crítico interno, y todo el sistema sigue iterando hasta encontrar una solución.
Aunque existen marcos de grado de desarrollador para construir esto (AutoGen de Microsoft es un ejemplo), aún no existen plataformas sin código viables para implementarlo. Pero dado que aún hay tanto por descubrir en los sistemas de agentes únicos, aún es demasiado pronto para sumergirse en esto.
¿Cómo funciona un agente de IA?
Flujo de trabajo tradicional de un agente de IA
En resumen, un agente de IA utiliza sus sensores para recopilar datos, sistemas de control para pensar en hipótesis y soluciones, actuadores para realizar acciones en el mundo real y un sistema de aprendizaje para hacer un seguimiento de su progreso y aprender de sus errores.
Profundicemos en cómo funciona un agente de IA basado en metas, ya que probablemente construirás o usarás uno de estos en el futuro.
- Cuando ingresas tu objetivo, el agente de IA pasa por la inicialización de la meta. Pasa tu solicitud al modelo central de IA y devuelve la primera salida de su monólogo interno, mostrando que comprende lo que necesita hacer.
- El siguiente paso es la creación de una lista de tareas. Según la meta, generará un conjunto de tareas y entenderá en qué orden debe completarlas. Una vez que decide que tiene un plan viable, comenzará a buscar información.
- Dado que el agente puede usar una computadora de la misma manera que tú, puede recopilar información de internet. También he visto algunos agentes que pueden conectarse a otros modelos o agentes de IA para externalizar tareas y decisiones, lo que les permite acceder a generación de imágenes, procesamiento de datos geográficos o características de visión por computadora.
- Todos los datos se almacenan y gestionan por el agente en su sistema de aprendizaje/base de conocimientos, para que pueda reenviarlos a ti y mejorar su estrategia a medida que avanza.
- A medida que se tachen tareas de la lista, el agente evalúa cuán lejos está aún de la meta, reuniendo retroalimentación tanto de fuentes externas como de su monólogo interno.
- Y hasta que se cumpla la meta, el agente seguirá iterando, creando más tareas, reuniendo más información y retroalimentación, y avanzando sin detenerse.
Flujo de trabajo de los chatbots de IA agentivos
Los chatbots de IA agentivos son un poco diferentes en alcance si los comparamos con la definición general de agentes de IA. Así es como funcionan, basado en el marco propuesto en la API de Asistentes de OpenAI.
- Inicias un nuevo hilo para el agente. Este almacenará todos los mensajes, llamados archivos y los resultados de las llamadas a funciones.
- Estableces una acción desencadenante con el software: esto puede basarse en una combinación de fecha y hora, un cambio en una base de datos o sistema, recibir un mensaje o un desencadenante manual.
- Una vez desencadenado, el modelo de IA analizará la solicitud, interpretará la intención detrás de ella y ejecutará una o varias acciones para generar una respuesta.
- Si el modelo detecta que el usuario quiere saber sobre un tema específico, puede activar una herramienta de búsqueda de archivos. Esta buscará en una base de conocimientos conectada datos relacionados con la solicitud.
- Si el modelo detecta que el usuario quiere interactuar con un sistema externo—buscando en la web, buscando en una base de datos externa, escribiendo una nueva página en Notion—en su lugar comenzará una llamada a función e interactuará con la API del servicio.
- Si ninguno de los anteriores es detectado, el modelo agrega un mensaje al hilo con su base de datos de entrenamiento.
- El software envía la respuesta del agente de vuelta a ti, lo que podría incluir un informe de los pasos realizados, mensajes generados, fuentes de documentos o enlaces a URL externas.
6 beneficios de los agentes de IA
La adopción de agentes de IA ofrece numerosos beneficios, transformando la manera en que las empresas interactúan con sus clientes y gestionan sus operaciones de servicio.
1. Mayor eficiencia
Los agentes de IA pueden manejar múltiples interacciones con los clientes simultáneamente, reduciendo significativamente los tiempos de respuesta y aumentando la eficiencia de las operaciones de servicio al cliente. También son capaces de identificar si deben escalar a un humano, seleccionando al representante con el conjunto de habilidades más adecuado para atender la consulta. Esto permite a las empresas manejar un mayor volumen de consultas sin comprometer la calidad del servicio.
2. Mejora de la satisfacción del cliente
Los agentes de IA proporcionan respuestas rápidas y precisas, lo que lleva a una mayor puntuación de satisfacción del cliente. Pueden utilizar datos para personalizar las interacciones, mejorando la experiencia general del cliente. Y como aprenden con el tiempo, están orientados hacia la mejora continua.
3. Disponibilidad 24/7
Los agentes de IA están disponibles todo el día, todos los días, asegurando que las consultas de los clientes sean atendidas de inmediato, sin importar las zonas horarias o el horario laboral. Esta disponibilidad continua ayuda a las empresas a cumplir con las expectativas de los clientes para el autoservicio y mejora la lealtad del cliente.
4. Escalabilidad
Los agentes de IA pueden escalar fácilmente para manejar mayores volúmenes de interacciones con los clientes, lo que los hace ideales para las empresas que buscan crecer sin comprometer la calidad del servicio. A medida que aumenta el volumen de casos, los agentes de IA pueden ajustarse fácilmente para manejar la carga adicional, garantizando un soporte constante y confiable.
5. Perspectivas basadas en datos
Los agentes de IA generan datos valiosos sobre interacciones con los clientes, preferencias y comportamientos. Las empresas pueden usar estos datos para obtener información sobre las necesidades y tendencias de los clientes, permitiéndoles tomar decisiones informadas y mejorar sus ofertas de servicio.
6. Consistencia y precisión
Los agentes de IA proporcionan respuestas consistentes y precisas a las consultas de los clientes, reduciendo el riesgo de errores y asegurando que los clientes reciban información confiable. Pueden mejorar la precisión de tus respuestas mediante bucles agentivos y razonamiento similar al humano. Esta consistencia ayuda a generar confianza y confianza en la marca, ya que los clientes obtienen la experiencia que esperan.