👮‍♂️Agentes, Agentes, Agentes

🤖 Herramientas que generan, colaboran y piensan: repasamos lo más relevante de las últimas dos semanas en el mundo de la inteligencia artificial. 🧠

Del 31 de Marzo al 14 de Abril

¿Qué ocurrió en las últimas semanas?

El mundo avanza hacia herramientas de IA capaces de ejecutar tareas por nosotros (agentes), abriendo el camino para delegar partes significativas de nuestros flujos de trabajo en el futuro. En esta edición, exploramos los nuevos modelos, herramientas y recursos que han surgido en las últimas dos semanas.

  • 🎬Runway Gen-4: Nuevo modelo de generación de videos de 5 a 10 segundos en calidad 1080p, con alta coherencia en personajes, objetos y escenarios, además de una sólida comprensión del mundo. Chequea estas producciones chulísimas que se crearon con él.

  • 🔬CodeScientist. Agente desarrollado por Ai2 para automatizar el descubrimiento científico. Fue capaz de generar 6 posibles descubrimientos científicos válidos, demostrando el potencial de la IA para contribuir activamente a la investigación.

  • 🦙Meta presenta la nueva generación de sus modelos multimodales con Llama 4. Su versión más ligera, Llama 4 Scout, sorprende con una ventana de contexto de 10 millones de tokens.

  • 🤖Para programadores: Google presentó el protocolo Agent2Agent (A2A), un nuevo estándar para la comunicación entre todo tipo de agentes de IA, totalmente compatible con el protocolo MCP. Poco a poco, estamos viendo cómo se construye un ecosistema completo para el desarrollo de agentes inteligentes.

La IA que hace ciencia

CodeScientist es una nueva herramienta desarrollada por Ai2, diseñada para automatizar el proceso de descubrimiento científico. Su función principal es identificar vacíos en el conocimiento existente y, a partir de ellos, generar, ejecutar y analizar experimentos de forma autónoma.

En pruebas realizadas en el campo de agentes y entornos virtuales, CodeScientist produjo 19 posibles descubrimientos, de los cuales seis fueron validados por expertos como científicamente sólidos y novedosos. Este resultado demuestra su potencial como asistente activo en la investigación científica.

El objetivo de CodeScientist, al igual que otros esfuerzos recientes en este ámbito, es acelerar el ritmo del descubrimiento científico y ampliar el alcance de la investigación automatizada en múltiples disciplinas, permitiendo que los científicos se concentren en las decisiones estratégicas y creativas del proceso.

La Nueva Manada de Llamas

  • Llama 4 Scout: Diseñado para eficiencia, puede ejecutarse en una sola GPU Nvidia H100, con una ventana de contexto de 10 millones de tokens.

  • Llama 4 Maverick: Enfocado en tareas de razonamiento y codificación, ofrece un rendimiento comparable a modelos líderes como GPT-4o y Gemini 2.0 Flash, utilizando menos parámetros activos.

  • Llama 4 Behemoth (en desarrollo): Se espera que sea uno de los modelos más potentes, con 288 mil millones de parámetros activos y un total de 2 billones

Para programadores

Conexión entre Agentes: A2A

Agent2Agent (A2A) es un protocolo abierto creado por Google que permite que agentes de inteligencia artificial creados por distintas empresas o frameworks puedan comunicarse y trabajar juntos de manera sencilla, segura y estructurada.

La idea es que haya un estándar de comunicación entre todos los agentes del mundo.

¿Cómo funciona?

El protocolo A2A se basa en una arquitectura sencilla de tipo cliente-servidor, donde los agentes pueden comunicarse entre sí mediante peticiones HTTP para coordinar y resolver tareas de forma colaborativa.

Todo comienza con la Agent Card, un archivo en formato JSON que cada agente publica y que contiene información clave como:

  • Las capacidades del agente (qué puede hacer)

  • La URL de su endpoint

  • Los métodos de autenticación requeridos

Un agente que actúa como servidor A2A expone un endpoint HTTP que sigue las reglas del protocolo, y es capaz de recibir y ejecutar tareas enviadas por otros agentes o aplicaciones (clientes A2A).

Una vez completada la tarea, el agente servidor devuelve los resultados o artefactos generados al cliente, que pueden incluir archivos, datos estructurados o mensajes, según lo solicitado.

Si quieres empezar a usar el protocolo A2A o ver ejemplos prácticos con distintos lenguajes y frameworks, puedes consultar el repositorio oficial aquí 🛠️💡

Quizás quieras ver esto,

  • OpenAI lanza una nueva familia de modelos multimodales: GPT-4.1, especializados en tareas de programación y accesibles exclusivamente mediante API. Uno de sus aspectos más destacados es su ventana de contexto de un millón de tokens.

  • OpenAI Academy. OpenAI (la empresa detrás de ChatGPT) lanzó una plataforma gratuita de cursos en línea para enseñar cómo usar ChatGPT y otros modelos de IA en aplicaciones prácticas del mundo real.

  • Claude introduce su Modo Aprendizaje, una experiencia diseñada para estudiantes que promueve el desarrollo del pensamiento crítico. En lugar de ofrecer respuestas inmediatas, guía al usuario a través de un proceso de razonamiento con preguntas socráticas. Está disponible para los usuarios del Plan Pro.

¿Quieres promocionar tu empresa, producto, servicio o evento a una comunidad de empresarios e ingenieros de IA? Trabajemos juntos.