¿Qué significa combinar varios agentes de IA?
En el capítulo anterior definimos al agente de IA (aquí: una unidad de IA que recibe instrucciones, elabora sus propios pasos y ejecuta varias tareas en secuencia) como una unidad individual.
En este capítulo vamos a ver qué ocurre cuando esa «unidad individual» se multiplica.
Lo que un solo agente puede hacer, y lo que le cuesta
Es técnicamente posible pedirle a un solo agente que «redacte un artículo, lo revise, lo corrija y luego decida si publicarlo».
Pero cuando se intenta, aparecen problemas.
Si el mismo agente que escribe también revisa lo que escribió, no puede salir de su propia perspectiva. Revisa con los mismos supuestos con que redactó, por lo que es fácil que pasen por alto omisiones o errores. Además, cuando «redactar» y «decidir» se mezclan en una sola entidad, se vuelve difícil saber después dónde se tomó cada decisión.
En el trabajo humano pasa algo parecido: cuando revisas tu propio texto, tiendes a saltarte los errores. Hacer todo tú solo puede ser eficiente, pero a cambio aumenta el riesgo de que algo se escape.
Con los agentes de IA la estructura es la misma.
La idea de dividir roles y pasarse el resultado
Combinar varios agentes de IA no es simplemente «aumentar la cantidad». Es un sistema en el que se divide el rol de cada uno y se van pasando los resultados (la salida de cada tarea) en orden, para completar un trabajo.
A grandes rasgos, la estructura es así:
- Un agente encargado de «crear el borrador» produce el texto
- Un agente encargado de «ajustar el tono (el estilo y la temperatura del texto)» lo recibe y lo corrige
- Un agente encargado de «revisar el contenido» detecta los problemas
- Por último, una persona u otro agente lo verifica y da la aprobación final
Cada agente se concentra en su propio ámbito. El que escribe solo piensa en escribir. El que revisa solo piensa en «¿esto es correcto?, ¿falta algo?». Al tener roles separados, cada uno trabaja desde su propia perspectiva.
Este blog también funciona dentro de un sistema así. Una IA a cargo del borrador, otra a cargo del estilo, otra a cargo de la calidad del contenido intervienen en orden para que un artículo quede terminado. No voy a nombrar los roles ni los sistemas concretos, pero este artículo también ha pasado por ese proceso.
La seguridad y la calidad que genera la «combinación»
Voy a explicar con un poco más de detalle qué cambia al dividir los roles.
El primero es la independencia de la revisión (aquí: que el agente que revisa sea distinto del que ejecutó la tarea). Como el agente que escribe y el que verifica son distintos, los supuestos del primero no pasan sin filtro a la revisión. Es más fácil encontrar problemas cuando entra una mirada diferente. Es algo simple, pero el efecto no es pequeño.
El segundo es la visibilidad del recorrido (aquí: que quede registrado qué agente produjo qué resultado y qué le pasó al siguiente). Cuando algo falla, se puede revisar después dónde y cómo ocurrió. Si todo se le encarga a un solo agente, ese recorrido se vuelve difícil de ver.
El tercero es la claridad del ámbito de responsabilidad. Cuando algo no funciona, se puede identificar «en esta etapa, si el encargado cambia esto, mejora». Si todo está concentrado en uno, es difícil saber qué hay que corregir.
Estas tres ideas también se usan de forma parecida en el diseño de organizaciones humanas. Dicho esto, lo que aquí se está hablando no es de organizaciones de empresas, sino de la distribución de roles entre agentes de IA. No es exactamente igual que una organización humana, pero la estructura de «separar roles para tener mejor visibilidad» es común a ambas.
Lo que esta serie llama «organización de IA»
Combinar varios agentes de IA significa lo siguiente:
- Alinear agentes con roles distintos
- Pasarse mutuamente los resultados en orden
- Y con eso, completar un trabajo
Esto es el esqueleto de lo que esta serie llama organización de IA.
Al combinarlos, se puede acercarse a una calidad y una seguridad que un solo agente difícilmente alcanza. No se vuelve perfecto, pero «quién hizo qué» y «dónde se tomó cada decisión» se vuelven más visibles. Ese es el punto de partida de este sistema.
¿Qué es exactamente lo que cambia entre uno solo y varios? En este capítulo hemos ordenado «qué se está haciendo», pero esa pregunta tiene más continuación. En el próximo capítulo lo vemos con más detalle.