Introducción
Hasta ahora, interactuar con agentes de IA alojados en AWS Bedrock requería ejecutar comandos de forma asincrónica mediante el API InvokeAgentRuntimeCommand. Esto limitaba la capacidad de depurar problemas en tiempo real, inspeccionar archivos, o ejecutar comandos ad-hoc dentro del entorno aislado de un coding agent como Claude Code o OpenAI Codex. La solución típica implicaba exponer un puerto SSH, montar volúmenes NFS, o usar herramientas externas de logging, lo que aumentaba la superficie de ataque y complejizaba la configuración.
Con la introducción de shells interactivos en Amazon Bedrock AgentCore Runtime, los equipos de DevOps ahora pueden abrir un terminal persistente (PTY-backed) directamente dentro de la microVM que aloja al agente, usando un nuevo endpoint WebSocket. Esto no solo elimina la necesidad de configurar accesos remotos, sino que también permite mantener el estado de la sesión (variables de entorno, directorios de trabajo, historial de comandos) entre reconexiones.
Qué ocurrió
AWS anunció el 18 de junio de 2026 el lanzamiento de interactive shells en AgentCore Runtime, integrado al conjunto de herramientas para agentes de Bedrock. La nueva funcionalidad se basa en dos componentes clave:
- Nuevo API
InvokeAgentRuntimeCommandShell: Expone un socket WebSocket persistente que permite abrir una terminal interactiva dentro de la microVM del agente. - Integración con microVMs aisladas: Cada shell se ejecuta en un entorno aislado, con colores, autocompletado, soporte para Ctrl+C, y redimensionado de terminal.
Hasta este cambio, los desarrolladores solo podían ejecutar comandos de forma puntual mediante InvokeAgentRuntimeCommand. Ahora, con el nuevo API, se puede:
- Autenticarse en la microVM del agente.
- Inspeccionar archivos y directorios en tiempo real.
- Ejecutar comandos ad-hoc para debuggear el estado del entorno.
- Mantener múltiples shells concurrentes (hasta 10 por runtime) para trabajar en diferentes ramas o tareas en paralelo.
Para interactuar con el nuevo shell, se usa el comando CLI de AgentCore:
agentcore exec --it --runtime <runtime-arn>Esto abre una sesión interactiva con autocompletado, historial de comandos y reconexión automática ante caídas de red breves.
Impacto para DevOps / Infraestructura / Cloud / Seguridad
Para equipos de DevOps y SRE
- Reducción de tiempo de depuración: Pasar de comandos asincrónicos a un terminal interactivo acelera la resolución de problemas en entornos remotos. Por ejemplo, si un coding agent falla al compilar, en lugar de ejecutar múltiples comandos puntuales, se puede abrir una shell, revisar logs en
/var/log/, y ajustar configuraciones sobre la marcha. - Eliminación de puertos SSH expuestos: Las microVMs de Bedrock ya están aisladas, pero antes requerían configuraciones adicionales para acceder a ellas. Ahora, el terminal se abre directamente sobre WebSocket, sin necesidad de exponer puertos 22.
- Soporte para CI/CD: Los equipos pueden integrar shells interactivos en pipelines para:
– Ejecutar pruebas de integración en el mismo contexto que el agente.
– Depurar fallos en despliegues sin acceder manualmente a la instancia.
Para equipos de Seguridad
- Superficie de ataque reducida: Al eliminar la necesidad de SSH, se reduce la exposición de puertos y la complejidad en la configuración de firewalls. El tráfico de terminales ahora fluye por WebSocket, que puede ser auditado y limitado mediante políticas IAM.
- Aislamiento mejorado: Cada shell se ejecuta en una microVM con sus propias políticas de seguridad, sin compartir estado con otros agentes o sesiones.
- Autenticación integrada: El acceso a los shells requiere credenciales IAM válidas, y las sesiones pueden ser auditadas mediante CloudTrail.
Para Cloud Architects
- Escalabilidad: Cada runtime de AgentCore soporta hasta 10 shells concurrentes, permitiendo a equipos trabajar en múltiples ramas o tareas en paralelo sin solapamientos.
- Costos: Las microVMs son efímeras, por lo que el uso de shells interactivos no implica costos adicionales significativos (solo el tiempo de CPU mientras la sesión está activa).
Detalles técnicos
Arquitectura del nuevo shell interactivo
El flujo de trabajo para abrir un shell interactivo es el siguiente:
- Autenticación: El cliente (CLI de AgentCore o SDK) se autentica con AWS IAM y obtiene un token JWT.
- Negociación WebSocket: Se establece una conexión persistente mediante el endpoint
wss://agentcore.runtime.<region>.amazonaws.comusando el token. - Inicialización de PTY: AgentCore Runtime crea un pseudo-terminal (PTY) dentro de la microVM del agente, con soporte para:
readline.– Manejo de señales: Soporte para Ctrl+C (SIGINT), Ctrl+Z (SIGTSTP), etc.
– Redimensionado de terminal: El cliente envía eventos de resize para ajustar el tamaño del PTY.
- Persistencia de estado: La sesión mantiene:
PATH, HOME, etc.).– Directorio de trabajo actual.
– Historial de comandos (vía ~/.bash_history o equivalente).
- Reconexión: Si la conexión se cae:
session_id y shell_id.– Desconexiones largas: El usuario puede reiniciar la sesión manualmente con los mismos IDs.
Comandos clave del nuevo API
| Comando/Endpoint | Descripción | Ejemplo |
|---|---|---|
