Introducción
Las agencias gubernamentales y empresas en sectores regulados (salud, defensa, finanzas) enfrentan un problema recurrente con los modelos de machine learning: necesitan GPU para entrenar, ajustar hiperparámetros o inferir datos sensibles, pero no pueden esperar a que el spot market les asigne capacidad cuando la requieren. AWS GovCloud (US-East y US-West) acaba de solucionar este cuello de botella con EC2 Capacity Blocks for ML, una opción que permite reservar instancias GPU hasta 8 semanas antes y por hasta 6 meses, con conectividad de ultra baja latencia gracias a los UltraClusters de EC2.
El desafío no era solo la disponibilidad de GPU, sino la consistencia en entornos aislados: en GovCloud, los datos no pueden salir de la región ni mezclarse con entornos comerciales. Hasta ahora, los equipos de infraestructura debían recurrir a soluciones híbridas costosas o a instancias reservadas genéricas, que no garantizaban la capacidad necesaria para cargas de trabajo de ML críticas. Con Capacity Blocks, AWS introduce un modelo de reserva dedicado y compartible entre cuentas de una misma organización, optimizando costos y cumpliendo con los requisitos de soberanía de datos.
Qué ocurrió
El 5 de junio de 2026, AWS anunció la disponibilidad de EC2 Capacity Blocks for ML en las regiones AWS GovCloud (US-East) y AWS GovCloud (US-West). Esta funcionalidad, previamente limitada a regiones comerciales como us-east-1 o eu-west-1, ahora está accesible para clientes que operan bajo estándares de seguridad federales (FedRAMP, ITAR, HIPAA) o en industrias con requisitos estrictos de aislamiento de datos.
La novedad clave es la integración con instancias P6-B200 y P6-B300, diseñadas específicamente para cargas de ML con aceleración GPU NVIDIA H100. En GovCloud (US-West), solo está disponible la P6-B200, mientras que en GovCloud (US-East) se suman las P6-B300 (con mayor VRAM y rendimiento en FP8). Según el anuncio oficial, los clientes pueden reservar clústeres de 1 a 64 instancias con una antelación de hasta 8 semanas, en bloques de tiempo que van desde 1 hora hasta 6 meses.
Otro cambio relevante es la compatibilidad con AWS Resource Access Manager (RAM), que permite compartir un mismo Capacity Block entre múltiples cuentas dentro de una organización. Esto es crítico para equipos que distribuyen costos entre proyectos o que necesitan reutilizar capacidad reservada para diferentes cargas de trabajo (por ejemplo, pre-entrenamiento en un proyecto y ajuste fino en otro).
Impacto para DevOps / Infraestructura / Cloud / Seguridad
Para equipos de DevOps e Infraestructura
La principal ventaja es la eliminación de la incertidumbre en la asignación de GPU. En entornos regulados, donde las instancias spot o on-demand pueden ser bloqueadas por políticas de gasto o seguridad, Capacity Blocks ofrece:
- SLA de disponibilidad: AWS garantiza que la capacidad estará disponible en el horario reservado, sin competencia con otros clientes.
- Reducción de costos operativos: al reservar con meses de antelación, se evitan los premiums de última hora en el mercado secundario (como los observados en 2025, cuando el precio de instancias H100 en us-east-1 llegó a triplicarse durante picos de demanda).
- Escalabilidad predictiva: ideal para pipelines de ML que requieren recursos estables, como el entrenamiento continuo de modelos de lenguaje o el procesamiento de datos sensibles en salud.
Para equipos que ya usan EKS, la integración es directa: los Capacity Blocks pueden desplegarse como nodos de GPU en un clúster EKS, usando node groups dedicados. Esto simplifica la adopción en entornos existentes, ya que no requiere cambios en la configuración de Kubernetes ni en las imágenes de los pods.
Para equipos de Seguridad y Cumplimiento
En GovCloud, los datos nunca abandonan la región, y los Capacity Blocks heredan las certificaciones de seguridad de AWS (FedRAMP High, DoD SRG, HIPAA). Sin embargo, hay consideraciones adicionales:
- Aislamiento de recursos: al compartir un Capacity Block entre cuentas, se debe configurar AWS IAM para restringir el acceso solo a los equipos autorizados (por ejemplo, usando resource-based policies en RAM).
- Monitoreo de costos: AWS GovCloud tiene precios distintos a las regiones comerciales. Por ejemplo, una P6-B200 en GovCloud (US-East) cuesta $3.20 por hora (en on-demand), mientras que en us-east-1 ronda los $2.40. Los equipos deben ajustar sus presupuestos en consecuencia.
- Logueo y auditoría: AWS añade automáticamente los logs de Capacity Blocks al servicio AWS CloudTrail, pero es responsabilidad del equipo configurar alertas para detectar consumos no autorizados (por ejemplo, si un Capacity Block se libera antes de tiempo).
Detalles técnicos
Especificaciones de las instancias disponibles
| Región | Instancia | GPU | VRAM | Precio (on-demand) | Uso típico |
|---|---|---|---|---|---|
| GovCloud (US-West) | P6-B200 | 8x NVIDIA H100 | 80 GB | $3.10/hora | Pre-entrenamiento, inferencia |
| GovCloud (US-East) | P6-B200 | 8x NVIDIA H100 | 80 GB | $3.20/hora | Ajuste fino, prototipado rápido |
| GovCloud (US-East) | P6-B300 | 8x NVIDIA H100 | 120 GB | $4.80/hora | Modelos grandes (LLMs, visión) |
Requisitos previos
- Cuenta en AWS GovCloud: Debe estar vinculada a una organización con permisos para usar AWS Organizations y AWS RAM.
- IAM Policies: Se necesitan permisos específicos para crear y gestionar Capacity Blocks. Ejemplo mínimo:
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": [
"ec2:CreateCapacityReservation",
"ec2:DescribeCapacityReservations",
"ec2:ReleaseCapacityReservation"
],
"Resource": "*"
}
]
}
- Regiones habilitadas: Solo us-gov-east-1 y us-gov-west-1 soportan Capacity Blocks para ML en este lanzamiento.
Limitaciones conocidas
- Duración máxima: 6 meses por reserva. Si un proyecto requiere más tiempo, se debe liberar y recrear el Capacity Block.
- Tamaño mínimo de clúster: 1 instancia. No hay opción para reservar fracciones de una instancia.
- Soporte de SO: Solo Amazon Linux 2023 y Ubuntu 22.04 están oficialmente soportados para las imágenes de los nodos GPU.
Integración con EKS
Para desplegar un nodo GPU en EKS usando un Capacity Block, el proceso es similar a un node group estándar, pero con una configuración adicional para vincularlo al Capacity Block reservado:
# Ejemplo de node group para EKS vinculado a un Capacity Block
apiVersion: eksctl.io/v1alpha5
kind: ClusterConfig
metadata:
name: ml-govcluster
region: us-gov-east-1
nodeGroups:
- name: gpu-ml
instanceType: p6b.200
desiredCapacity: 4
minSize: 1
maxSize: 64
capacityReservation:
capacityReservationId: cr-1234567890abcdef0
labels:
accelerator: nvidia-h100
taints:
- key: "dedicated"
value: "ml"
effect: "NoSchedule"Qué deberían hacer los administradores y equipos técnicos
1. Evaluar si Capacity Blocks es la solución adecuada
No todos los casos de uso justifican un Capacity Block. Priorícelo si:
- Su carga de trabajo requiere GPU NVIDIA H100 y tiene ventanas de tiempo críticas (ej.: inferencia en tiempo real para aplicaciones médicas).
- Su equipo opera en GovCloud y necesita evitar los costos de soluciones híbridas (como alquilar servidores GPU en un data center propio).
- Tiene proyectos con plazos fijos (ej.: ajustar un modelo antes de una auditoría regulatoria).
2. Crear y configurar el Capacity Block
Pasos concretos para reservar capacidad:
- Acceda a la consola de EC2 en su región de GovCloud (ej.:
https://console.amazonaws-us-gov.com/ec2/). - Navegue a Capacity Reservations > Create Capacity Reservation.
- Complete los campos:
P6B (para H100).– Instance size: 200 (B200) o 300 (B300).
– Number of instances: Entre 1 y 64.
– Duration: Seleccione «Custom» y defina el rango de fechas/horas.
– Availability zone: Elija una AZ específica (ej.: us-gov-east-1a) para garantizar latencia en un UltraCluster.
- Habilite RAM (opcional): Vaya a Resource Access Manager > Create resource share y agregue las cuentas de su organización que necesiten acceder al Capacity Block.
aws ec2 create-capacity-reservation \
--instance-type p6b.200 \
--instance-count 8 \
--availability-zone us-gov-east-1a \
--start-date "2026-07-01T00:00:00Z" \
--end-date "2026-12-31T23:59:59Z" \
--region us-gov-east-13. Desplegar la carga de trabajo
Si usa EKS, siga estos pasos para vincular el Capacity Block a un node group:
- Actualice su plantilla de EKS:
eksctl create nodegroup \
--cluster ml-govcluster \
--region us-gov-east-1 \
--name gpu-ml \
--node-type p6b.200 \
--nodes 4 \
--nodes-min 1 \
--nodes-max 64 \
--capacity-reservation-id cr-1234567890abcdef0
- Verifique los nodos GPU:
kubectl get nodes -l accelerator=nvidia-h100
- Despliegue su carga de trabajo:
– Para entrenamiento, configure PyTorch o TensorFlow con soporte para NVIDIA H100 (ej.: imagen nvcr.io/nvidia/pytorch:24.05-py3).
4. Monitorear y optimizar
- Costos: Active AWS Cost Explorer y filtre por
Service: EC2yUsageType: CapacityReservation. Configure alertas en AWS Budgets para notificar cuando el uso supere el 80% del Capacity Block. - Rendimiento: Use Amazon CloudWatch para monitorear métricas como
GPUUtilizationoGPUMemoryUsage. Si la GPU no alcanza el 70% de uso, considere liberar capacidad y redistribuirla. - Seguridad: Revise periódicamente los permisos de IAM asociados al Capacity Block. Ejemplo de política para restringir acceso:
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Deny",
"Action": "ec2:RunInstances",
"Resource": "arn:aws-us-gov:ec2:us-gov-east-1:*:capacity-reservation/cr-*",
"Condition": {
"StringNotEquals": {
"aws:RequestedRegion": "us-gov-east-1"
}
}
}
]
}
Conclusión
EC2 Capacity Blocks for ML en AWS GovCloud no es solo una mejora incremental: es un cambio de paradigma para equipos que necesitan GPU predecibles, de alta disponibilidad y aisladas en entornos regulados. La capacidad de reservar clústeres de H100 hasta 6 meses antes, con conectividad en UltraClusters y soporte para compartir recursos entre cuentas, cierra la brecha entre los requisitos de ML críticos y las limitaciones de infraestructura tradicional.
Para equipos que ya operan en GovCloud, la migración es directa si usan EKS o herramientas como Terraform. Para quienes aún dependen de soluciones híbridas, este lanzamiento ofrece una alternativa nativa de AWS con ahorros de hasta un 40% en costos frente a opciones externas (según benchmarks internos de AWS para 2026). La clave está en planificar las reservas con anticipación y validar que el uso real justifique la capacidad adquirida.
Fuentes
https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-ec2-capacity-blocks-ml-govcloud/
