Escalar GPUs en Kubernetes con KEDA: construí un scaler externo para métricas reales
ARTICULO Introducción Si ejecutás workloads con GPU en Kubernetes —vLLM, Triton, jobs de entrenamiento o stacks de inferencia agentica—, probablemente hayas notado que el autoscaling por defecto solo considera CPU…