Amazon Web Services (AWS) lanzó el 28 de mayo la nueva generación de Amazon OpenSearch Serverless, que desacopla por completo el cómputo del almacenamiento: cuando un agente desencadena una tarea, los recursos de cómputo pueden escalar en segundos, y cuando está inactivo, se reduce automáticamente a cero y deja de facturar; incluso la versión anterior de Serverless requería mantener al menos una instancia en ejecución constante. Tia White, directora general del servicio AWS OpenSearch, declaró a TechCrunch que los agentes generan picos de tráfico sin previo aviso y se quedan en silencio igual de repentinamente, «las empresas necesitan un sistema de búsqueda que pueda seguir el ritmo, sin tener que pagar continuamente por capacidad de cómputo ociosa». La nueva versión integrará de forma nativa plataformas de desarrollo de IA como Vercel y Kiro, permitiendo a los desarrolladores implementar backends de búsqueda y bases de datos vectoriales listos para producción para agentes sin gestionar la infraestructura subyacente. Lai Yi Ohlsen, gerente sénior de productos de Cloudflare, reveló en el mismo informe que en los últimos seis meses el tráfico de bots ha representado el 31% de todo el tráfico HTTP, de los cuales los rastreadores de IA, motores de búsqueda y asistentes constituyen aproximadamente una cuarta parte de todas las solicitudes de bots, y pronosticó que «el tráfico no humano superará al tráfico humano en la primera mitad de 2027».
Esta actualización de AWS refleja un giro sistémico en toda la industria de la nube: Databricks y Snowflake se están posicionando como sistemas de memoria y recuperación para la IA empresarial, Microsoft ya ha lanzado actualizaciones de Azure para picos de tráfico de agentes de IA y memoria compartida entre agentes, y Cloudflare también lanzó el mes pasado un producto de infraestructura que proporciona entornos persistentes y escalado elástico instantáneo para agentes. El informe de TechCrunch señala que existe un ciclo virtuoso entre la reconstrucción de infraestructura y la escala de despliegue de agentes: cada vez más empresas utilizan agentes en escenarios internos y externos, lo que impulsa a la infraestructura en la nube a rediseñarse para el tráfico de máquinas, y a su vez, la mejora de la infraestructura reduce aún más los costos y las barreras de despliegue de agentes.