La infraestructura de la nube se ha diseñado desde hace mucho tiempo para facilitar a los humanos la búsqueda, el clic, el desplazamiento y la transmisión de contenido de forma estable y predecible. Los agentes de IA se comportan de manera diferente. Pueden lanzar eventos enormes, generando múltiples subagentes que consultan cientos de bases de datos, buscan documentos y llaman a API en cuestión de segundos y luego desaparecen tan pronto como llegan.
Con base en esa premisa, Amazon está rediseñando partes centrales de su infraestructura en la nube. El jueves, AWS lanza la próxima generación de OpenSearch ServerlessBases de datos vectoriales y de búsqueda totalmente administradas, esencialmente sistemas para almacenar y recuperar información a escala, diseñadas específicamente para cargas de trabajo de agentes. AWS dice que el nuevo sistema puede ampliarse inmediatamente cuando un agente activa una tarea y volver a cero cuando no hay actividad.
El lanzamiento refleja una creciente comprensión en la industria tecnológica: la infraestructura originalmente diseñada para una Internet impulsada por humanos no funciona bien en un mundo cada vez más poblado por agentes.
Aunque los agentes de IA todavía representan una pequeña porción de la actividad en Internet, el tráfico generado por máquinas ya es significativo y está a punto de crecer. Cloudflare dijo que los bots representaron el 31% del tráfico HTTP total durante los últimos seis meses. Los rastreadores de IA, los motores de búsqueda y los asistentes representaron aproximadamente una cuarta parte de todas las solicitudes de bots durante el período.
“El tráfico no humano superará al tráfico humano en el primer semestre de 2027”, dijo Lai Yi OhlsenGerente senior de productos en Cloudflare, dijo a TechCrunch.
En la conferencia de desarrolladores I/O de Google la semana pasada, la compañía dijo que los usuarios podrán comenzar a delegar tareas a sistemas de inteligencia artificial, como investigar compras, reservar viajes, navegar por la web e interactuar con aplicaciones. Pero la responsabilidad no se limita a los agentes de IA centrados en el consumidor. Cada vez más empresas están implementando agentes internamente y para sus clientes, creando un nuevo tipo de tráfico generado por máquinas entre bastidores.
Como resultado, los proveedores de nube y las empresas de infraestructura deben considerar cómo adaptar los sistemas creados para humanos a un mundo de agentes que recuperan información de forma continua y autónoma, utilizan herramientas y generan tráfico de máquina a máquina.
Aquí es donde entra en juego el nuevo OpenSearch Serverless de AWS.
“El momento no podría ser mejor. Los agentes están pasando de la experimentación a la producción y están creando patrones de tráfico para los que la infraestructura heredada no fue diseñada”, dijo a TechCrunch Tia White, gerente general de Amazon OpenSearch Service. “Se disparan sin previo aviso, inactivos sin previo aviso, y las empresas necesitan una navegación continua sin tener que pagar por una informática inactiva o inactiva”.
El cambio técnico clave en esta nueva generación es que desacopla la computación del almacenamiento, lo que permite que la computación aumente en segundos para adaptarse a los picos en el tráfico de agentes y se reduzca a cero, de modo que los clientes paguen $0 cuando los agentes están inactivos.
“Anteriormente, incluso en nuestras versiones anteriores de Serverless, era necesario tener al menos una instancia en funcionamiento porque se combinaban el almacenamiento y la computación”, dijo White. “No se puede activar (computar) automáticamente según sea necesario, por lo que siempre se tiene un cómputo inactivo reservado para sus cargas de trabajo, ya sea que lo use o no”.
Piense en ello como si pagara siempre por una plaza de aparcamiento, incluso cuando no la esté utilizando. Con la ampliación de AWS Serverless, es más como pagar por un lugar de estacionamiento medido.
En el lanzamiento, OpenSearch Serverless se integrará de forma nativa con plataformas de desarrollo de inteligencia artificial como Vercel y Kiro, para que los desarrolladores puedan implementar motores de búsqueda y vectores listos para producción para agentes sin administrar la infraestructura.
Este cambio está ocurriendo en la industria de la nube. Databricks y Snowflake se están reposicionando como sistemas empresariales de captura de datos y memoria de IA. Microsoft lo ha lanzado actualizar a Azure diseñado para manejar ráfagas de agentes de IA y el intercambio de memoria entre agentes. Cloudflare, similar a Amazon, el mes pasado se presentó infraestructura que tiene como objetivo proporcionar a los agentes un entorno persistente y escalabilidad instantánea.
A medida que más empresas implementan agentes de IA, mayor será la presión para rediseñar la infraestructura en torno a cargas de trabajo generadas por máquinas, lo que a su vez podría hacer que los agentes sean más baratos y fáciles de implementar a mayor escala.
Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.


