Esta temporada de resultados, el coste de la IA empezó a aparecer en las cifras. Meta, comprar, Spotifyy Pinterest todos señalaron el aumento de los costos de inferencia e inteligencia artificial como un lastre para los márgenes. Shopify dijo que las economías de escala fueron “parcialmente compensadas por mayores costos de LLM”.
Esta es la factura que se avecina por el modelo de precios que sustenta las valoraciones esperadas de las OPI de OpenAI y Anthropic, ambas proyectadas por encima de los 800 mil millones de dólares. Esas cifras suponen que OpenAI y Anthropic mantendrán su participación de mercado y su poder de fijación de precios: que los competidores no podrán alcanzarlos fácilmente y que los clientes empresariales seguirán pagando una prima porque no existe una alternativa real.
Pero los datos apuntan cada vez más en sentido contrario. La IA de vanguardia se está volviendo abundante y barata. Los laboratorios chinos cobran una fracción de lo que cobran los laboratorios estadounidenses por trabajos comparables, mientras una oleada de rivales occidentales… NVIDIACohere, Reflection, Mistral están construyendo alternativas más baratas, más pequeñas y más eficientes para empresas que no tocarán el modelo chino. Para cuando OpenAI y Anthropic presenten sus prospectos, y la presentación confidencial de OpenAI llegará esta semana, es posible que la premisa central de sus valoraciones ya haya desaparecido.
La brecha de costos es amplia y cada vez mayor. Los presupuestos de IA empresarial se han disparado. Alrededor del 45% de las empresas encuestadas por la firma de costos de la nube CloudZero dijeron que gastaron más de 100.000 dólares al mes en IA en 2025, frente al 20% del año anterior. Cada vez es más importante dónde va ese dinero. La empresa de evaluación comparativa de IA, Artificial Analysis, ejecuta todos los modelos principales a través de las mismas 10 evaluaciones y realiza un seguimiento del costo total. Para el modelo más capaz de cada laboratorio: Claude de Anthropic obtuvo un precio de 4.811 dólares. ChatGPT de OpenAI: 3.357 dólares. Búsqueda profunda: 1.071 dólares. Kimi: $948. GLM de Zhipu: $544. Claude es casi nueve veces más caro que la alternativa china más barata para la misma carga de trabajo.
Incluso Google está presentando el caso. En su conferencia de desarrolladores de E/S esta semana, el CEO Sundar Pichai dijo que “muchas empresas ya están gastando sus presupuestos anuales de tokens, y apenas estamos en mayo”, y presentó el modelo Flash más barato de la compañía como la respuesta. Si los mayores clientes de Google Cloud cambiaran el 80% de sus cargas de trabajo de los modelos fronterizos a Gemini 3.5 Flash, dijo Pichai, se ahorrarían más de mil millones de dólares al año. La empresa reconoce que las empresas necesitan opciones más económicas.
Y las alternativas baratas ya no se quedan atrás. DeepSeek, el laboratorio chino de inteligencia artificial cuyo modelo desencadenó una venta masiva de tecnología en EE. UU. el año pasado, lanzó el mes pasado una vista previa de su modelo de próxima generación que iguala o casi iguala lo último de OpenAI, Anthropic y Google en materia de codificación, agentes y puntos de referencia de conocimiento. Los modelos de otros laboratorios chinos, incluidos Moonshot, Xiaomi y Zhipu, se han enviado a niveles de capacidad similares en los últimos cuatro meses.
El director ejecutivo de Databricks, Ali Ghodsi, tiene una visión en tiempo real del cambio. La puerta de enlace de IA de la compañía se encuentra entre miles de clientes empresariales y los modelos que utilizan, y Ghodsi dijo que los ingresos de ese producto están aumentando considerablemente.
La técnica que están implementando las empresas, afirmó, se llama “modelo de asesor”. Un modelo económico de código abierto maneja la mayor parte del trabajo de forma predeterminada. Cuando realiza una tarea que no puede resolver, se le proporciona una herramienta que le permite pedir ayuda a un modelo de frontera de OpenAI o Anthropic.
“De esta manera se pueden reducir muy bien los costos”, afirmó Ghodsi.
La velocidad del cambio es sorprendente. En OpenRouter, un mercado que permite a los desarrolladores acceder a cientos de modelos de IA a través de una única interfaz, los modelos chinos pasaron de aproximadamente el 1% de uso en 2024 a más del 60% en mayo.
Y los proveedores están empezando a vender la reducción de costos como un producto. figura El director ejecutivo Dylan Field dijo que las empresas están pasando por tres fases en la adopción de la IA: primero, nadie la usa; en segundo lugar, todo el mundo tiene que hacerlo, con algunas “literalmente organizando competiciones sobre quién puede gastar más en tokens”. Y en tercer lugar está la comprensión de que “todo el mundo está gastando demasiado” y tiene que recortar. Muchas empresas, afirmó, están entrando ahora en esa tercera fase. Figma vende funciones que reducen el consumo de tokens de los clientes entre un 20 y un 30%.
Estados Unidos contra China
La diferencia de costos refleja cómo se construyen las dos partes. Los laboratorios fronterizos estadounidenses están funcionando con cientos de miles de millones de dólares en gastos de capital, entrenando modelos cada vez más grandes con los chips más caros que vende Nvidia, dentro de una red eléctrica estadounidense que no puede agregar capacidad lo suficientemente rápido. Esos costos se trasladan a los clientes. Para los laboratorios chinos, la restricción se ha convertido en la estrategia. Al trabajar bajo restricciones de exportación de chips, se han visto obligados a optimizar agresivamente: entrenando modelos competitivos con menos computación y ejecutándolos de manera más eficiente.
La mejor defensa de los laboratorios estadounidenses es la confianza. Aidan Gómez, director ejecutivo de Cohere, cuya empresa vende modelos de IA específicamente a bancos, agencias de defensa y otras industrias reguladas, dice que esos compradores no tocarán los modelos chinos independientemente del precio. Los ingresos de Cohere se multiplicaron por seis el año pasado vendiendo exactamente en ese segmento. Pero es una porción relativamente pequeña del mercado empresarial más amplio. Fuera de las industrias reguladas, donde las normas de seguridad y cumplimiento son más laxas, resulta más difícil defender el pago de una prima.
La respuesta estadounidense está tomando forma. Nvidia, la empresa que más se ha beneficiado del auge de la IA, ahora está impulsando públicamente un modelo diferente, lanzando sus propios sistemas de IA que cualquier empresa puede descargar y ejecutar en sus propios servidores, de forma gratuita, como alternativa tanto a las opciones chinas como a los modelos bloqueados de OpenAI y Anthropic. Reflection AI recaudó una valoración de miles de millones de dólares específicamente para construir modelos estadounidenses de código abierto para empresas que desean una alternativa nacional. Ambos están bien capitalizados y apuntan explícitamente a la misma brecha: modelos capaces, más baratos que los de frontera, implementados en infraestructura en la que ya confían las empresas estadounidenses.
Los argumentos en contra de este cambio se han basado en la seguridad nacional. Pero la objeción se está disolviendo en la práctica. Incluso el Instituto de Seguridad de IA del gobierno de EE. UU., que señaló que los modelos DeepSeek estaban rezagados con respecto a los estadounidenses en seguridad y rendimiento, documentó que las descargas han aumentado casi un 1000% desde el lanzamiento de R1 en enero de 2025.
Y la propia Anthropic reconoce la presión. En un documento de política publicado en mayo, la compañía dijo que los modelos estadounidenses están sólo “varios meses por delante” de los chinos, y advirtió que Beijing está “ganando en adopción global en términos de costo”.
OpenAI lo ve de otra manera. Una persona familiarizada con el pensamiento de la compañía dijo que cada lanzamiento de un nuevo modelo de frontera, incluido GPT-5.5 el mes pasado, ha impulsado un aumento en el uso de API y productos, con una demanda empresarial creciendo en lo que describieron como un “muro vertical”. El código abierto tiene un papel en tareas de bajo riesgo, dijo esta persona, pero no afecta el negocio principal de la empresa. La presión sobre los precios no está entre las diez principales preocupaciones de la empresa.
Pero un director ejecutivo de IA empresarial, que pidió no ser identificado para proteger las relaciones con los clientes, ofreció una lectura diferente. El crecimiento es real, “pero se expandiría aún más rápido en la frontera si no se utilizara esta técnica”.
Este es el mercado que se espera que OpenAI y Anthropic pidan a los inversores públicos que valoren. Con valoraciones de casi billones de dólares cada una, el S-1 tiene que mostrar un crecimiento y una concentración de los ingresos empresariales que justifiquen el múltiplo. Pero la prima que justifica la valoración se está erosionando más rápidamente exactamente en los segmentos que los laboratorios necesitan dominar.
MIRAR: OpenAI se prepara para la presentación confidencial de una oferta pública inicial (IPO)



