La startup de chips acaba de recaudar 135 millones de dólares con una apuesta de que el mayor cuello de botella de la IA no es la informática, sino la memoria.


Cada vez que le haces una pregunta a ChatGPT, tu solicitud desencadena una carrera de retransmisión de datos. La información sale de la memoria, pasa por la CPU para el preprocesamiento, pasa a la GPU para realizar cálculos pesados ​​y luego regresa, y todo el viaje se repite para cada palabra que produce la IA.

El cuello de botella es estructural: significa pasar por algunos de los chips más caros y que consumen más energía de la industria en cada solicitud. La ineficiencia es lo que realmente ocurre. XCENAuna startup con oficinas en Corea del Sur y América, está intentando solucionarlo. La startup de cuatro años ha diseñado un chip que acerca las capacidades informáticas a la DRAM (chips de memoria rápidos y de corto plazo que almacenan datos utilizados activamente por el procesador), permitiendo que las operaciones de datos de rutina se manejen cerca de la memoria, sin costosos viajes de ida y vuelta entre la CPU, la GPU y la memoria.

Si esto funciona a escala, el impacto en los costos de la infraestructura de IA podría ser enorme, lo que explica en gran medida el entusiasmo de los inversores de todo el país. De hecho, XCENA acaba de recaudar 135 millones de dólares en una Serie B con una valoración de 570 millones de dólares, lo que eleva el total recaudado a 185 millones de dólares.

El director ejecutivo de XCENA, Jin Kim, cofundó la startup en 2022 con el CTO Dohun Kim y el CPO Harry Juhyun Kim, todos veteranos de Samsung y SK Hynix, el gigante de la memoria que suministra los chips que alimentan las GPU de Nvidia. “Las CPU y GPU se han vuelto más inteligentes a lo largo de las décadas. La memoria nunca se ha vuelto más inteligente. XCENA quiere cambiar eso”, dijo Kim en una entrevista con TechCrunch. “Los recientes aumentos en los precios de las memorias y las existencias relacionadas indican un cambio más amplio en la infraestructura de IA hacia arquitecturas centradas en la memoria”, añadió. (Este mes, las tres empresas que dominan el mercado mundial de chips de memoria –Samsung, SK Hynix y Micron– alcanzaron cada una valoraciones de billones de dólares por primera vez).

XCENA está apostando su negocio a la tesis de que “la inferencia no es sólo un problema informático; se está convirtiendo cada vez más en un problema de escalamiento de la memoria”, dijo Kim.

El chip XCENA, el MX1, se conecta a la CPU a través de CXL (Compute Express Link), esencialmente una ruta rápida dedicada entre el procesador y la memoria, procesando datos antes de que tengan que salir del módulo de memoria. Lleva la informática a los datos, y no al revés. La compañía afirma que lo que antes requería 10 servidores potencialmente puede ejecutarse en un solo servidor.

“Si bien las GPU se destacan en la multiplicación de matrices (las matemáticas pesadas detrás del entrenamiento de modelos de IA), la mayor parte de la orquestación de datos a su alrededor, incluido el preprocesamiento, la administración de caché KV (un sistema que almacena el contexto conversacional anterior para que el modelo no tenga que reprocesarlo) y el almacenamiento en caché de datos, aún se ejecuta en la CPU. Nuestros chips manejan esas tareas directamente dentro del módulo de memoria”, dijo Kim.

La demanda de soluciones de memoria ha aumentado desde la segunda mitad del año pasado y la compañía cree que es el momento adecuado para ello.

Las conversaciones con varios proveedores globales de memoria aún se encuentran en las primeras etapas, aunque Kim se negó a nombrarlos. Los clientes ideales de la empresa son hiperescaladores que gastan decenas de miles de millones al año en infraestructura de IA, donde pequeñas mejoras en la eficiencia de la memoria pueden significar cientos de millones en ahorros.

El MX1 sigue siendo un prototipo. Está previsto que los chips de producción en masa salgan de las líneas de fundición de Samsung a finales de 2026, y la compañía espera generar ingresos a partir de 2027.

Mientras que los fabricantes de unidades de procesamiento neuronal (NPU) compiten para desafiar a Nvidia en cargas de trabajo de entrenamiento, XCENA apunta a la capa de memoria intensiva que se encuentra debajo de todo.

Los rivales más cercanos de XCENA incluyen Astera Labs y Marvell, ambas empresas que cotizan en Nasdaq y que trabajan en conectividad de memoria de próxima generación. Marvell es un actor importante y establecido que ya trabaja en el mismo campo, dijo Kim, y agregó que el diferenciador radica en la propiedad intelectual. “Tenemos miles de núcleos”, dijo Kim. Basado en especificaciones públicas, el enfoque de Marvell se basa en varios núcleos de propósito general para comparar.

El núcleo se basa en RISC-V, un modelo de diseño de chip de código abierto, y está optimizado específicamente para el procesamiento de datos., con cada núcleo intencionalmente mantenido pequeño y eficiente. Más allá del propio núcleo, XCENA diseñó su propia jerarquía de memoria interna, buses de interconexión y controladores DRAM, un nivel de integración vertical que la mayoría de las empresas de chips, incluidos los competidores más grandes, suelen subcontratar.

Las firmas de capital riesgo con sede en Seúl Altinum e IMM Investment lideraron conjuntamente la ronda Serie B, junto con Corstone Asia y los inversores existentes SBI Investment y Mirae Asset Capital. La empresa, que cuenta con más de 90 empleados en oficinas en Pangyo, un centro tecnológico en las afueras de Seúl, y en Sunnyvale, también está en conversaciones con inversores internacionales sobre financiación adicional.

Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



Source link