A pesar de los esfuerzos que está haciendo AMD en el mundo de los aceleradores para IA con su serie Instinct el dominio de NVIDIA no ha cambiado. AMD no está haciendo nada malo con el hardware, porque sobre el papel la Instinct MI300X muestra unos números muy buenos con una potencia de 1.307 TFLOPs en FP16 y tiene un total de 192 GB de memoria HBM3.
La solución de AMD también promete reducir el coste de propiedad comparando con las soluciones de NVIDIA, que son mucho más caras. Si son tan buenas sobre el papel, ¿por qué no están teniendo un mayor éxito? El problema está en el software, y es que el ecosistema de software de AMD para la IA necesita de un esfuerzo importante para poder ser utilizado de forma efectiva.
SemiAnalysis, que es la fuente original de la información, dijo que tenía que depender mucho también de los ingenieros de AMD para arreglar fallos y problemas de forma continuada durante su proceso de prueba y medición de rendimiento.
Esto es muy distinto de lo que ocurre con las alternativas de NVIDIA, que tienen una mejor integración hardware-software, y suelen funcionar a la perfección nada más sacarlas de la caja, sin necesidad de tener ningún tipo de asistencia por parte de NVIDIA, y sin que requieran de ningún tipo de trabajo duro para poder dar su máximo rendimiento.
La propia Lisa Su ha reconocido estos problemas en una entrevista, se está tomando todo esto muy en serio y ha asegurado que introducirán los cambios necesarios para mejorar. Es un tema muy grave, porque no es solo que el software esté muy inmaduro, sino que además es necesario cambiar la manera en la que están llevando a cabo los desarrollos.