Muchos habían dado por hecho que los avances de rendimiento mostrados por DeepSeek se basaban en el uso del estándar CUDA (Compute Unified Device Architecture) de NVIDIA, pero los ingenieros de la compañía han optado por prescindir del mismo y utilizar en su lugar PTX (Parallel Thread Execution), un lenguaje de bajo nivel que se asemeja al ensamblador.
Este enfoque ha sido clave para el éxito de sus últimos modelos de IA, ya que ha permitido que funcionen de manera altamente eficiente a pesar de las restricciones impuestas por las sanciones internacionales a las empresas chinas, que han limitado el acceso a las GPUs más avanzadas de NVIDIA, como la H100.
Adiós, CUDA. Hola, PTX
CUDA ha sido el estándar de facto en el desarrollo de software para sus GPUs durante años. Esta herramienta aglutina un compilador y un conjunto de herramientas de desarrollo que permiten a los programadores interactuar fácilmente con el hardware de las GPUs de NVIDIA, facilitando la creación de modelos de IA potentes y escalables.
En contraste, PTX es un lenguaje de bajo nivel (desarrollado también por NVIDIA) que facilita usar de forma más eficiente los recursos, pero que al ser más cercano al ensamblador, requiere un conocimiento más profundo y habilidades más avanzadas para aprovechar todo su potencial.
En Genbeta
"No creo que haya nada mágico aquí": los expertos explican cómo DeepSeek ha revolucionado partes de la IA que no se creían posibles
…