Justo cuando OpenAI parecía haber dado un golpe sobre la mesa en el sector de los chatbots, la industria de la IA china -que, recordemos, lleva tiempo intentando ganar la carrera a sus rivales estadounidenses- ha contestado lanzando DeepSeek-V3, un modelo de lenguaje que no solo promete superar a gigantes como ChatGPT, sino que también ha sorprendido a la comunidad tecnológica por el bajo costo de su desarrollo y entrenamiento.
DeepSeek: de las finanzas a la computación
DeepSeek proviene de una fuente poco convencional: High-Flyer Capital Management, un fondo de inversiones que ha dominado el sector financiero chino desde su creación en 2015. Con activos gestionados de aproximadamente 8.000 millones de dólares, High-Flyer viene utilizando IA y algoritmos para identificar patrones que afectan los precios de las acciones.
Esta experiencia ha sido la base para desarrollar ahora un modelo de IA que ha captado la atención de los expertos: diversos tests ya posicionaban a DeepSeek-V2 entre los mejores modelos de lenguaje a nivel mundial. Investigadores de la Universidad de Waterloo (Canadá) lo clasificaron dentro de los diez mejores modelos, solo por detrás de GPT-4 de OpenAI, Claude de Anthropic y de su rival chino 01.AI.
La compañía ha invertido cerca de 25,42 millones de euros en su primer clúster de computación y está destinando aproximadamente 127,1 millones de euros para la construcción de un segundo clúster que ocupa un área similar al tamaño de un campo de fútbol: conecta más de 10.000 procesadores Nvidia de última generación, proporcionando la potencia …