DeepSeek lidera la potencia de los programas de Inteligencia Artificial
DeepSeek se encuentra actualmente en la cima de la potencia de los programas de Inteligencia Artificial gracias a un desarrollo más pulido y concienzudo que el de sus rivales. La desarrolladora china ha demostrado que no hace falta más potencia, sino una mayor depuración en el modo de trabajar.
Donald Trump, presidente de los Estados Unidos, ha lanzado su ambicioso plan para dominar el futuro de la IA. El Proyecto Stargate de 500,000 millones de dólares es una apuesta increíblemente ambiciosa por hacerse con el mercado. Pero ahora, una IA de China parece haber puesto en entredicho el planteamiento de una política de la que se cree que podría colapsar antes de comenzar a echar a andar. Y es que, de acuerdo con Wired, esta IA hace todo con el mismo rendimiento, pero con una fracción de su coste.
¿Qué es DeepSeek?
Las comparativas son odiosas, pero en este benchmark se puede ver perfectamente la cercanía entre ambos modelos de lenguaje. DeepSeek es una IA o modelo de lenguaje de origen chino y de código abierto que ha saltado a la palestra recientemente por su increíble capacidad para igualar a OpenAI y su modelo más potente, GPT-4, pero con una pequeñísima fracción de su gasto.
La idea surgió de un fondo de cobertura chino y está dirigida por Liang Wenfeng, su fundador, que ha enfocado los recursos en desarrollar una inteligencia artificial general con la calidad en mente en lugar de la velocidad para comercializarla. Esto es muy interesante, porque ha preferido ir más lento en la carrera por alcanzar la supuesta inteligencia artificial general (AGI), pero hacerla mucho más fiable para los usuarios y con un enfoque más colaborativo.
Uno de sus puntos fuertes es que es parcialmente de código abierto en todos sus modelos, lo que permite entender cómo funciona y cuáles son los puntos que podrían ayudar a potenciarla.
https://chat.deepseek.com/
El enfoque de eficiencia frente a la potencia bruta
Hasta ahora, el objetivo de la mayoría de las IAs era hacerlo todo más grande para así tener más potencia y poder analizarlo todo de una forma mucho más eficiente. Sin embargo, Estados Unidos vetó a China del hardware necesario para llevar a su IA a un nuevo nivel, o esa era la intención. Realmente, han conseguido hacer que la IA sea más eficiente.
Desde 2022, China no tiene acceso a chips avanzados con tecnología propietaria de EE. UU., lo que hizo que se vieran obligados a optimizar sus métodos de entrenamiento para llevarlos a un nuevo nivel.
El equipo de desarrollo, lleno de jóvenes talentos recién salidos de universidades técnicas en Pekín o Tsinghua, ha hecho lo que a priori parecía imposible: batir de la nada a Estados Unidos con un enfoque de código abierto y con la capacidad de ser más eficiente en su uso. Y es que solo costaría un 5% del precio total de las soluciones de IA que ofrece OpenAI.
Un cambio de paradigma en la IA
Hasta ahora, las IAs chinas se habían quedado rezagadas respecto al potencial de Estados Unidos, pero parece que esto ha cambiado con el lanzamiento de la versión R1 de DeepSeek. Para ello, utilizaron sistemas con esquemas de comunicación personalizados entre chips para que los modelos consumieran mucho menos recursos. Las tecnologías clave para esto han sido la Multi-head Latent Attention (MLA) y la Mixture-of-Experts.
Aunque pueda parecer baladí, DeepSeek es un golpe sobre la mesa que demuestra que la IA puede dar mucho de sí sin esa potencia bruta desenfrenada que se ha tratado de vender como algo inevitable en la carrera por tener el modelo más potente.