La gente tiene mala memoria, Mistral, una start-up francesa, tiene modelos muy buenos equivalentes a OpenAI, como no tiene ni una milesima parte de dinero, no puede hacer el grandisimo marketing que hacen desde Silicon Valley. La "sorpresa" de DeepSeek ha sido la relacion de coste-calidad.
En este caso no exactamente, porque en realidad es el resultado de un "entrenamiento" pero han explicado cómo han llegado a ello (algo muy importante para que otros lo hagan de forma similar o que pueda seguir mejorándose) (sigo)
y han dejado el resultado (del entrenamiento del modelo más grande) para que cualquier empresa con ordenadores potentes pueda instalarlo, pero también han creado modelos más pequeños para que casi cualquier ordenador lo pueda instalar y ejecutar aunque con un rendimiento y calidad algo menor
En este vídeo lo explican todo muy bien https://www.youtube.com/watch?v=3nM5R23eGkE de @dotcsv.bsky.social (aunque no tengo claro que la cuenta de bsky sea él oficialmente)
Además de lo que ya te están contestando: cualquiera puede usar el modelo, bajárselo, "ejecutarlo" en su infraestructura y construir su negocio sobre él. Aunque esto ya ocurría con llama o mixtral, Deepseek además es mucho más eficiente (coste) que los mencionados.
No tiene por qué, la IA (LLMs en realidad) es solo uno de los interminables usos que se le pueden dar a un centro de datos. Qué deepseek sea más eficiente tampoc quiere decir que puedas montar una alternativa competitiva a chatgpt en el portàtil de casa.
Comments