Ah então em resumo eles fazem destilação doque ja foi produzido a partir do roubo inicial pra produzir mais infinitamente? Não quero nem imaginar o nivel de distorção de informação que vai ser o final dessa corda
O DeepSeek pegou alguns modelos q já foram treinados, como o LLaMa e o Qwen, e destilaram ele no sentido de torná-lo mais compacto e menos comedor de CPU/Memória.
Mas o LLaMa já foi treinado (pelo q li, Meta usou até torrent no treinamento).
Então esse conteúdo q existe no LLaMa existe no DS tbm.
Comments
É ✨ MENTIRA ✨ o que ele diz.
Não vai matar "a indústria", vai matar especificamente o ChatGPT e seus correlatos.
Só q o DP faz destilação do que já foi roubado, é tipo roubar do ladrão. 100 anos de perdão? Kkkk
Mas o LLaMa já foi treinado (pelo q li, Meta usou até torrent no treinamento).
Então esse conteúdo q existe no LLaMa existe no DS tbm.