DeepSeek atrasou lançamento de novo modelo de IA por falha em chip chinês, diz FT
DeepSeek enfrenta dificuldades no treinamento de seu novo modelo de IA, destacando os desafios da autonomia tecnológica chinesa. O adiamento do R2 expõe a dependência da empresa em relação aos chips da Nvidia, apesar das pressões governamentais para usar soluções locais.
DeepSeek, uma empresa chinesa, adiou o lançamento de seu novo modelo de inteligência artificial devido a dificuldades em treiná-lo com chips da Huawei.
Segundo o Financial Times, a start-up não conseguiu completar o treinamento do modelo R2, inicialmente programado para maio, sendo forçada a usar chips Nvidia para treinamento e Huawei apenas para inferência.
Essa situação destaca as limitações da tecnologia chinesa frente à americana, revelando desafios na busca por autossuficiência tecnológica em Pequim.
Apesar do suporte de engenheiros da Huawei, o treinamento com o processador Ascend não teve sucesso. O fundador, Liang Wenfeng, expressou insatisfação com o progresso do R2 e pediu mais tempo para aprimorar o modelo.
A expectativa é que o R2 seja lançado nas próximas semanas.
Além disso, fontes disseram que os chips chineses enfrentam problemas de estabilidade, conectividade e software em comparação a produtos da Nvidia.
Recentemente, a Nvidia concordou em repassar 15% de suas receitas na China ao governo dos EUA para retomar as vendas de chips H20.