DeepSeek lança novo modelo de IA com suporte para chips chineses
Atualização do modelo V3.1 da DeepSeek foca em otimização para chips chineses e oferece processamento mais ágil. Mudanças ocorrem em um contexto de crescente independência tecnológica da China frente às restrições dos EUA.
DeepSeek, uma startup chinesa de inteligência artificial, lançou em 21 de setembro a atualização do seu modelo principal, o V3.
Este modelo apresenta um recurso que otimiza sua compatibilidade com chips fabricados na China e promete maior velocidade de processamento.
A atualização reflete o foco da empresa em fortalecer a tecnologia doméstica em meio às restrições de exportação dos EUA.
Em 2023, a DeepSeek já havia provocado impacto no mercado ao lançar modelos que competem com soluções ocidentais, como o ChatGPT da OpenAI, oferecendo custos operacionais mais baixos.
A atualização do modelo V3 segue outras melhorias recentes: uma no R1 em maio e uma no V3 em março.
O modelo DeepSeek-V3.1 agora está otimizado para chips domésticos de próxima geração, conforme anunciado em sua postagem no WeChat.
A empresa não divulga quais modelos de chip específicos serão suportados. O formato FP8 (ponto flutuante de 8 bits) permite operações mais eficientes em comparação aos métodos tradicionais.
A nova versão apresenta uma estrutura de inferência híbrida, com modos de raciocínio e não raciocínio, acessível aos usuários através de um botão de "pensamento profundo" no aplicativo e na plataforma web.
Além disso, a empresa planeja ajustar os custos para o uso da API do modelo a partir de 6 de setembro.