DeepSeek lança modelos de IA V4-Pro e V4-Flash com foco em open-source

Compartilhe:

A startup chinesa DeepSeek lançou versões preview de seus novos modelos de inteligência artificial de ponta, DeepSeek-V4-Pro e DeepSeek-V4-Flash, um ano após seu modelo anterior causar impacto no setor de tecnologia global. A empresa descreveu as atualizações como a plataforma open-source mais poderosa disponível, com desempenho competitivo em relação a rivais como OpenAI, Anthropic e Google. As inovações incluem avanços em raciocínio, tarefas agenticas e eficiência de processamento de textos longos.

Lançamento e Contexto Histórico

A DeepSeek, sediada em Hangzhou, divulgou os modelos V4 na sexta-feira, marcando seu retorno significativo desde o DeepSeek-R1, lançado em janeiro do ano anterior segundo uma fonte, ou em janeiro de 2025 conforme outra. O R1 surpreendeu o setor com capacidades comparáveis às do ChatGPT e Gemini, treinado com menos de 6 milhões de dólares em custos computacionais, o que atraiu elogios como o “momento Sputnik da IA” de Marc Andreessen, investidor de Silicon Valley. No entanto, analistas questionaram a narrativa de recursos limitados, sugerindo acesso a financiamento e chips mais avançados do que admitido, enquanto o lançamento gerou restrições em países como estados dos EUA, Austrália, Taiwan, Coreia do Sul, Dinamarca e Itália por preocupações com privacidade e segurança nacional.

Desempenho e Benchmarks

Os modelos V4-Pro e V4-Flash destacam-se em benchmarks de codificação, matemática e conhecimento geral, superando todos os rivais open-source e ficando próximos de modelos fechados. O V4-Pro lidera em tarefas de codificação e matemática, trailing apenas o Gemini 3.1-Pro do Google em conhecimento mundial, e fica “marginalmente atrás” do GPT-5.4 da OpenAI e do Gemini 3.1-Pro, com um atraso estimado de 3 a 6 meses em relação aos modelos de fronteira. Comparado a opções como Claude-Opus-4.6 da Anthropic, Qwen-3.5 da Alibaba e GLM-5.1 da Z.ai, o V4 excede em codificação, matemática e problemas STEM, com otimizações para frameworks agenticos como Claude Code, OpenClaw e CodeBuddy; uma pesquisa interna com 85 desenvolvedores indicou que mais de 90% incluem o V4-Pro entre suas escolhas principais para codificação.

Inovações Técnicas

As versões incorporam atualizações arquiteturais, incluindo a Hybrid Attention Architecture, que melhora a retenção de consultas em conversas longas ao comprimir informações antigas e priorizar partes relevantes, reduzindo o uso de computação em 27% para o V4-Pro e 10% para o V4-Flash em contextos de 1 milhão de tokens. Essa janela de contexto permite processar codebases inteiras ou documentos extensos em um único prompt, equiparando-se a ofertas de Gemini e Claude, e representa um avanço em eficiência de memória explorado em papers anteriores da DeepSeek. O V4-Flash mantém raciocínio similar ao Pro, mas com respostas mais rápidas, enquanto ambos exibem modos de raciocínio que decompõem prompts passo a passo.

Preços e Acessibilidade

Disponíveis no site e app da DeepSeek, com API para desenvolvedores, os modelos são open-source, permitindo download, uso e modificação. O V4-Pro custa 1,74 dólar por milhão de tokens de entrada e 3,48 dólares por saída, enquanto o V4-Flash é mais acessível, a 0,14 dólar por entrada e 0,28 dólar por saída, posicionando-o como uma das opções de topo mais baratas. Esses preços representam uma fração dos rivais como OpenAI e Anthropic, beneficiando desenvolvedores e empresas em aplicações de codificação ou análise de grandes volumes de dados.

Aspectos Geopolíticos e Hardware

O lançamento reflete a disputa por supremacia em IA entre EUA e China, com o Stanford AI Index 2026 indicando que empresas chinesas “fecharam efetivamente” a lacuna de desempenho, liderando em volume de publicações, citações, patentes e instalações de robôs industriais, apesar da vantagem americana em modelos de elite e patentes de alto impacto. Otimizado para chips domésticos como o Ascend da Huawei, o V4 evita acesso precoce a Nvidia e AMD, usando esses para inferência, embora o treinamento possa ter sido parcial em chips chineses; fontes anônimas notam que chips locais superam em inferência, mas ainda trailing Nvidia em desempenho geral. Autoridades chinesas pressionam por integração de hardware nacional via quotas e restrições a importações desde 2022, e os preços do V4-Pro podem cair com o envio em escala do Ascend 950 no segundo semestre deste ano, conforme relatório técnico da DeepSeek divulgado no Hugging Face.

Artigos relacionados

Assine nossa newsletter e receba novidades em seu e-mail: