DeepSeek V4: O modelo chinês que desafiou o Vale do Silício de novo

Baleia digital futurista nadando em oceano de dados com cubo V4 e gráficos de desempenho em alta.A evolução da inteligência artificial representada em um oceano digital de dados.

A startup chinesa DeepSeek, que em janeiro de 2025 derreteu US$ 1 trilhão em valor de mercado das big techs americanas com um modelo de baixo custo, voltou a sacudir o tabuleiro global da inteligência artificial. Na madrugada desta quinta-feira (24), a empresa lançou o DeepSeek V4, a nova geração do seu modelo de IA generativa de código aberto — e ele chega rodando nativamente em chips da Huawei, num movimento que escancara a corrida pela autossuficiência tecnológica da China.

Dois modelos, duas propostas

O DeepSeek V4 chega em duas versões com a arquitetura Mixture-of-Experts (MoE): a V4-Pro, com 1,6 trilhão de parâmetros totais e 49 bilhões ativados por tarefa, e a V4-Flash, mais enxuta, com 284 bilhões de parâmetros e 13 bilhões ativados — ambas com janela de contexto de 1 milhão de tokens, o equivalente a processar “O Problema dos Três Corpos” inteiro de uma vez.

O pulo do gato técnico

A grande inovação está na arquitetura de atenção híbrida, que combina CSA (Compressed Sparse Attention) e HCA (Heavily Compressed Attention). Na prática, isso comprime o “raciocínio” do modelo: num contexto de 1 milhão de tokens, o V4-Pro consome apenas 27% dos FLOPs de inferência e 10% do cache KV em comparação com o V3.2 anterior.

Preço de banana (de novo)

A DeepSeek mantém a estratégia de preços agressivos. O V4-Flash custa 1 yuan por milhão de tokens de entrada (cerca de US$ 0,14) e 2 yuans na saída — com cache habilitado, o preço cai para 0,2 yuan. Já o V4-Pro sai por 12 yuans na entrada e 24 na saída. Para comparação, o GPT-5.5 da OpenAI custa US$ 5,00 por milhão de tokens de entrada e US$ 30,00 na saída — ou seja, o modelo chinês chega a ser até 6 vezes mais barato que os concorrentes americanos.

A grande novidade: Huawei no lugar da NVIDIA

O DeepSeek V4 foi adaptado para rodar nos chips Ascend da Huawei — especificamente nos modelos A2, A3 e nos novos Ascend 950PR e 950DT. A Huawei anunciou suporte “dia zero”, e um novo acelerador promete performance até 3 vezes superior à da NVIDIA H20 no mercado chinês.

Há, no entanto, uma limitação: a própria DeepSeek admite que o V4-Pro terá “problemas de vazão” (throughput) até o segundo semestre, quando os supernós Ascend 950PR começarem a ser produzidos em escala. Por enquanto, as GPUs NVIDIA ainda são usadas no treinamento, mas na inferência os chips chineses já dão conta do recado — e a previsão da McKinsey é que a demanda por inferência ultrapasse a de treinamento globalmente até 2030.

Performance: chegando perto dos líderes

Em benchmarks de conhecimento mundial, o V4-Pro fica atrás apenas do Gemini-Pro-3.1 do Google entre os modelos fechados, superando todos os demais modelos de código aberto. Em tarefas de código e raciocínio, alcança o nível dos melhores sistemas proprietários. O VentureBeat classificou o lançamento como o “segundo momento DeepSeek” e destacou que o modelo entrega inteligência quase de ponta por cerca de 1/6 do custo dos concorrentes.

O que você pode fazer agora

  • O chat gratuito está disponível no site e app oficial, com o V4-Pro rodando sem necessidade de cartão de crédito.
  • Os pesos estão no Hugging Face com licença MIT — a mais permissiva da indústria, permitindo uso comercial, modificação e redistribuição sem royalties.
  • Alibaba Cloud já integrou os modelos na plataforma Bailian, com os mesmos preços da API oficial.
  • A API é compatível com os padrões OpenAI e Anthropic: basta trocar o model_name para deepseek-v4-pro ou deepseek-v4-flash.

Em resumo: o DeepSeek V4 não é só mais um modelo — é um manifesto. Código aberto, preço baixo, independência de hardware americano. Enquanto EUA e China disputam cada centímetro na guerra tecnológica, modelos como este estão acelerando a chegada de agentes de IA que realizam tarefas sozinhos. A pergunta que fica é: quanto tempo até esse nível de IA caber no seu bolso?