DeepSeek: Ascensão do Chatbot Chinês Desafia IA Global

Blog
Artigos Relacionados

📚 Continue Lendo

Mais artigos do nosso blog

A aplicação de chatbot **DeepSeek** registrou um crescimento meteórico esta semana, dominando as paradas de download da Apple App Store e Google Play. Modelos de inteligência artificial desenvolvidos pelo laboratório chinês DeepSeek, notáveis por suas técnicas de treinamento eficientes em termos computacionais, têm gerado discussões entre analistas de Wall Street e tecnólogos. O principal questionamento reside na capacidade dos Estados Unidos de manter sua liderança na corrida global pela IA e na sustentabilidade da demanda por chips dedicados a essa tecnologia.

A ascensão rápida da DeepSeek ao reconhecimento internacional levanta questionamentos sobre suas origens e estratégias que impulsionaram tal notoriedade.

DeepSeek: Ascensão do Chatbot Chinês Desafia IA Global

A empresa tem como principal apoiador a High-Flyer Capital Management, um fundo de hedge quantitativo chinês que emprega a inteligência artificial para subsidiar suas decisões de trading. Em 2015, Liang Wenfeng, entusiasta de IA, foi um dos fundadores da High-Flyer. Wenfeng, que teria iniciado suas atividades de trading ainda como estudante na Universidade de Zhejiang, lançou a High-Flyer Capital Management como um fundo de hedge em 2019, focando no desenvolvimento e implantação de algoritmos de inteligência artificial.

Em 2023, a High-Flyer iniciou a DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, atuando separadamente de seu negócio financeiro principal. Com a High-Flyer como uma de suas investidoras, o laboratório posteriormente se tornou uma empresa independente, mantendo o nome DeepSeek. Desde o início, a DeepSeek investiu na construção de seus próprios data centers para o treinamento de modelos. Contudo, assim como outras empresas de inteligência artificial na China, a DeepSeek enfrentou restrições devido às proibições de exportação de hardware impostas pelos Estados Unidos. Para treinar um de seus modelos mais recentes, a companhia precisou utilizar chips Nvidia H800, uma versão de menor potência em comparação com o chip H100, que é acessível a empresas norte-americanas.

A equipe técnica da DeepSeek é reconhecida por sua juventude, com a empresa reportedly recrutando agressivamente pesquisadores de IA com doutorado das principais universidades chinesas. A DeepSeek também emprega indivíduos sem formação em ciência da computação para que sua tecnologia possa compreender uma vasta gama de temas, conforme reportado pelo The New York Times. A primeira linha de modelos da DeepSeek, que inclui DeepSeek Coder, DeepSeek LLM e DeepSeek Chat, foi revelada em novembro de 2023. Entretanto, foi somente na primavera de 2024, com o lançamento da família de modelos de próxima geração, DeepSeek-V2, que a indústria de IA realmente começou a prestar atenção.

O DeepSeek-V2, um sistema multifuncional de análise de texto e imagem, obteve desempenho satisfatório em diversos benchmarks de inteligência artificial e apresentou custos operacionais significativamente menores do que modelos similares na época. Essa vantagem competitiva obrigou concorrentes domésticos da DeepSeek, como ByteDance e Alibaba, a reduzirem os preços de uso de alguns de seus modelos e a oferecerem outros gratuitamente. A notoriedade da DeepSeek foi ainda mais ampliada com o lançamento do DeepSeek-V3 em dezembro de 2024.

Segundo testes internos da própria DeepSeek, o DeepSeek V3 supera tanto modelos abertos para download, como o Llama da Meta, quanto modelos proprietários que podem ser acessados apenas via API, a exemplo do GPT-4o da OpenAI. Igualmente impressionante é o modelo de raciocínio DeepSeek R1. Lançado em janeiro de 2025, a DeepSeek afirma que o R1 iguala o desempenho do modelo o1 da OpenAI em benchmarks cruciais. Como um modelo de raciocínio, o R1 verifica autonomamente a consistência de suas próprias informações, auxiliando a evitar falhas que frequentemente afetam outros modelos.

Modelos de raciocínio podem levar mais tempo — geralmente de segundos a minutos — para apresentar soluções em comparação com modelos não-racionais típicos. A vantagem, contudo, é uma maior confiabilidade em domínios como física, ciência e matemática. Contudo, há uma ressalva importante quanto ao R1, DeepSeek V3 e outros modelos da DeepSeek. Por serem tecnologias de inteligência artificial desenvolvidas na China, elas são sujeitas a avaliações e regulamentações do órgão regulador de internet do país. Isso visa assegurar que suas respostas estejam alinhadas com os valores socialistas centrais. Como resultado, na aplicação de chatbot da DeepSeek, por exemplo, o R1 não fornece respostas sobre o episódio da Praça da Paz Celestial (Tiananmen) ou a autonomia de Taiwan.

Em março de 2025, a DeepSeek registrou mais de 16,5 milhões de visitas. Apesar de uma queda de 25% no tráfego diário em comparação com fevereiro, a DeepSeek manteve o segundo lugar no ranking de acessos de março, conforme David Carr, editor da Similarweb, afirmou ao TechCrunch. Este volume, porém, ainda está muito aquém do ChatGPT, que ultrapassou 500 milhões de usuários ativos semanais em março. Em maio de 2025, a DeepSeek lançou uma versão atualizada do seu modelo de raciocínio R1 na plataforma de desenvolvedores Hugging Face.

Em setembro de 2025, a DeepSeek revelou um novo modelo experimental denominado V3.2-exp, projetado para apresentar custos de inferência dramaticamente menores em operações de longo contexto. A empresa precifica seus produtos e serviços bem abaixo do valor de mercado, e alguns são oferecidos gratuitamente. Além disso, apesar de um grande interesse de fundos de capital de risco, a DeepSeek não tem aceitado investimentos. A empresa alega que avanços em eficiência têm possibilitado a manutenção de sua extrema competitividade de custos, embora alguns especialistas contestem as cifras divulgadas pela companhia.

Seja qual for a razão, desenvolvedores têm adotado os modelos da DeepSeek, que, embora não sejam totalmente de código aberto no sentido tradicional, estão disponíveis sob licenças permissivas que autorizam o uso comercial. Clem Delangue, CEO da Hugging Face, uma das plataformas que hospedam os modelos da DeepSeek, revelou que os desenvolvedores criaram mais de 500 modelos derivados do R1, os quais acumularam 2,5 milhões de downloads combinados. A vitória da DeepSeek sobre concorrentes maiores e mais estabelecidos foi rotulada como uma disruptura na inteligência artificial e até mesmo um excesso de propaganda.

O êxito da empresa contribuiu, pelo menos em parte, para a queda de 18% no preço das ações da Nvidia em janeiro e gerou uma reação pública do CEO da OpenAI, Sam Altman. Em março de 2025, agências do Departamento de Comércio dos EUA comunicaram aos seus funcionários que a DeepSeek seria proibida em seus dispositivos governamentais, conforme relatado pela Reuters. Para um aprofundamento sobre a disputa tecnológica entre potências, leia mais em Reuters.

A Microsoft anunciou que a DeepSeek está disponível em seu serviço Azure AI Foundry, a plataforma que reúne serviços de IA para empresas sob uma única bandeira. Questionado sobre o impacto da DeepSeek nos gastos com IA da Meta durante sua teleconferência de resultados do primeiro trimestre, o CEO Mark Zuckerberg declarou que os investimentos em infraestrutura de IA continuarão a ser uma vantagem estratégica para a Meta. Em março, a OpenAI rotulou a DeepSeek como subsidiada e controlada pelo Estado chinês, recomendando ao governo dos EUA considerar a proibição dos modelos da DeepSeek.

Durante a teleconferência de resultados do quarto trimestre da Nvidia, o CEO Jensen Huang destacou a “excelente inovação” da DeepSeek, afirmando que ela e outros modelos de raciocínio são benéficos para a Nvidia, pois demandam significativamente mais capacidade computacional. Em paralelo, algumas empresas, e até mesmo países e governos, como a Coreia do Sul, estão proibindo o uso da DeepSeek. O estado de Nova York também vetou o uso da tecnologia em dispositivos governamentais. Em maio de 2025, o vice-presidente e presidente da Microsoft, Brad Smith, testemunhou em uma audiência no Senado que funcionários da Microsoft não têm permissão para usar a DeepSeek devido a preocupações com segurança de dados e propaganda.

O futuro da DeepSeek permanece incerto. Embora melhorias contínuas nos modelos sejam esperadas, o governo dos EUA demonstra uma crescente preocupação com o que considera uma influência estrangeira prejudicial. Em março, o The Wall Street Journal informou que os EUA provavelmente irão banir a DeepSeek em dispositivos governamentais. A trajetória da DeepSeek ressalta a complexidade e as tensões inerentes à corrida global pela inteligência artificial.

Acompanhe de perto os desdobramentos dessa história e outras notícias sobre o cenário tecnológico e econômico global em nossa editoria de Economia para se manter sempre informado sobre os impactos da inovação na sociedade.

Crédito: Kyle Wiggers


Links Externos

🔗 Links Úteis

Recursos externos recomendados

Deixe um comentário