Início Tecnologia DeepSeek afirma que seu modelo de raciocínio supera o o1 da OpenAI...

DeepSeek afirma que seu modelo de raciocínio supera o o1 da OpenAI em certos benchmarks

10
0

O laboratório chinês de IA DeepSeek lançou uma versão aberta do DeepSeek-R1, seu chamado modelo de raciocínio, que afirma ter um desempenho tão bom quanto o o1 da OpenAI em determinados benchmarks de IA.

R1 está disponível na plataforma de desenvolvimento de IA Hugging Face sob uma licença do MIT, o que significa que pode ser usado comercialmente sem restrições. De acordo com DeepSeek, R1 supera o1 nos benchmarks AIME, MATH-500 e SWE-bench Verified. AIME emprega outros modelos para avaliar o desempenho de um modelo, enquanto MATH-500 é uma coleção de problemas de palavras. Enquanto isso, o SWE-bench Verified se concentra em tarefas de programação.

Sendo um modelo de raciocínio, R1 verifica a si mesmo de forma eficaz, o que o ajuda a evitar algumas das armadilhas que normalmente tropeçam nos modelos. Os modelos de raciocínio demoram um pouco mais – geralmente de segundos a minutos a mais – para chegar a soluções em comparação com um modelo sem raciocínio típico. A vantagem é que eles tendem a ser mais confiáveis ​​em domínios como física, ciências e matemática.

R1 contém 671 bilhões de parâmetros, revelou DeepSeek em um relatório técnico. Os parâmetros correspondem aproximadamente às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros geralmente têm melhor desempenho do que aqueles com menos parâmetros.

671 bilhões de parâmetros são enormes, mas a DeepSeek também lançou versões “destiladas” do R1 variando em tamanho de 1,5 bilhão a 70 bilhões de parâmetros. O menor pode rodar em um laptop. Quanto ao R1 completo, ele requer hardware mais robusto, mas é disponível através da API do DeepSeek a preços 90% -95% mais baratos que o o1 da OpenAI.

Há uma desvantagem no R1. Sendo um modelo chinês, está sujeito a avaliação comparativa por parte do regulador da Internet da China para garantir que as suas respostas “incorporam valores socialistas fundamentais”. O R1 não responderá a perguntas sobre a Praça Tiananmen, por exemplo, ou sobre a autonomia de Taiwan.

Recusa do DeepSeek R1
Filtragem de R1 em ação. Créditos da imagem:DeepSeek

Muitos sistemas de IA chineses, incluindo outros modelos de raciocínio, recusam-se a responder a tópicos que possam suscitar a ira dos reguladores do país, como as especulações sobre o regime de Xi Jinping.

O R1 chega dias depois de a administração cessante Biden ter proposto regras de exportação mais rigorosas e restrições às tecnologias de IA para empreendimentos chineses. As empresas na China já foram impedidas de comprar chips avançados de IA, mas se as novas regras entrarem em vigor conforme escritas, as empresas serão confrontadas com limites mais rigorosos tanto para a tecnologia de semicondutores como para os modelos necessários para inicializar sistemas sofisticados de IA.

Num documento político da semana passada, a OpenAI instou o governo dos EUA a apoiar o desenvolvimento da IA ​​dos EUA, para que os modelos chineses não os igualem ou superem em capacidade. Em entrevista ao The Information, o vice-presidente de políticas da OpenAI, Chris Lehane, destacou a High Flyer Capital Management, controladora corporativa da DeepSeek, como uma organização de particular preocupação.

Até agora, pelo menos três laboratórios chineses – DeepSeek, Alibaba e Kimi, que pertence ao unicórnio chinês Moonshot AI – produziram modelos que afirmam ser rivais do o1. (Digno de nota, DeepSeek foi o primeiro – anunciou uma prévia do R1 no final de novembro.) Em uma postagem no X, Dean Ball, pesquisador de IA da Universidade George Mason, disse que a tendência sugere que os laboratórios de IA chineses continuarão a ser “ seguidores rápidos.”

“O desempenho impressionante dos modelos destilados do DeepSeek […] significa que raciocinadores muito capazes continuarão a proliferar amplamente e poderão ser executados em hardware local”, escreveu Ball, “longe dos olhos de qualquer regime de controle de cima para baixo”.

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui