O Google DeepMind, principal laboratório de inteligência artificial do Google, afirma que o sistema AlphaGeometry 2 foi capaz de acertar 84% dos problemas de geometria que fizeram parte da Olimpíada Internacional de Matemática nos últimos 25 anos. Este índice é acima da média dos medalhistas de ouro da competição, que é voltada a estudantes do ensino médio.
O AlphaGeometry 2 já tinha conseguido resultados interessantes anteriormente. Em julho de 2024, o Google DeepMind divulgou que este sistema, em “parceria” com o AlphaProof, tinha conseguido resolver quatro dos seis problemas da Olimpíada de 2024, indo além da geometria. Este desempenho credenciaria as IAs a uma medalha de prata.
Voltando ao teste mais recente, a equipe do Google DeepMind selecionou 45 problemas de geometria da Olimpíada de 2000 a 2025. Alguns deles foram desmembrados, chegando a um total de 50 problemas. O AlphaGeometry 2 acertou 42 — a média de um medalhista de ouro é 40,9.
Como o AlphaGeometry 2 funciona?
O AlphaGeometry 2 é composto de vários elementos. Dois deles se destacam: um da família Gemini e um “motor simbólico”.
O Gemini sugere passos e construções em linguagem matemática, e o motor simbólico verifica a consistência lógica delas. Enquanto isso, um algoritmo de pesquisa faz múltiplas buscas por soluções e armazena as informações úteis em uma base de conhecimento, acessível ao Gemini e ao motor.
O AlphaGeometry 2 dá um problema como resolvido quando chega a uma prova que combina as sugestões do Gemini e os princípios matemáticos do motor simbólico.
Por que a geometria importa para uma IA?
Pesquisadores do Google DeepMind acreditam que desenvolver a capacidade de resolução de problemas de geometria pode ser a base para criar componentes úteis para modelos de IA de uso geral.
Afinal, explicar por que um teorema é verdadeiro requer que raciocínio e capacidade para escolher quais são os passos possíveis para chegar a uma solução. Este tipo de abordagem pode ser útil para outras áreas de matemática e ciência, como cálculos de engenharia.
Com informações do TechCrunch