A OpenAI lançou o o3-pro, um modelo de IA que a empresa afirma ser o mais capaz até o momento.
O O3-pro é uma versão do o3 da OpenAI , um modelo de raciocínio lançado pela startup no início deste ano. Ao contrário dos modelos convencionais de IA, os modelos de raciocínio resolvem problemas passo a passo, permitindo um desempenho mais confiável em áreas como física, matemática e programação.
O O3-pro está disponível para usuários do ChatGPT Pro e Team a partir de terça-feira, substituindo o modelo o1-pro . Usuários Enterprise e Edu terão acesso na semana seguinte, segundo a OpenAI. O O3-pro também está disponível na API de desenvolvedores da OpenAI a partir desta tarde.
O O3-pro custa US$ 20 por milhão de tokens de entrada e US$ 80 por milhão de tokens de saída na API. Os tokens de entrada são tokens inseridos no modelo, enquanto os tokens de saída são tokens que o modelo gera com base nos tokens de entrada.
Um milhão de tokens de entrada equivale a cerca de 750.000 palavras, um pouco mais que “Guerra e Paz”.
“Nas avaliações de especialistas, os revisores consistentemente preferem o o3-pro ao o3 em todas as categorias testadas, especialmente em áreas-chave como ciência, educação, programação, negócios e auxílio à escrita”, escreve a OpenAI em um changelog. “Os revisores também classificaram o o3-pro consistentemente com notas mais altas em clareza, abrangência, capacidade de seguir instruções e precisão.”
O O3-pro tem acesso a ferramentas, de acordo com a OpenAI, que lhe permitem pesquisar na web, analisar arquivos, raciocinar sobre entradas visuais, usar Python, personalizar suas respostas utilizando memória e muito mais. Como desvantagem, as respostas do modelo geralmente demoram mais para serem concluídas do que as do o1-pro, de acordo com a OpenAI.
O O3-pro tem outras limitações. Os bate-papos temporários com o modelo no ChatGPT estão desativados por enquanto, enquanto a OpenAI resolve um “problema técnico”. O O3-pro não consegue gerar imagens. E o Canvas, o recurso de área de trabalho com tecnologia de IA da OpenAI, não é suportado pelo O3-pro.
Do lado positivo, o o3-pro alcança pontuações impressionantes em benchmarks populares de IA, de acordo com testes internos da OpenAI. No AIME 2024, que avalia as habilidades matemáticas de um modelo, o o3-pro obtém uma pontuação melhor do que o modelo de IA de melhor desempenho do Google, o Gemini 2.5 Pro . O O3-pro também supera o Claude 4 Opus , lançado recentemente pela Anthropic, no GPQA Diamond, um teste de conhecimento científico de nível de doutorado.