Os rumores estavam corretos. A OpenAI acaba de anunciar o o1 e o1-mini, os seus primeiros modelos de inteligência artificial com capacidades de raciocínio. Estes modelos tiram partido da tecnologia conhecida internamente como Strawberry e foram concebidos para resolver tarefas complexas em domínios como a ciência, a matemática e a programação.
Utilizadores gratuitos também poderão usar o modelo
Os novos modelos estão disponíveis nas versões pagas do ChatGPT, e uma versão mini será adicionada à versão gratuita num futuro próximo.
Nos nossos testes, a próxima atualização do modelo tem um desempenho semelhante ao dos estudantes de doutoramento em tarefas de referência exigentes em física, química e biologia.
Também descobrimos que ele se destaca em matemática e programação. Num exame de qualificação para a Olimpíada Internacional de Matemática (IMO), o GPT-4o resolveu apenas 13% dos problemas corretamente, enquanto o modelo de raciocínio obteve 83%.
Afirma a OpenAI.
A OpenAI lançou o o1 em modo de pré-visualização, pelo que ainda não integrou 100% das suas funcionalidades no ChatGPT. Isto significa que ainda não pode lidar com imagens, nem pode procurar informações na Web. A equipa de Sam Altman acredita que esta nova inteligência artificial representa um salto quântico em termos de capacidades, razão pela qual decidiram dar-lhe o nome de o1.
A startup publicou alguns vídeos com exemplos que mostram o novo modelo a resolver problemas e instruções complexas, e mesmo a responder a perguntas simples que outros modelos não conseguiram responder.
OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024
ChatGPT ganha capacidades de raciocínio com o o1 e o1-mini da OpenAI
A OpenAI afirmou que o o1 foi treinado com um conjunto de dados personalizado e um novo algoritmo de otimização. Ao contrário do GPT-4o e dos modelos anteriores, esta IA não imita os seus padrões de formação, mas utiliza reinforcement learning para resolver os problemas que lhe são apresentados por si só.
A empresa disse também que o o1 é muito menos suscetível ao jailbreaking, ou seja, às tentativas dos utilizadores de contornar as suas salvaguardas.
Num dos nossos testes de jailbreak mais difíceis, o GPT-4o obteve 22 pontos (numa escala de 0 a 100), enquanto o nosso modelo o1-preview obteve 84 pontos.
Afirmam os criadores da IA.
Quanto ao o1-mini, é uma versão mais pequena e até 80% mais barata do o1. De acordo com a OpenAI, o o1-mini destaca-se especialmente em tarefas de programação. Um facto interessante que foi partilhado é o tempo que os seus novos modelos demoram a dar uma resposta de texto simples através do ChatGPT:
- Enquanto o GPT-4o respondeu em apenas 3 segundos, o o1-mini respondeu em 9 segundos e o o1 em 32 segundos. Esse tempo extra é o tempo que a nova IA gasta a pensar e a raciocinar sobre as suas respostas.
Os assinantes do ChatGPT Plus e Team já podem aceder ao o1 e o1-mini a partir do menu de seleção do modelo. Na próxima semana, os utilizadores dos planos Enterprise e Edu poderão também aceder. Como dissemos, a versão gratuita do ChatGPT receberá o o1-mini, embora ainda não se saiba quando.
Leia também: