InicioOuvir Notícias

ChatGPT agora fala e ouve ao mesmo tempo: novo modelo de voz bidirecional chega ao mercado

A OpenAI iniciou a liberação de um novo modelo de voz bidirecional para o ChatGPT, chamado internamente de GPT-Bidi-1. A ferramenta altera a dinâmica atual de conversação ao permitir que a inteligência artificial ouça e fale de forma simultânea, eliminando a necessidade de alternância rígida de turnos entre o usuário e o sistema. O recurso está sendo lançado gradualmente para um grupo selecionado de usuários web e mobile, sem um anúncio oficial da empresa até o momento.

O objetivo da atualização é aproximar a camada de voz das capacidades já existentes nos modelos de texto da companhia. A mudança estrutural tem como base a tese da OpenAI de que a fala se tornará o principal meio de acesso à inteligência artificial nos próximos anos. Diferente do atual assistente de voz que utiliza o GPT-4o adaptado para áudio, o GPT-Bidi-1 foi desenvolvido especificamente para processamento de som em tempo real.

A nova arquitetura traz mudanças importantes no comportamento da IA. O modelo emite pequenos avisos naturais, como um “okay”, quando detecta que a pessoa reduziu a velocidade da fala ou fez uma pausa breve, sem cortar a transmissão. A ferramenta mantém a linha de raciocínio ao longo de interações longas, corrigindo uma falha crônica do sistema anterior que descartava contextos antigos da conversa. Além disso, o robô deixa de dar respostas precipitadas durante pausas mais demoradas do interlocutor.

Visualmente, a ativação do modelo altera elementos da interface do usuário. O GPT-Bidi-1 aparece listado no menu de seleção de modelos, localizado nas configurações do ChatGPT, posicionado ao lado das opções padrão e avançada. A documentação interna indica que a funcionalidade operará com três divisões de inteligência: Alta, Média e Instantânea. Essa separação replica a lógica dos modelos de texto, permitindo que o usuário escolha entre respostas de processamento imediato ou análises mais profundas.

A tecnologia está em desenvolvimento desde o início de 2026 e a expectativa é que o modelo seja expandido em um formato de adesão opcional. Na sequência deste lançamento, a OpenAI planeja uma atualização de voz dedicada para a ferramenta de programação Codex e, posteriormente, a liberação de acesso via API para desenvolvedores externos. A chegada do GPT-Bidi-1 representa um passo significativo na evolução das interfaces conversacionais, aproximando a interação com IA cada vez mais de uma conversa humana natural.

by NOVATOPNET
Capa da Postagem
Pronto para tocar

Carregando postagens...

Ler matéria completa ↗
00:00 00:00

Postagens Narradas Recentes

0 áudios
Buscando áudios no blog...

Você acabou de ler: ChatGPT agora fala e ouve ao mesmo tempo: novo modelo de voz bidirecional chega ao mercado Confira mais exclusividades abaixo!