Passei anos ficando frustrado com assistentes de voz. Você sabe o que fazer: você é interrompido no meio do pensamento ou isso atrapalha completamente sua solicitação e você acaba pegando o telefone para digitá-la de qualquer maneira. Então, quando fui experimentar o modo de voz do ChatGPT, minhas expectativas estavam, francamente, baixas.
Nunca fiquei tão feliz por estar completamente errado.
Este não é apenas um recurso de voz para texto; é como ter uma conversa real e fluida. Ele espera de forma inteligente que você termine seu pensamento, entende suas pausas naturais e não se deixa abalar por “ums” ou gagueiras. Posso usá-lo enquanto estou cozinhando ou dirigindo, falando como um ser humano normal, sem planejar cuidadosamente cada palavra minha. Não é apenas mais rápido do que digitar – é uma maneira genuinamente mais intuitiva e útil de interagir com a IA. Se você tem ignorado isso, você está perdendo.
Não perca: O que é ChatGPT? Tudo o que você precisa saber sobre o AI Chatbot
ChatGPT, da OpenAI, não é o único chatbot com viva-voz. O Gemini Live do Google oferece a mesma vibração “fale sobre mim e eu acompanharei”. Claude da Anthropic tem uma versão beta de seu modo de voz em seus aplicativos móveis, completo com marcadores na tela enquanto fala, e o assistente iOS e Android da Perplexity também responde a perguntas faladas e inicia aplicativos como OpenTable ou Uber sob comando.
Não perca nenhum de nossos conteúdos técnicos imparciais e análises baseadas em laboratório. Adicionar CNET como fonte preferencial do Google.
Mas mesmo com todos correndo para dominar a conversação de IA em tempo real, o ChatGPT continua sendo minha preferência. Seja qual for o chatbot de sua escolha, faça uma pausa na digitação e experimente a opção de voz. É muito mais útil do que você pensa.
(Divulgação: Ziff Davis, empresa controladora da CNET, entrou com uma ação judicial contra a OpenAI em abril, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.)
Assista isto: Recurso viral do ChatGPT: transformando pessoas em bonecos de ação
O que exatamente é o modo de voz?
O bate-papo por voz (ou “conversas de voz”) é o modo viva-voz do ChatGPT que permite que você fale com o modelo de IA e ouça-o responder a você, sem necessidade de digitação. Há um ícone de voz que você encontrará no aplicativo móvel, desktop e web no canto inferior direito de qualquer conversa em que você esteja. Se você pressionar o botão, poderá fazer sua pergunta em voz alta e o ChatGPT irá transcrevê-la, raciocinar e responder. Assim que termina de falar, ele começa a ouvir novamente, criando um diálogo natural de vaivém.
Apenas lembre-se: O modo de voz funciona no mesmo modelo de linguagem amplo do ChatGPT normal, portanto, ainda pode ter alucinações ou interpretar os fatos errados. Você deve sempre verificar tudo o que é importante.
OpenAI oferece duas versões dessas conversas de voz: Voz padrão (a opção padrão gratuita e leve) e Voz Avançada (disponível apenas para usuários pagos).
O Standard Voice primeiro converte sua fala em texto e a processa com GPT-4o (e GPT-4o mini), demorando um pouco mais para responder a você. Já o Advanced Voice utiliza modelos nativamente multimodais, ou seja, ele “ouve” você e gera áudio, assim a conversa fica mais natural e feita em tempo real. Ele pode captar outras dicas além das próprias palavras, como a velocidade com que você está falando ou a emoção em sua voz, e se ajustar a isso.
Observação: Usuários gratuitos podem acessar uma prévia diária do Advanced Voice.
7 razões pelas quais você deve começar a usar o recurso de modo de voz do ChatGPT
1. É genuinamente coloquial
Ao contrário da digitação, quando falo com o ChatGPT, não estou procurando a palavra certa ou retrocedendo após cada erro de digitação. Estou apenas falando, como faria com qualquer amigo ou membro da família, cheio de “ummmmms” e “curtidas” e outras pausas estranhas. No entanto, o modo de voz acompanha todos os meus pensamentos incompletos e responde com uma resposta totalmente detalhada ou com uma pergunta para me ajudar a aprimorar o que preciso. Esse dar e receber sem esforço parece muito mais natural do que digitar.
2. Você pode usar o ChatGPT com viva-voz
Obviamente, ainda preciso abrir o aplicativo ChatGPT e tocar no botão do modo de voz para iniciar, mas assim que começar, não preciso mais usar as mãos para continuar uma conversa com o chatbot AI. Posso ficar preso no trânsito e pensar em férias que quero tirar ainda este ano. Posso perguntar sobre voos, hotéis, pontos de referência, restaurantes e qualquer outra coisa, sem tocar no telefone, e essa conversa fica salva dentro do app, para que eu não precise lembrar de tudo que o ChatGPT me conta.
3. É bom aprender um novo idioma com tradução em tempo real
Mencionei anteriormente que uso o modo de voz para praticar idiomas, no qual o modo de voz se destaca. Posso falar em inglês e fazer com que o ChatGPT responda em polonês impecável, completo com dicas de pronúncia. Basta perguntar ao modo de voz: “Você pode me ajudar a praticar meu (idioma)” e ele responderá de algumas maneiras que podem ajudá-lo, como iniciar uma conversa, vocabulário básico ou números. E lembra onde você parou, para que você possa, de certa forma, ter aulas; não é necessário Duolingo.
4. Obtenha respostas sobre coisas que você vê no mundo real
Esse recurso é exclusivo do Advanced Voice, mas provavelmente é meu recurso favorito no modo de voz. Graças aos seus superpoderes multimodais, posso ligar a câmera do meu telefone ou tirar um vídeo/foto e pedir ajuda ao ChatGPT. Por exemplo, tive dificuldade em reconhecer uma pintura que encontrei em um brechó e o proprietário não tinha ideia de onde ela veio. Abri o chat de voz, liguei minha câmera e perguntei ao modo de voz de onde era a pintura. Em segundos, poderia me dizer o título da pintura, o nome do artista e quando foi pintada.
5. É a melhor opção para pessoas com certas deficiências
Para qualquer pessoa com baixa visão ou dislexia, falar com certeza é melhor do que digitar. O modo de voz pode transcrever sua fala e depois ler sua resposta em voz alta no ritmo que você escolher (você pode ajustar isso em suas configurações ou pedir ao ChatGPT para diminuir a velocidade). A opção viva-voz também ajuda qualquer pessoa com desafios de habilidades motoras, porque tudo o que você precisa fazer é um toque para iniciar e outro para parar, sem muita digitação no teclado.
6. Brainstorming mais rápido
Às vezes, tenho uma explosão de ideias e penso mais rápido do que consigo digitar, então o modo de voz do ChatGPT é perfeito para cuspir ideias para histórias, descobrir um novo layout para minha sala de estar ou decidir refeições interessantes para preparar durante a semana. Como estou pensando em voz alta em vez de ficar olhando para o telefone, minhas ideias fluem com muito mais facilidade e rapidez, especialmente com o acompanhamento instantâneo do ChatGPT. Isso ajuda a manter o ímpeto até que eu tenha uma ideia refinada para o que quer que esteja pensando.
7. Resumos instantâneos que você pode ouvir
Coloque um PDF de 90 páginas no chat, como para um roteiro de filme ou livro didático, peça um resumo e peça à IA que leia em voz alta para você enquanto você dobra a roupa. É como transformar qualquer documento (eu até faço páginas da Wikipédia) em um podcast – sob demanda.
O modo de voz não é apenas um truque bacana; é uma maneira rápida e natural de usar o ChatGPT. Esteja você traduzindo placas de rua, tendo uma ideia ou acompanhando as notícias em voz alta, conversar com o ChatGPT é menos como usar um chatbot e mais como conversar com um especialista pequeno. Depois de se acostumar a pensar em voz alta, talvez você nunca mais volte ao teclado.








