Rogério Coutinho
26 de mar. de 2025
Novos modelos de áudio lançados pelas OpenAI
Olá Pessoal!!
O papo de hoje é sobre os *novos modelos de áudio que a OpenAI lançou!!!*
Para muitos a notícia poderá passar meio despercebida, mas trará impactos importantes!!!
#_Entendendo
Na prática, a *OpenAI lançou* alguns *novos modelos de áudio* com foco em transcrição (speech-to-text) e texto-para-fala (text-to-speech), permitindo que *as empresas possam criar sistemas com interfaces de voz mais naturais e personalizadas.*
Ou seja, sabe aquele chatbot do site, ou seu app no celular, ou seu CRM, vai ter mais facilidade de ter recursos para interface por voz em vez de texto!!
#_Novos_Recursos
O modelo gpt-4o-mini-tts, por exemplo, permite que os desenvolvedores não apenas digam o que a voz deve falar, mas também como, definindo características como motivação, otimismo, profissional, etc.
Isso é ideal para criar agentes de voz empáticos, como em atendimento ao cliente, ou narrativas para colocarmos em uma aplicação dentro de um brinquedo.
Já o modelo gpt-4o-mini-transcribe é mais preciso em transcrições, mesmo em condições mais complicadas como ambiente com muito ruído, e pode ser muito útil para call centers e anotações de reuniões.
#_Como_Testar_Modo_Simples
Pessoal, a OpenAI criou um site simples para que as pessoas possam testar e entender a ideia!!
Segue o site: https://www.openai.fm/
No site é possível testar vozes, por exemplo, calma para hora de dormir, uma profissional que você pode usar em um app de reuniões
#_Futuro_Breve
A promessa é que logo logo as empresas possam colocar em seus sistemas vozes próprias!!!
E ai na sua empresa, em qual processo de negócio um agente de IA que ouve e fala com bastante naturalidade pode trazer impacto positivo?
Sobre o autor:
Rogério Coutinho da Silva
rogerio.coutinho.silva@gmail.com
https://www.linkedin.com/in/rogerio-coutinho-silva/
Engenheiro de Computação formado pela Universidade Federal de São Carlos (UFSCar). Sócio-fundador da Podium Tecnologia (Consultoria especializada em Governança de Segurança da Informação, Privacidade e Continuidade de Negócios) e da SimpleWay (Plataforma de Governança de Segurança Cibernética, Privacidade e IA).
Foto de Ben Blennerhassett na Unsplash





.png)