top of page
  • LinkedIn
  • Instagram

#_IA_Tentando_Acompanhar | Edição 92

Rogério Coutinho

26 de mar. de 2025

Novos modelos de áudio lançados pelas OpenAI

Olá Pessoal!!


O papo de hoje é sobre os *novos modelos de áudio que a OpenAI lançou!!!*


Para muitos a notícia poderá passar meio despercebida, mas trará impactos importantes!!!


#_Entendendo

Na prática, a *OpenAI lançou* alguns *novos modelos de áudio* com foco em transcrição (speech-to-text) e texto-para-fala (text-to-speech), permitindo que *as empresas possam criar sistemas com interfaces de voz mais naturais e personalizadas.*


Ou seja, sabe aquele chatbot do site, ou seu app no celular, ou seu CRM, vai ter mais facilidade de ter recursos para interface por voz em vez de texto!!


#_Novos_Recursos

O modelo gpt-4o-mini-tts, por exemplo, permite que os desenvolvedores não apenas digam o que a voz deve falar, mas também como, definindo características como motivação, otimismo, profissional, etc.


Isso é ideal para criar agentes de voz empáticos, como em atendimento ao cliente, ou narrativas para colocarmos em uma aplicação dentro de um brinquedo.


Já o modelo gpt-4o-mini-transcribe é mais preciso em transcrições, mesmo em condições mais complicadas como ambiente com muito ruído, e pode ser muito útil para call centers e anotações de reuniões.


#_Como_Testar_Modo_Simples

Pessoal, a OpenAI criou um site simples para que as pessoas possam testar e entender a ideia!!

Segue o site: https://www.openai.fm/


No site é possível testar vozes, por exemplo, calma para hora de dormir, uma profissional que você pode usar em um app de reuniões


#_Futuro_Breve

A promessa é que logo logo as empresas possam colocar em seus sistemas vozes próprias!!!


E ai na sua empresa, em qual processo de negócio um agente de IA que ouve e fala com bastante naturalidade pode trazer impacto positivo?


Sobre o autor:


Rogério Coutinho da Silva

rogerio.coutinho.silva@gmail.com 

https://www.linkedin.com/in/rogerio-coutinho-silva/




Engenheiro de Computação formado pela Universidade Federal de São Carlos (UFSCar). Sócio-fundador da Podium Tecnologia (Consultoria especializada em Governança de Segurança da Informação, Privacidade e Continuidade de Negócios) e da SimpleWay (Plataforma de Governança de Segurança Cibernética, Privacidade e IA).


Foto de Ben Blennerhassett na Unsplash

eyestetix-studio-pkX0E7E8pcc-unsplash.jpg

Grupo no WhatsApp

IA_Tentando acompanhar 

News, Tendências e Insights

Receba as atualizações no seu celular! 

Plataforma de Governança Cibernética, Privacidade e IA (4).png
bottom of page