Amazon lança Nova Sonic, modelo de voz para IA conversacional em tempo real

Por João Paulo Silva
Amazon lança Nova Sonic, modelo de voz para IA conversacional em tempo real

A Amazon anunciou o lançamento do Nova Sonic, modelo de voz voltado à construção de experiências conversacionais com inteligência artificial. A novidade faz parte da família Amazon Nova e já está disponível por meio do Amazon Bedrock, plataforma da AWS para modelos fundacionais. A principal promessa é reduzir a complexidade técnica da criação de aplicativos habilitados para voz.

Ao contrário das abordagens tradicionais, que exigem a integração de diferentes modelos para tarefas como transcrição, compreensão e síntese de fala, o Nova Sonic unifica esses processos. A arquitetura integrada permite transcrição em tempo real e geração de voz expressiva, preservando elementos naturais da fala, como ritmo, tom e estilo.

Essa abordagem simplifica o desenvolvimento de soluções em áreas como atendimento ao cliente, jogos, ensino de idiomas e educação interativa. Além disso, o modelo opera com baixa latência, fator essencial para experiências mais naturais em interfaces de voz.

Durante uma demonstração em um contact center, o Nova Sonic foi capaz de conduzir uma conversa fluida com um cliente, interagindo com bases de conhecimento da empresa e ajustando suas respostas de acordo com o tom da interação. A ferramenta também reconhece interrupções na fala e responde de forma contextualizada, sem perder o ritmo do diálogo.

Outro destaque é a nova API de streaming bidirecional da AWS, que permite transmitir e receber áudio em tempo real via protocolo HTTP/2. O modelo também oferece suporte a fluxos de eventos para controle de sessão, chamadas de função e tratamento de resultados de ferramentas externas.

Inicialmente, o Nova Sonic reconhece e gera fala em inglês (sotaques americano e britânico), com suporte a novos idiomas previsto para futuras atualizações. A tecnologia já está disponível na região Leste dos EUA (Norte da Virgínia).

O modelo foi desenvolvido com foco em IA responsável, incorporando recursos de moderação de conteúdo e marca d’água. Ele também conta com integração com frameworks populares como LangChain e é compatível com SDKs da AWS em linguagens como Java, Python, JavaScript, C++ e Kotlin.

Com o Nova Sonic, a Amazon aposta em evoluir as interações por voz e ampliar o uso de IA em interfaces conversacionais, aproximando o desempenho das máquinas da fluidez da comunicação humana.

leia também:

Deixe um comentário

* Ao utilizar este formulário você concorda com o armazenamento e tratamento de seus dados por este site.

Este site utiliza cookies para melhorar sua experiência. Presumiremos que você concorda com isso, mas você pode cancelar se desejar. aceitar LER MAIS