Música

Spotify vai usar IA para clonar vozes de podcasters e traduzi-las para novas línguas

A inteligência artificial continua a dar origem a pequenas revoluções. A mais recente promete mudar como ouvimos podcasts.

Agarrar num podcast e, com o simples toque de um botão, traduzi-lo para qualquer língua. Parece coisa de ficção, mas está cada vez perto de se tornar realidade. É precisamente assim que funciona a nova ferramenta de tradução de voz feita pela inteligência artificial do Spotify, que reproduz podcasts em novos idiomas. Mais: a voz usada é a própria voz do podcaster original.

A empresa fez parceria com um grupo de podcasters para traduzir os episódios do inglês para o espanhol e planeia lançar versões em francês e alemão já nas próximas semanas. O primeiro lote de traduções conta com nomes de peso como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett.

A espinha dorsal da funcionalidade de tradução é a ferramenta de transcrição de voz Whisper, da OpenAI, a empresa por detrás de ferramentas como ChatGPT ou Dall-E.  No entanto, a ferramenta do Spotify vai além da tradução de texto para voz — a funcionalidade irá traduzir um podcast para um idioma diferente e irá reproduzi-lo numa versão sintetizada com a própria voz dos autores.

“Ao combinar a própria voz do criador, a tradução de voz dá aos ouvintes de todo o mundo o poder de descobrir e de serem inspirados por novos podcasters de uma forma m+ais autêntica do que nunca”, explica Ziad Sultan, vice-presidente de personalização do Spotify.

É provável que a OpenAI também esteja por detrás da parte de replicação de voz desta nova funcionalidade. A empresa de IA revelou que está também prestes a lançar uma ferramenta que pode criar “áudio semelhante ao humano a partir apenas de texto e de alguns segundos de fala que servem como amostra”.

A OpenAI revela também que está a limitar intencionalmente a disponibilidade desta ferramenta devido a preocupações com a segurança e privacidade. Será provavelmente essa a razão pela qual o Spotify faz questão de frisar que a tradução está apenas a ser testada, por enquanto, apenas com um “grupo selecionado” de podcasters. A empresa não revelou quando é que planeia disponibilizar livremente a ferramenta.

Áudio deste artigo

ÚLTIMOS ARTIGOS DA NiT

AGENDA NiT