15 de julho de 2025

pt-br

Nova ferramenta de voz de IA treinada para copiar sotaques regionais britânicos

Cidades Sotaques 15/07/2025 08:00 Zoe Kleinman https://www.bbc.com/news/articles/c07d2dyx19zo

Uma empresa do Reino Unido diz que é melhor em reproduzir uma gama de sotaques em comparação com rivais dos EUA ou da China.

Uma nova ferramenta de clonagem de voz de IA de uma empresa britânica afirma ser capaz de reproduzir uma gama de sotaques do Reino Unido com mais precisão do que alguns de seus rivais dos EUA e da China.

Como grande parte dos dados tradicionalmente usados para treinar produtos de IA com vozes vem de fontes da América do Norte ou do sul da Inglaterra, muitas vozes artificiais tendem a soar semelhantes.

Para combater isso, a empresa Synthesia passou um ano compilando seu próprio banco de dados de vozes do Reino Unido com sotaques regionais, gravando pessoas em estúdios e reunindo material online.

Ela usou esses dados para treinar um produto chamado Express-Voice, que pode clonar a voz de uma pessoa real ou gerar uma voz sintética.

Essas vozes podem ser usadas em conteúdo como vídeos de treinamento, suporte de vendas e apresentações.

A empresa disse que seus clientes queriam representações regionais mais precisas.

"Se você é CEO de uma empresa, ou se é apenas uma pessoa comum, quando tem sua semelhança, você quer que seu sotaque seja preservado", disse Youssef Alami Mejjati, chefe de pesquisa da Synthesia.

Ele acrescentou que clientes de língua francesa também comentaram que as vozes francesas sintéticas tendiam a soar mais canadenses do que com origem na França.

"Isso se deve apenas ao fato de que as empresas que constroem esses modelos tendem a ser empresas norte-americanas e tendem a ter conjuntos de dados tendenciosos em relação à demografia em que estão", disse ele.

Os sotaques mais difíceis de imitar são os menos comuns, disse Mejjati, porque há menos material gravado disponível para treinar um modelo de IA.

Também há relatos de que produtos de IA com comando de voz, como alto-falantes inteligentes, têm maior probabilidade de ter dificuldades para entender uma gama de sotaques.

No ano passado, documentos internos da Polícia de West Midlands revelaram preocupações sobre se os sistemas de reconhecimento de voz entenderiam os sotaques de Brummie.

Enquanto isso, a start-up americana Sanas está adotando a abordagem oposta, desenvolvendo ferramentas para implantação em call centers que "neutralizam" os sotaques dos funcionários indianos e filipinos, conforme relatado pela Bloomberg em março.

A empresa diz que seu objetivo é reduzir a "discriminação de sotaque" que os trabalhadores enfrentam quando os interlocutores não os entendem.

Linguagens e dialetos em perigo

Há preocupação de que línguas e dialetos estejam sendo perdidos na era digital.

"Entre as mais de sete mil línguas que ainda existem hoje, quase metade está em perigo de extinção, de acordo com a UNESCO; cerca de um terço tem alguma presença online; menos de 2% são suportadas pelo Google Tradutor; e, de acordo com os próprios testes da OpenAI, apenas quinze, ou 0,2% são suportadas pelo GPT-4 [um modelo OpenAI] acima de 80% de precisão", escreve Karen Hao no livro Empire of AI.

"Os modelos de linguagem estão homogeneizando a fala", concorda o especialista em IA Henry Ajder, que assessora governos e empresas de tecnologia, incluindo a Synthesia.

No entanto, quanto melhores se tornarem esses produtos, mais eficazes eles também serão nas mãos de golpistas.

O produto da Synthesia não será gratuito quando for lançado nas próximas semanas e terá barreiras de proteção contra discurso de ódio e material explícito.

Mas já existem muitas ferramentas gratuitas e de código aberto para clonagem de voz, que são facilmente acessíveis e menos protegidas.

No início de julho, mensagens geradas por uma voz clonada por IA, que imitava o secretário de Estado dos EUA, Marco Rubio, foram relatadas como tendo sido enviadas a ministros.

"O cenário de código aberto para voz evoluiu tão rapidamente nos últimos nove a 12 meses", acrescenta o Sr. Ajder.

"E isso, de uma perspectiva de segurança, é uma verdadeira preocupação."


Plantão

(65) 98162-4000

Copyright  - A Voz do Estado  - Todos os direitos reservados