Pular para o conteúdo

OpenAI, dona do ChatGPT, revela nova ferramenta de clonagem de voz

A OpenAI, empresa por trás do ChatGPT, revelou uma ferramenta de clonagem de voz, chamada de Voice Engine, que pode duplicar a fala de alguém com base em uma amostra de apenas 15 segundos da voz da pessoa.

ferramenta ainda não está disponível para todo mundo e a empresa planeja manter ela sob estrito controle até que sejam implementadas medidas de segurança para impedir falsificações de áudio destinadas a enganar os ouvintes.

“Reconhecemos que gerar fala que se assemelha às vozes das pessoas apresenta sérios riscos, que estão especialmente em destaque em um ano de eleições”, disse a empresa em comunicado.

“Estamos envolvendo parceiros dos Estados Unidos, governos, mídia, empresas de entretenimento, educação, sociedade civil e outros setores para garantir que estamos incorporando seus feedbacks conforme construímos”, acrescentou.

Pesquisadores de desinformação temem o uso generalizado de softwares alimentados por inteligência artificial (IA) em um ano eleitoral.

Admitindo esses problemas, a OpenAI afirmou que está “adotando uma abordagem cautelosa e informada para um lançamento mais amplo devido ao potencial de uso indevido de vozes sintéticas”.

A OpenAI disse que seus parceiros que estão testando o Voice Engine concordaram com as regras, incluindo a necessidade de consentimento explícito e informado de qualquer pessoa cuja voz seja duplicada.

Também deve ficar claro para o público quando as vozes que estão ouvindo são geradas por IA, acrescentou a empresa.

“Implementamos um conjunto de medidas de segurança, incluindo marca d’água para rastrear a origem de qualquer áudio gerado pelo Voice Engine, bem como monitoramento proativo de como ele está sendo usado”, garantiu a companhia.

Em fevereiro, a OpenAI também revelou um modelo de inteligência artificial que cria vídeos realistas a partir de texto curtos. Batizado de Sora, ele foi liberado para análises de especialistas e ainda não está disponível ao público.

“O Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”, explica a empresa.

Fonte: G1

Comentários
Publicidade

Deixe um comentário

Aviso: os comentários são de responsabilidade dos seus autores e não refletem a opinião do Portal Integração. É proibida a inclusão de comentários que violem a lei, a moral e os princípios éticos, ou que violem os direitos de terceiros. O Portal Integração reserva-se o direito de remover, sem aviso prévio, comentários que não estejam em conformidade com os critérios estabelecidos neste aviso.

Veja também...

Portal Integração