Tecnologia Empresa OpenAI apresenta nova ferramenta de áudio que pode ler texto e imitar vozes

Por Redação O Sul | 30 de março de 2024

Compartilhe esta notícia:

Empresa diz estar ouvindo instituições de diversos países sobre a Voice Engine, por enquanto disponível apenas para poucos desenvolvedores. (Foto: Reprodução)

A OpenAI divulgou os primeiros resultados de um teste para um recurso que pode ler palavras em voz alta com uma voz humana convincente. A ferramenta define uma nova fronteira para a inteligência artificial (IA) e aumenta os riscos do uso de deepfake, a criação de conteúdos falsos.

A empresa está compartilhando as primeiras demonstrações e uma prévia dos casos de uso do modelo de conversão de texto em fala, chamado Voice Engine, que foi demonstrado a cerca de 10 desenvolvedores até agora, disse um porta-voz. A OpenAI decidiu ser contrária a uma implementação mais ampla do recurso.

Um porta-voz da empresa disse que a opção por reduzir esse lançamento veio depois de receber feedback de partes interessadas, como legisladores, especialistas do setor, educadores e criativos.

A empresa planejou inicialmente lançar a ferramenta para até 100 desenvolvedores por meio de um processo de inscrição, de acordo com a coletiva de imprensa anterior.

Em uma publicação feita num blog na última sexta-feira, a empresa disse reconhecer que promover a ferramenta de geração de falas que se assemelhe às vozes das pessoas apresenta sérios riscos, ainda mais em um ano eleitoral.

“Estamos nos envolvendo com parceiros dos EUA e também internacionais de todos os setores, como o governo, mídia, entretenimento, educação, sociedade civil e outros, para garantir que incorporamos suas opiniões à medida que construímos”, disse.

Outras tecnologias de IA já foram usadas para falsificar vozes em alguns contextos. Em janeiro, um telefonema falso, mas de aparência realista, supostamente do presidente Joe Biden, encorajou as pessoas em New Hampshire a não votarem nas primárias – um evento que alimentou temores sobre a IA antes de eleições globais críticas.

Ao contrário dos esforços anteriores da OpenAI para gerar conteúdo de áudio, o Voice Engine pode criar falas que soam como pessoas individuais, completas com sua cadência e entonações específicas. Tudo o que o software precisa são 15 segundos de áudio gravado de uma pessoa falando para recriar sua voz.

Durante uma demonstração da ferramenta, a Bloomberg ouviu um vídeo do CEO da OpenAI, Sam Altman, explicando brevemente a tecnologia em uma voz que era extremamente parecida com a sua, mas foi inteiramente gerada por IA.

“Se você tiver a configuração de áudio correta, é basicamente uma voz humana padrão. É uma qualidade técnica bastante impressionante”, disse Jeff Harris, líder de produto da OpenAI.

Ele, no entanto, reconhece que a ferramenta pode trazer riscos:

“Há obviamente muita delicadeza de segurança em torno da capacidade de imitar com precisão a fala humana.”

Um dos atuais parceiros desenvolvedores da OpenAI e que também usa a ferramenta é o Instituto de Neurociências Norman Prince, ligado à ONG de saúde Lifespan. Eles estão usando a tecnologia para ajudar os pacientes a recuperar a voz.

A ferramenta foi usada para restaurar a voz de uma jovem paciente que perdeu a capacidade de falar de forma clara devido a um tumor cerebral. A replicação sua fala veio de uma gravação anterior, feita para um projeto escolar, disse o blog da empresa.

O modelo de fala personalizado da OpenAI também pode traduzir o áudio gerado para diferentes idiomas. Isso o torna útil para empresas do ramo de áudio, como o Spotify. Este já usou a tecnologia em seu próprio programa piloto para traduzir podcasts de apresentadores populares, como Lex Fridman.

A OpenAI também elogiou outras aplicações benéficas da tecnologia, como a criação de uma gama mais ampla de vozes para conteúdo educacional para crianças.

No programa de testes, a OpenAI exige que seus parceiros concordem com suas políticas de uso, obtenham o consentimento do locutor original antes de usar sua voz e divulguem aos ouvintes que as vozes que estão ouvindo são geradas por IA.

A empresa também está instalando uma marca d’água de áudio inaudível para permitir distinguir se um trecho de áudio foi criado por sua ferramenta.

Antes de decidir se lançará o recurso de forma mais ampla, a OpenAI disse que está solicitando feedback de especialistas externos. “É importante que as pessoas em todo o mundo entendam para onde esta tecnologia está indo, quer nós mesmos a implantemos amplamente ou não”, disse a empresa no blog.

A OpenAI também disse que espera que a pré-visualização do seu software “motive a necessidade de reforçar a resiliência social” contra os desafios trazidos pelas tecnologias de IA mais avançadas.

Um exemplo disso foi o apelo que a empresa fez aos bancos para eliminarem gradualmente a autenticação de voz como medida de segurança para clientes acessarem a contas bancárias e informações sensíveis.

A empresa também busca fornecer educação pública sobre conteúdo enganoso feito por IA e um maior desenvolvimento de técnicas para detectar se o conteúdo de áudio é real ou gerado por inteligência artificial.

Compartilhe esta notícia:

Voltar Todas de Tecnologia

Deixe seu comentário

Os comentários estão desativados.

Tecnologia Empresa OpenAI apresenta nova ferramenta de áudio que pode ler texto e imitar vozes

Deixe seu comentário

Últimas

Saúde SUS disponibiliza novo tratamento para leucemia mieloide em adultos

Economia Com foco em juros e cenário internacional, dólar sobe para R$ 5,08 e bolsa recua

Acontece Nova diretoria do IEE assume com missão de realizar o 40º Fórum da Liberdade

Copa do Mundo 2026 Mbappé supera Pelé e Messi na artilharia histórica das Copas do Mundo

Grêmio Impasse financeiro encerra segunda passagem de Arthur pelo Grêmio

Política Supremo condena Eduardo Bolsonaro a 4 anos de prisão por coação em ação da trama golpista

Brasil Prazo para o pagamento da inscrição do Enem termina nesta quarta-feira

Copa do Mundo 2026 França vence Senegal por 3 a 1 na estreia da Copa do Mundo de 2026

Últimas Quem é o brasileiro apontado como ex-chefe do PCC e do CV preso nos Estados Unidos

Mundo Acordo para o fim da guerra entre Estados Unidos e Irã ainda tem pontos abertos

Pode te interessar

Tecnologia Carregador na tomada ou no celular primeiro? Saiba qual é a maneira correta para aumentar vida útil da bateria

Tecnologia Robôs humanoides dividem passarela com modelos em desfile de moda na Coreia do Sul

Tecnologia YouTube vai detectar e rotular conteúdos criados por inteligência artificial mesmo sem aviso do criador

Tecnologia Entenda o que significa a nova lei para as redes sociais

Tecnologia Empresa OpenAI apresenta nova ferramenta de áudio que pode ler texto e imitar vozes

Deixe seu comentário

Notícia Anterior

Sean “Diddy” Combs foi do “sonho americano” a um lento declínio após criar império de moda e entretenimento

Próxima notícia

Descubra se o jejum intermitente é perigoso para o coração

Últimas

Saúde SUS disponibiliza novo tratamento para leucemia mieloide em adultos

Economia Com foco em juros e cenário internacional, dólar sobe para R$ 5,08 e bolsa recua

Acontece Nova diretoria do IEE assume com missão de realizar o 40º Fórum da Liberdade

Copa do Mundo 2026 Mbappé supera Pelé e Messi na artilharia histórica das Copas do Mundo

Grêmio Impasse financeiro encerra segunda passagem de Arthur pelo Grêmio

Política Supremo condena Eduardo Bolsonaro a 4 anos de prisão por coação em ação da trama golpista

Brasil Prazo para o pagamento da inscrição do Enem termina nesta quarta-feira

Copa do Mundo 2026 França vence Senegal por 3 a 1 na estreia da Copa do Mundo de 2026

Últimas Quem é o brasileiro apontado como ex-chefe do PCC e do CV preso nos Estados Unidos

Mundo Acordo para o fim da guerra entre Estados Unidos e Irã ainda tem pontos abertos

Pode te interessar

Tecnologia Carregador na tomada ou no celular primeiro? Saiba qual é a maneira correta para aumentar vida útil da bateria

Tecnologia Robôs humanoides dividem passarela com modelos em desfile de moda na Coreia do Sul

Tecnologia YouTube vai detectar e rotular conteúdos criados por inteligência artificial mesmo sem aviso do criador

Tecnologia Entenda o que significa a nova lei para as redes sociais