Este artista usa IA para cantar em seis línguas diferentes

Midnatt é um K-popper que tenta infiltrar sua música em outros países
Rodrigo Mozelli15/05/2023 19h45, atualizada em 15/05/2023 22h26
i-MIDNATT_Masquerade_2
Imagem: Divulgação/Hybe
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Quando a Hybe, gigante do entretenimento por trás do grupo K-pop BTS, anunciou novo artista, o mundo da música toma nota. A Hybe não domina apenas o K-pop. É também a empresa controladora de Justin Bieber e Ariana Grande, entre outros artistas, graças à aquisição da Ithaca Holdings, em 2021.

Ofertas

Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
Vendido por Amazon
Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo
De: R$ 30,90
Por: R$ 27,81
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
Vendido por Amazon
Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)
De: R$ 79,99
Por: R$ 50,10
Tilibra - Estojo Triplo Grande Académie Azul
Vendido por Amazon
Tilibra - Estojo Triplo Grande Académie Azul
De: R$ 110,90
Por: R$ 67,95
Giz Pastel Oleoso Pentel Arts 12 Cores
Vendido por Amazon
Giz Pastel Oleoso Pentel Arts 12 Cores
De: R$ 17,90
Por: R$ 10,90
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
Vendido por Amazon
GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível
De: R$ 2.699,00
Por: R$ 2.069,90
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
Vendido por Amazon
Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045
De: R$ 89,90
Por: R$ 56,60
Adaptador Wireless TP-Link Archer T2U Nano USB
Vendido por Amazon
Adaptador Wireless TP-Link Archer T2U Nano USB
De: R$ 109,90
Por: R$ 75,85
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
Vendido por Amazon
SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202
De: R$ 616,58
Por: R$ 334,32
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
Vendido por Amazon
Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios
De: R$ 33,90
Por: R$ 23,83
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Vendido por Amazon
Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056
Por R$ 17.180,00
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
Vendido por Amazon
PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto
De: R$ 156,00
Por: R$ 140,00
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
Vendido por Amazon
Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ
De: R$ 199,99
Por: R$ 178,49
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Vendido por Amazon
Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone
Por R$ 299,99
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
Vendido por Amazon
soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto
De: R$ 259,35
Por: R$ 198,99
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Vendido por Amazon
Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online
Por R$ 2.399,00
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
Vendido por Amazon
Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089
De: R$ 5.299,00
Por: R$ 3.999,00
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
Vendido por Amazon
Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa
De: R$ 229,00
Por: R$ 160,65
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
Vendido por Amazon
Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google
De: R$ 289,90
Por: R$ 187,00
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Vendido por Amazon
EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de
Por R$ 419,99
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
Vendido por Amazon
soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio
De: R$ 369,00
Por: R$ 209,90
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
Vendido por Amazon
HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA
De: R$ 464,65
Por: R$ 330,00

Então, quando a Hybe trouxe, no início deste mês, novo projeto de IA para seu selo Big Hit Music envolvendo um artista chamado Midnatt, entusiastas do K-pop e observadores da indústria começaram a especular se este seria um grupo inteiramente gerado por IA. A resposta é não, mas com um porém.

Leia mais:

Midnatt é, na verdade, o alter-ego de Lee Hyun, um marco de longa data da cena musical da Coreia que está com a Hybe desde 2005, quando era chamado de Big Hit Entertainment, oito anos antes da estreia do BTS.

Embora os antigos fãs de K-pop conheçam a voz de Hyun – seja em seus sete anos como membro do grupo misto 8eight, oito anos como metade da dupla Homme, ou em uma de suas inúmeras aparições em competições de canto na TV – eles nunca a ouviram nestas muitas línguas. Seu novo single, “Masquerade”, foi lançado simultaneamente em coreano, inglês, espanhol, chinês, japonês e vietnamita.

Em entrevista à Fast Company, Hyun afirmou que, “embora minha nova identidade possa parecer desconhecida para os fãs, meu objetivo sempre foi alcançar o público global. Superar as barreiras linguísticas seria o primeiro passo nesta jornada”.

Midnatt – que pode ser traduzido como “meio da noite” em sueco ou “cara nua” em coreano – marca a primeira colaboração entre uma das gravadoras da Hybe e a Hybe IM, seu braço de mídia interativa.

Para o projeto, os dois usaram a tecnologia da Supertone, empresa de síntese de voz de IA que a Hybe adquiriu no ano passado por US$ 36 milhões. A companhia foi criada pelo especialista em processamento de linguagem e aprendizado de máquina, Lee Kyogu, atual CEO da empresa de IA. A Supertone é capaz de reproduzir com precisão a voz de um cantor, enquanto permite uma série de ajustes.

A “tecnologia do Supertone não apenas oferece variedade de opções de síntese de voz, mas também permite ajustes precisos para cada elemento que constitui uma ‘voz’”, diz o produtor da faixa, Hitchhiker, também conhecido como Choi Jin-woo.

Para garantir que as faixas multilíngues soem como se estivessem sendo cantadas por um falante nativo, Hybe diz que a Supertone foi capaz de alternar os dados de voz de Midnatt com os de um narrador nativo. Coube a Choi misturar manualmente as duas vozes para garantir que os vocais em outros idiomas mantivessem a emoção da versão coreana.

As capacidades da Supertone até permitiram que Midnatt aparecesse em sua própria faixa com voz de mulher, que aparece no segundo verso. É algo que Choi diz que poucas ferramentas existentes são capazes de fazer mantendo a clareza vocal.

“A ferramenta da Supertone pode produzir conteúdo de alta qualidade com erros próximos a zero em comparação com outras ferramentas que costumam produzir som distorcido de acordo com a faixa de afinação”, diz ele.

Usar o Supertone para lançar um novo artista de K-pop globalmente e em sua “própria” voz é um movimento natural paraca Hybe. A empresa é uma das forças motrizes por trás da base de fãs mundial do K-pop.

Lee Kyogu, CEO da Supertone

As legiões de fãs do BTS em todo o mundo, conhecidas coletivamente como ARMY, chegam a dezenas de milhões (pelo menos). O novo grupo feminino da Hybe, NewJeans, que estreou há menos de um ano, tornou-se o grupo K-pop mais rápido a atingir 1 bilhão de streams no Spotify.

Encontrar artistas de K-pop que possam falar – e cantar – para esses fãs globais em seus próprios idiomas é uma prioridade crescente.

Com o BTS fazendo pausa temporária como um grupo enquanto seus membros começam a cumprir seu serviço militar obrigatório na Coreia do Sul, o presidente da Hybe, Bang Si-Hyuk, está olhando ainda mais adiante. “Há muito duvido que as entidades que criam e produzem música continuarão sendo humanas”, disse ele à Billboard em entrevista recente.

“Não sei por quanto tempo os artistas humanos podem ser os únicos a satisfazer necessidades e gostos humanos. E isso está se tornando fator-chave para minha operação e uma estratégia para a Hybe.”

Apesar da utilidade de gravadoras e artistas adaptarem músicas ao público, as ferramentas de síntese de voz de IA, como a Supertone, têm estado sob crescente escrutínio, à medida que um número crescente de músicas não sancionadas que replicam vozes famosas chega à Internet.

Uma recente música construída com IA, de Drake e The Weeknd, chamada “Heart on My Sleeve”, acumulou 10 milhões de visualizações no TikTok e um quarto de milhão de streams no Spotify em poucos dias antes do Universal Media Group, o selo que representa os dois artistas, o removê-lo por violação de direitos autorais.

Lee diz que a Supertone não permite que sua tecnologia seja usada pelo público em geral e garante que qualquer pessoa cuja voz esteja sendo sintetizada tenha permitido.

Ele também diz que a empresa está explorando uma maneira de discernir as vozes reais das sintéticas. “Embora este seja um empreendimento altamente desafiador, estamos comprometidos em aprimorar nosso algoritmo de detecção existente para aplicação em situações do mundo real”, disse.

Quanto ao Midnatt, ele está empolgado por fazer parte do programa da Hybe: “Estou na indústria da música há algum tempo e espero que minha opinião sobre esse desafio deixe um impacto significativo em outros artistas, assim como a jornada de Neil Armstrong deixou uma impressão duradoura.”

Com informações de Fast Company

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.