Nasci filho único, mas agora tenho um gêmeo. Ele é uma cópia exata de mim – das roupas à casa, das expressões faciais à voz. Eu o fiz com IA, e posso fazê-lo dizer o que eu quiser. Ele é tão convincente que poderia enganar até a minha própria mãe. Veja como eu o construí e o que os gêmeos digitais de IA significam para o futuro das pessoas.
Quis testar a tecnologia na prática. Então, recorri às melhores ferramentas atuais de clonagem por IA e criei o Tom Digital, uma cópia digital perfeita de mim mesmo. Decidi começar clonando minha voz.
A voz de uma pessoa é algo especialmente íntimo e pessoal. Pense em alguém querido que você já perdeu. Aposto que consegue lembrar exatamente como essa pessoa soava.
Clonar uma voz – com todas as nuances de sotaque, estilo de fala, entonação, ritmo e respiração – é um desafio técnico enorme. Por isso, recorri à ElevenLabs, uma empresa especializada em áudio.
Se você já ouviu um audiolivro narrado por IA, interagiu com um personagem com falas em um videogame ou escutou efeitos sonoros em uma série ou filme, é bem provável que já tenha tido contato com a tecnologia da ElevenLabs.
Para clonar minha própria voz, paguei US$ 22 por uma conta Creator. Em seguida, enviei cerca de 90 minutos de gravações do meu canal no YouTube para a interface da ElevenLabs.
Leia mais: Em breve, qualquer um com dados suficientes será capaz de criar um gêmeo digital
Em poucas horas, meu clone de voz profissional estava pronto. Usá-lo é assustadoramente simples. A ElevenLabs oferece uma interface muito parecida com a do ChatGPT: você digita o que quer que o seu clone diga, aperta um botão e, em segundos, a voz do seu gêmeo digital pronuncia exatamente as palavras que você escreveu.
Pedi que meu gêmeo digital gravasse uma atualização em áudio sobre este artigo para meu editor na Fast Company. Ele descreveu o resultado como “aterrorizantemente realista”. Depois, enviei um trecho para minha mãe. Ela respondeu: “teria me enganado”.
MEU GÊMEO DIGITAL NA MINHA PRÓPRIA CASA
Para a próxima etapa do experimento de clonagem, recorri à Synthesia. A empresa é especializada na criação de “avatares” digitais – ou seja, clones em vídeo de uma pessoa real.
Assim como na ElevenLabs, você digita um texto na interface e recebe um vídeo do seu avatar lendo aquilo em voz alta, com expressões faciais realistas e sincronização labial convincente.
Para criar meu avatar pessoal, a Synthesia pediu acesso à minha webcam e me gravou lendo um roteiro padrão exibido na tela por cerca de 10 minutos.

Um dia depois, meu avatar estava pronto. Era um clone digital perfeito da minha aparência – até a camisa que eu usava no dia da gravação e meu corte de cabelo. Assim como no clone de voz, eu podia digitar qualquer texto e, em cerca de 10 minutos, receberia um vídeo do Tom Digital lendo tudo em voz alta.
A Synthesia duplicou até os detalhes mais sutis do meu estilo de apresentação: meu sorriso, a tendência de olhar para a câmera a cada poucos segundos enquanto leio um roteiro na tela.
Se eu publicasse um vídeo com o Tom Digital no meu canal do YouTube, tenho certeza de que a maioria dos usuários não perceberia que se trata de uma falsificação.
O VALOR DAS PESSOAS
Meu experimento mostra que a tecnologia atual de clonagem por IA é muito impressionante. Eu poderia facilmente criar montanhas de conteúdo em áudio com meu clone da ElevenLabs ou montar um canal inteiro de redes sociais tendo o Tom Digital como estrela.
A questão maior, no entanto, é por que eu faria isso.
É claro que existem diversos bons casos de uso para trabalhar com um gêmeo digital. A Synthesia, por exemplo, é especializada em vídeos corporativos de treinamento. Empresas podem criar rapidamente materiais didáticos personalizados sem alugar um estúdio, contratar um videomaker ou gravar incontáveis tomadas de alguém falando diante de um fundo verde.
é curioso pensar que, daqui a 10 anos, eu poderia trazer o Tom Digital de 2026 de volta à vida.
Também é possível editar esses vídeos simplesmente alterando algumas palavras escritas – por exemplo, quando há uma pequena mudança em algum recurso ou produto.
Já a ElevenLabs faz muitos negócios com audiolivros e agentes de atendimento ao cliente. Mas também oferece serviços como a criação de versões em áudio de páginas da web para pessoas com deficiência visual.
Ainda assim, meu experimento me convenceu de que há poucos bons motivos para trabalhar com o seu próprio gêmeo digital.
Em um cenário de internet em que qualquer pessoa pode criar um site de mil páginas em poucos minutos usando o Gemini, e em que vídeos que chamam a atenção estão por toda parte graças ao Sora, o conteúdo se tornou barato. Restam poucas maneiras eficazes de separar o que tem valor do que é só ruído.
Personalidade é uma das poucas coisas que sobraram. Pessoas gostam de acompanhar pessoas. Para criadores, desenvolver uma relação pessoal com o público é a melhor forma de mantê-lo consumindo seu conteúdo, em vez de recorrer a alternativas de IA mais baratas – e, muitas vezes, melhores.
Comprometer isso, colocando um avatar na frente da audiência sem revelar que se trata de um gêmeo digital, por mais convincente que seja, parece a forma mais rápida de destruir essa relação.
As pessoas querem ouvir o Thomas Smith feito de carne e osso, mesmo que a versão de inteligência artificial nunca esqueça uma palavra ou seja interrompida pelas galinhas no meio do vídeo.
UM BACKUP DE SI MESMO
Consigo imaginar o uso de personagens prontos da ElevenLabs ou da Synthesia para criar conteúdos totalmente transparentes sobre sua natureza artificial. Mas não consigo me ver colocando meus próprios gêmeos digitais em uso no mundo real.
Ainda assim, vejo um uso claro para essa tecnologia. Durante o experimento, me ocorreu que o melhor motivo para criar um gêmeo digital de IA não é substituir sua voz ou aparência, mas preservá-las.
Restam poucas maneiras de separar o que tem valor do que é só ruído. Personalidade é uma das poucas que sobraram.
Se algum dia eu fosse afetado por um distúrbio vocal e tivesse minha voz prejudicada para sempre, é reconfortante saber que existe um backup altamente realista guardado nos servidores da ElevenLabs.
Também é curioso pensar que, daqui a 10 anos, eu poderia trazer o Tom Digital de 2026 de volta à vida. Ele estaria congelado no tempo – uma réplica perfeita da minha aparência, dos meus trejeitos e do meu ambiente neste momento específico, acessível para sempre.
Não vou usar o Tom Digital para turbinar meu canal no YouTube, entrar no mundo dos podcasts ou ler histórias para meus filhos antes de dormir. Mas existe uma parte estranha de mim que fica feliz em saber que ele está lá fora, só por precaução.

