Predstavljen OpenVoice - platforma koja nudi mogućnost kloniranja glasa
MyShell je predstavio OpenVoice, platformu razvijenu od strane istraživača s MIT-a, Univerziteta Tsinghua u Pekingu i kanadske kompanije MyShell, koja nudi kloniranje glasa temeljem samo nekoliko sekundi snimke izvornog govora te omogućava kontrolu nad tonom, naglaskom, emocijama i ritmom.
Riječ je o tehnologiji otvorenog koda koja postavlja nove standarde u području repliciranja glasa pomoću umjetne inteligencije, koristeći mali audio isječak, sa preciznom kontrolom tona, emocija, naglaska, pauza i intonacije, prenosi Bug.hr.
Obučen je na različitim glasovnim uzorcima, što mu omogućava brzo prepoznavanje i ubrzavanje vremena potrebnog za kloniranje novog glasa, a sastoji se od dva AI modela koji zajedno rade na pretvaranju teksta u govor i kloniranju tona glasa, pomoću kojih je moguće reproducirati glas korisnika i promijeniti ton ili emociju u govoru, navodi VentureBeat.
OpenVoice može klonirati glasove s vrlo malo podataka kombinovanjem univerzalnog govornog modela s uzorkom glasa koje daje korisnik, prenosi AI News.
Ovaj AI model može se isprobati na platformama LeptonAI i Hugging Face, unošenjem tekstualnog unosa ili kratkom snimkom vlastitog glasa, te odabiranjem naglaska, tona glasa, emocije itd.