Tehnologija

Zabrinjavajuće otkriće: Većina ljudi ne može da razlikuje glas čoveka, od onog koji je kreirala veštačka inteligencija

Komentari
Zabrinjavajuće otkriće: Većina ljudi ne može da razlikuje glas čoveka, od onog koji je kreirala veštačka inteligencija
Zabrinjavajuće otkriće: Većina ljudi ne može da razlikuje glas čoveka, od onog koji je kreirala veštačka inteligencija - Copyright Unsplash/Catherine Breslin

Autor: Euronews

13/10/2025

-

20:47

veličina teksta

Aa Aa

Većina ljudi više ne može da razlikuje prave ljudske glasove od sintetičkih klonova nastalih uz pomoć veštačke inteligencije, pokazalo je novo istraživanje.

U novom istraživanju, objavljenom u časopisu PLoS One, učesnicima je predstavljeno 80 različitih uzoraka glasa – polovina su bili AI glasovi, a polovina ljudski. Zadatak im je bio da procene ono što čuju prema nivou poverenja i dominacije.

U okviru AI kategorije, bilo je dve vrste glasova: generički – kreirani od nule i klonirani – napravljeni na osnovu snimaka stvarnih ljudi.

Dok su ispitanici uglavnom prepoznali generičke AI glasove kao lažne, klonirane verzije su im bile znatno teže za razlikovanje: 58 odsto njih pogrešno je ocenilo da su ti glasovi pravi. Poređenja radi, 62 odsto pravih ljudskih glasova ispravno je identifikovano kao ljudsko, što pokazuje da je razlika u percepciji minimalna.

"Najvažniji zaključak istraživanja jeste da glasovi koje je generisala veštačka inteligencija, posebno klonirani glasovi, zvuče podjednako ljudski kao i pravi snimci ljudskih glasova", izjavila je za Euronews dr Nadin Lavan, glavna autorka studije i profesorka psihologije na Univerzitetu Kraljice Meri u Londonu.

"Posebno je upečatljivo što smo koristili komercijalno dostupne alate – dakle, svako može da napravi realističan glas bez potrebe za velikim ulaganjima, programerskim znanjem ili tehničkim veštinama", ističe Lavan.

Stariji ljudi mete prevara

Tehnologija kloniranja glasa funkcioniše tako što analizira i izvlači ključne karakteristike iz glasovnih podataka. Zbog svoje sposobnosti da oponaša glas vrlo precizno, postala je popularan alat među telefonskim prevarantima, koji ponekad koriste objave s društvenih mreža da bi imitirali glasove bližnjih svojih žrtava.

Najugroženiji su stariji – prema istraživanju Univerziteta u Portsmutu, najmanje dve trećine osoba starijih od 75 godina bilo je meta pokušaja telefonskih prevara. U skoro 60 odsto slučajeva, pokušaji prevare obavljeni su putem glasovnih poziva.

Unsplash/Steve Johnson

 

Iako nisu svi ti pozivi zasnovani na AI tehnologiji, ona postaje sve zastupljenija zahvaljujući svojoj sofisticiranosti i dostupnosti, a među popularnim primerima su Hume AI i ElevenLabs.

Kloniranje glasova postalo je i tema zabrinutosti u industriji zabave, gde su glasovi nekoliko poznatih ličnosti korišćeni bez dozvole. Glumica Skarlet Johanson prošle godine je kritikovala OpenAI jer je njihov ChatGPT koristio glas koji je "jezivo sličan" njenom glasu iz filma "Her".

Takođe, sve su češći i "audio deepfake" primeri u kojima se imitiraju političari ili novinari, s ciljem da se manipuliše javnim mnjenjem i šire dezinformacije.

Dr Lavan smatra da programeri AI sistema moraju preuzeti veću odgovornost i uvesti snažnije mere zaštite.

"Iz naše perspektive kao istraživača, uvek bismo preporučili da kompanije koje razvijaju ovu tehnologiju sarađuju s etičarima i donosiocima odluka, kako bi se razmotrila etička i pravna pitanja – na primer, vlasništvo nad glasovima i pojam pristanka u svetu koji se stalno menja", kaže ona.

Korisne strane nove tehnologije

Kao i svaka tehnologija, i AI-generisani glasovi mogu imati pozitivnu upotrebu – naročito za osobe koje ne mogu da govore ili imaju poteškoće s govorom.

"Ovakva pomoćna tehnologija postoji već neko vreme – Stiven Hoking je jedan od najpoznatijih primera. Ono što je novo jeste mogućnost da se sintetički glas personalizuje na načine koji ranije nisu bili mogući", kaže Lavan.

"Danas korisnici mogu da odluče da ponovo kreiraju svoj izvorni glas, ako to žele, ili da osmisle potpuno novi koji odražava njihov identitet i lični stil", dodaje ona.

Ako se koristi etički i odgovorno, ova tehnologija mogla bi značajno doprineti pristupačnosti i raznovrsnosti u obrazovanju, emitovanju i produkciji audio-knjiga.

Na primer, jedno istraživanje pokazalo je da učenje uz pomoć AI-audio sistema povećava motivaciju i angažovanost učenika, posebno onih s neurodiverzitetom poput poremećaja pažnje i hiperaktivnosti (ADHD).

Unsplash/Igor Omilaev

 

"Još jedan fascinantan razvoj jeste mogućnost da se glas klonira na različite jezike, omogućavajući ljudima da se izražavaju preko jezičkih barijera, a da pritom zadrže svoj prepoznatljiv glas. To bi moglo biti revolucionarno za globalnu komunikaciju, pristupačnost i kulturnu razmenu", dodala je Lavan.

Kako veštački glasovi sve više postaju deo svakodnevice, menjaće se i načini na koje ih doživljavamo i koristimo.

"Zanima me kako svest o tome da je neki glas AI generisan menja način na koji ljudi komuniciraju s njim", rekla je Lavan.

"Bilo bi zanimljivo istražiti i kako ljudi reaguju na AI glasove koji su prijatni i lepo zvuče, ali su očigledno neljudski: da li bi više ili manje verovali takvim glasovima? Da li bi se manje ljutili na njih kada nešto pođe po zlu? Sva ta pitanja mogu mnogo da nam otkriju o tome šta je suštinski važno u odnosu između čoveka i računara", zaključila je ona.

Komentari (0)

Magazin