Page 26 - Tvorjenje pomena in večrazsežna – večkodna pismenost
P. 26
Jure Longyka Razločevanje med naravnim in sintetiziranim govorom
Radio Slovenija, Slovenija v slovenščini
jure.longyka@gmail.com
V prispevku obravnavamo, koliko človek na trenutni stopnji razvoja in razširjeno-
Maja Krebl
sti sintetiziranega govora v slovenščini lahko razloči med sintetiziranim in narav-
maja.krebl@gmail.com
nim govorom. V študiji primera smo ugotavljali, kateri človeški dejavniki lahko
Marko Bajec vplivajo na tako razločevanje. Anketiranci so poslušali 96 sintetiziranih in narav-
Univerza v Ljubljani, Slovenija nih posnetkov štirih slovenskih govorcev v nepredvidljivem vrstnem redu. Vzorec
marko.bajec@fri.uni-lj.si (N = 408) so sestavljali anketiranci iz splošne in strokovne javnosti. V povprečju so
©2026JureLongyka,MajaKrebl pravilno razločili v 68,63 primerov. Naravne posnetke so prepoznali uspešneje
in Marko Bajec od sintetiziranih. Razločevanje se zvišuje z naraščanjem dolžine in kompleksnosti
besedila, od besedne zveze do dolge kompleksne povedi. Najuspešneje, v 90,07
, prepoznajo sintetizirani govor s pravorečnimi napakami. Druge slabosti sin-
tetiziranega govora, kot so zvočni artefakti, nesmiselni poudarki ali neustrezna
interpretacija, nimajo velikega vpliva. Naprava za poslušanje tudi ne. Razločeva-
nje je uspešnejše, če se anketiranec poklicno ukvarja z elektronskimi mediji ali
ima izkušnje s sintetiziranim govorom. Napovedovalci in igralci razločujejo uspe-
šneje od ostalih anketirancev (Barrington idr., 2025; Lavan idr., 2019; Rosi idr., 2025).
Razločevanje je pomembno različno med štirimi zastopanimi govorci. Domneva,
da je uspešnejše, če govorca poznajo, je v posameznih primerih nakazana, a je
statistična analiza ni potrdila.
Barrington, S., Cooper, E.A., in Farid, H. (2025). People are poorly equipped to de-
tect AI-powered voice clones. Scientific Reports, 15, 11004.
Lavan, N., Burton, A., Scott, S. K., Scott, S. K., in McGettigan, C. (2019). Flexible vo-
ices: Identity perception from variable vocal signals. Psychonomic Bulletin &
Review, 26(1), 90–102.
Rosi V., Soopramanien, E., in McGettigan, C. (2025). Perception and social evalua-
tion of cloned and recorded voices: Effects of familiarity and self-relevance.
Computers in Human Behavior: Artificial Humans, 4, 100143.
Tvorjenje pomena in večrazsežna –
večkodna pismenost
Zbornik povzetkov
mednarodnega simpozija
Koper, 19.–20. marec 2026
https://doi.org/10.26493/978-961-293-565-8.23 26

