Page 338 - Izobraževanje v dobi generativne umetne inteligence
P. 338
Ernest Ženko
č
č
Slika 5 Uravnavanje sistemov (G)UI
terdisciplinarnih pristopov, ki združujejo tehnološke, filozofske in družbene
oz. kulturne perspektive. V tem smislu uravnavanje UI ni zgolj tehnični izziv,
temveč tudi družbeni projekt, ki zahteva sodelovanje strokovnjakov z različ-
nih področij.
Vendar pa pogledi na uravnavanje UI niso enotni, saj med njimi srečamo
tudi takšne, ki menijo, da se glede uravnavanja sistemov UI ni treba posebej
truditi, saj le-ti že imajo vgrajene vrednote, namene in cilje, le da ti niso njiho-
vi, pač pa človeški, kajti UI je pravzaprav naše zrcalo, zrcalni odsev človeške
družbe (Vallor, 2024). V tem smislu so torej sistemi UI vedno že uravnani, saj
se pri učenju naučijo tudi naših vrednot, seveda pa tudi naših pomanjkljivosti
in napak.
V kolikor bi slednje držalo dobesedno, bi si težko predstavljali, da od sis-
temov GUI sploh lahko dobimo smiselne odgovore, glede na to, koliko ne-
smiselnih in tudi neresničnih informacij je na internetu. Vendar pa tudi v tem
primeru pomaga, če vsaj bežno poznamo način delovanja te tehnologije.
Proces učenja modelov GUI namreč poteka v dveh fazah, kar dejansko
omogoča uravnavanje teh modelov s človeškimi vrednotami. Prva faza,
imenovana »predhodno učenje« (angl. pretraining), obsega učenje iz velikih
količin podatkov, pridobljenih iz različnih virov. Med tem procesom mode-
li »nekritično preberejo« razpoložljive podatke, kar pomeni, da zaznavajo
vzorce, povezave in vzročnosti v podatkih, ne da bi vrednotili njihovo etično
ustreznost ali skladnost s človeškimi vrednotami oz. normami. Šele v drugi
fazi natančnega prilagajanja (angl. fine-tuning) modeli skozi skrbno zasno-
van proces učenja prejmejo dodatna navodila in prilagoditve, s katerimi se
poskuša zagotoviti njihova usklajenost z želenimi etičnimi in funkcionalnimi
cilji. Ta faza pogosto vključuje povratne informacije ljudi pri spodbujevalnem
učenju z nagrajevanjem in s kaznovanjem (angl. reinforcement learning with
338