Gemini

Mākslīgā intelekta paškritika: kā ar prasmīgām uzvednēm novērst halucinācijas

Lielo valodu modeļu (large language models jeb LLM) “halucinācijas” nav kļūda to programmatūras kodā, bet gan to arhitektūras (autoregresīvās prognozēšanas) dabisks rezultāts. Lai šo problēmu risinātu, nepietiek tikai ar jautājuma uzdošanu; ir fundamentāli jāmaina veids, kā modelis apstrādā informāciju savā konteksta logā (context window).

1. Problēmas sakne: lineārā prognozēšana

Lielie valodu modeļi ģenerē tekstu pakāpeniski – vārdu pa vārdam (jeb marķieri pa marķierim, kurus sauc par tokeniem). Brīdī, kad modelis izvēlas nākamo vārdu, tas balstās uz varbūtību sadalījumu.

Šeit slēpjas risks: ja modelis teikuma sākumā pieļauj nelielu loģikas kļūdu, tā autoregresīvā daba to “piespiež” turpināt iesākto kļūdaino domu gājienu, lai saglabātu teksta plūdumu un saskaņotību. Modelis nespēj “pārdomāt” un izdzēst jau uzģenerētu vārdu. Tā rodas pārliecinoši uzrakstīti, bet faktoloģiski nepatiesi apgalvojumi.

2. Risinājums: rekursīvā apstrāde un konteksta izmantošana

Paškritikas metodes (self-reflection, critique) efektivitāte slēpjas faktā, ka tā pārvērš rezultātu (izvadi) atpakaļ par izejas datiem (ievadi).

Kad lūdzat modelim kritizēt savu tekstu, notiek šāds process:

  1. Konteksta fiksēšana. Iepriekš ģenerētais teksts (ar visām iespējamām kļūdām) kļūst par nemainīgu faktu konteksta logā.

  2. Uzmanības (attention) pārslēgšana. Modelim vairs nav jātērē skaitļošanas resursi satura radīšanai. Tā “uzmanības mehānismi” tiek fokusēti uz analītisku salīdzināšanu starp ģenerēto tekstu un lietotāja instrukcijām vai loģikas likumiem.

  3. Kļūdu izmantošana. Kritikas rezultātā iegūtais kļūdu saraksts kļūst par jaunu, ierobežojošu instrukciju (negative constraints) nākamajai izveides (jeb precīzāk būtu nodēvēt šo procesu par ģenerāciju) kārtai.

3. Stratēģiskie soļi halucināciju mazināšanai

Lai sasniegtu visaugstāko precizitāti, ieteicams izmantot daudzpakāpju spriešanas (multi-step reasoning) ķēdes.

A. Domāšanas ķēde (Chain of Thought)

Vienkāršas atbildes saņemšanas vietā pieprasiet procesu.

  • Princips. Piespiežot modeli soli pa solim aprakstīt domāšanas gaitu, samazinās varbūtība, ka tas “uzminēs” nepareizu rezultātu, jo katrs nākamais solis loģiski izriet no iepriekšējā.

  • Uzvednes piemērs: “Pirms sniedz gala atbildi, soli pa solim apraksti loģiku, kā tu nonāksi pie secinājuma.”

B. Lomu kritika (Persona-based Critique)

Modelis simulē dažādas perspektīvas, lai atrastu “aklās zonas”.

  • Princips. LLM apmācības datos ir iekļauti dažādi teksta stili. Aktivizējot, piemēram, “skeptiska zinātnieka” lomu, tiek mainīts varbūtību svars – modelis sāk dot priekšroku vārdiem, kas saistīti ar šaubām, pārbaudi un precizitāti, nevis ar radošu izdomu.

C. Iteratīvā uzlabošana

Visefektīvākā metode ir cikls: “Ģenerē -> Vērtē -> Uzlabo”.

Ģenerē

Tiek radīts melnraksts (Sistēma 1 – ātra, intuitīva).

Vērtē

Tiek dots uzdevums: “Novērtē precizitāti skalā no 1 līdz 10 un uzskaiti trūkumus” (Sistēma 2 – analītiska). Šis solis ir kritisks, jo tas rada strukturētus datus par kļūdām. Zemāk ir piemērs ar šī raksta izskatīšanu – jau izveidotam saturam tika pieprasīta analīze, lai vēl labāk uzlabotu šo rakstu, iegūtu skatu no malas.
Pielietotā uzvedne:

Izlasi šo rakstu. Novērtē to skalā no 1 līdz 10 attiecībā uz precizitāti.

Iegūtais rezultāts ar Gemini palīdzību:

Uzlabo

Tiek dots uzdevums:

Uzraksti uzlabotu versiju, lai tā atbilstu 10 ballēm, novēršot identificētos trūkumus.

Šo soli varat apvienot kopā ar izvērtēšanas vaicājumu: pieprasīt izanalizēt saturu, apkopt secinājumus un uzreiz arī rīkoties. Ja vēlaties sākumā izvērtēt secinājumus, varbūt selektīvi atzīmēt, kurus no tiem izmantot turpinājumā, tad nāksies šīs uzvednes nodalīt atsevišķi.

Izvērtējiet rezultātu un pēc vajadzības varat turpināt uzvednes, piemēram, izmantot šādu latviešu valodas uzlabojumiem.

Izveidot tekstu, lai atbilst latviešu valodas gramatikai un valodas lietojumam. Tu esi pieredzējis latviešu valodas redaktors un prasmīgi proti izvērtēt un labot valodas lietojumu: gan gramatiku, gan stilistiku.

Šādi novērsīsiet, ka AI izmanto reti izmantotus vārdus vai rakstīs virsrakstos katru vārdu ar lielo burtu, padarīs latviešu valodas lietojumu raitāku un mazinās vajadzību pašiem veikt tālākas korekcijas tekstā.

Svarīgi atcerēties!

Mākslīgā intelekta modeļi “nezina” patiesību – tie pārzina varbūtības. Halucinācijas rodas, kad varbūtība uzvar pār faktiem. Ieviešot paškritikas posmu, jūs mākslīgi ievietojat “verifikācijas slāni” starp modeļa iekšējo statistiku un gala rezultātu. Tas pārvērš radošu pļāpāšanu precīzā analīzē un atbilstošā rezultātā. Papildu metode ierasto čatu halucināciju novēršanai ir izmantot alternatīvu NotebookLM, kas strādā ar stingri norādītiem avotiem, vai izmantot šo pašu NotebookLM piezīmju grāmatu un pievienot to sarunā ar Gemini čatbotu.

Šī pievienošana notiek tādā pašā veidā kā failu vai attēlu izvēle.

Digitālā mārketinga un lietotāju pieredzes eksperts. Saziņai: edgars@picco.media