MI beidzot spēj tīri labi izlasīt rokrakstus!
- 22. nov.
- Lasīts 4 min
Vēl pirms nedēļas lekcijā dzimtu pētniekiem Valmiermuižā teicu, ka ar nepacietību gaidu, kad mākslīgais intelekts spēs izlasīt rokrakstus. Līdzšinējie eksperimenti ar dažādiem MI modeļiem mūsu ģenealoģisko dokumentu lasīšanai bija visai neveiksmīgi.
Un tad ieradās Gemini 3 Pro!

Gemini 3 Pro modelis tika izlaists tieši 18.novembrī un uzreiz izpelnījās lielu sajūsmu. Protams, jaunumi MI jomā tagad ir katru dienu un ne visam var akli ticēt. Tomēr, mani ieinteresēja pozitīvas atsauksmes tieši par modeļa spēju saprast vēsturiskos rokrakstus (vairāk lasiet šajā Marka Hamfrīsa (Mark Humphries) bloga ierakstā angliski.
Izmēģināju pati un varu pievienoties sajūsmai – beidzot ir modelis, kas daudz labāk par iepriekšējiem spēj izlasīt vēsturiskos rokrakstus.
1. Pirmais eksperiments: vecvectēva studiju lieta
Sāku ar manuprāt vienkāršāku uzdevumu - “iedevu” modelim izlasīt mana vecvectēva studiju lietu, kas pamatā ir latviski un rokrakstā. Tajā ir dažādi dokumenti:
lūgums uzņemt universitātē,
izraksts no kristību reģistra,
pases noraksts
skolas absolvēšanas dokumenti u.t.t.
Palūdzu modelim izvilkt biogrāfisku informāciju un pēc 74 sekundēm ieguvu visai lietojamu informāciju ar personas datiem, ģimenes stāvokli, izglītību u.t.t.
Tomēr pamanīju arī kļūdas. Modelis bija sajaucis kristību ieraksta ailes – mātes vietā iekopējot krustmāti. Arī draudzes nosaukumu bija interpretējis greizi. Taču lielākā daļa informācijas bija pareiza.
Un tieši šeit, manuprāt, slēpjas lielākais risks: rezultāts ir tik labs, ka cilvēkiem būs slinkums pārbaudīt tās pāris kļūdiņas.
2. Nopietnākais pārbaudījums: baznīcu grāmatas
Tālāk ķēros klāt tam, ko uzskatu par visgrūtāko — kristību ierakstu transkribēšanai. Izvēlējos tādu samērā labi salasāmu rokrakstu un norādīju, ka tas ir no Mežmuižas luterāņu draudzes Latvijā.

Atkal — rezultāts bija pārsteidzoši labs, bet kļūdas bija.
Runge nav bērna uzvārds, bet māju vārds, kurā par kalpu strādā tēvs Ansis.
Stintiņ tika saprasts kā Plintis.
Kļūdas bija arī krustvecāku uzvārdos.

Bet es nemetu plinti krūmos. Izskaidroju modelim, kas ir kas, un palūdzu transkribēt nākamo ierakstu no tās pašas lapas.

Un šoreiz — jūtams progress.Gemini pareizi saprata, ka Laure ir māju vārds, nevis uzvārds. Tas pat mēģināja papildināt uzvārdus ar mūsdienu formām, piemēram:
Osoling = Ozoliņš,
Anliese = Anlīze.

3. Diskusija ar modeli: Gemini analizē, nevis akli piekrīt
Te mums ar Gemini izvērtās diskusija par krusttēvu Ansi Ozoliņu, kurš ierakstā minēts kā bērna turētājs kristībās. Vāciski to sauc par Haltpathe.
Gemini gan bija pārliecināts, ka redz Wolgaling un ka cilvēks bijis muižas galdnieks (Gutszimmermann), nevis Haltpathe.
Lai arī es tam nepiekritu, mani patiesi pārsteidza tas, kā modelis argumentēja:
salīdzināja burtu vilcienus ar citiem burtiem lapā,–
skaidroja, kāpēc uzskata, ka konkrētais burts izskatās tieši tā.
Tie, kas strādājuši ar ChatGPT, zina, cik bīstami ir tas, ka tas vienmēr “piekrīt”. Gemini ir pretstats — tas mēdz pastāvēt pie sava, skaidrot un analizēt. Man pat būtu paticis turpināt šo sarunu un iemācīt tam vēl labāk saprast mūsu baznīcu grāmatas, bet bija jāpabeidz šis bloga ieraksts:)
4. Rokraksti krieviski: NKVD materiāli
Trešais eksperiments bija ar NKVD krimināllietas lapām, rokrakstā un krievu valodā. Arī te Gemini tika ļoti labi galā. Protams, bija mazas kļūdiņas:–
Vitālijs pārtapa par Vasiliju,
Barkava — par Varakļāniem, utt.
Bet kopumā: saturs bija pareizi saprasts, viņš spēja gan dokumentu transkribēt, gan uztaisīt kopsavilkumu un pat pievienot vēsturiskā konteksta skaidrojumu.
5. Kopsavilkums: tas mainīs dzimtu pētniecību
Nav šaubu, ka šis rīks nesīs lielas pārmaiņas. Bet — kā ar visu MI — būs arī problēmas.
Ja cilvēks nepārzinās oriģinālvalodu vai rokrakstu, kļūdas izķert būs neiespējami. Un tā kā rezultāts ir labs, ļoti bieži nebūs vēlmes pārbaudīt.
Kāpēc lasīt 30 lapas pašam, ja MI iedod kopsavilkumu, vai ne?
6. Pieci ieteikumi, kā rokrakstus atšifrēt labāk
Noslēgumā vēl paša Gemini ieteikumi, kā strādāt labāk:
1) Izgriezt konkrētu kristību ierakstu, nevis dod visu baznīcu grāmatas lapu. Tas ļauj viņam netērēt laiku uz citas informācijas apstrādi;
2) Iedot precīzu konteksta informāciju.
Ko rakstīt: Piem. "Šī ir 1883. gada luterāņu baznīcas grāmata no Kurzemes (Latvija). Valoda: vācu, ar latviešu personvārdiem. Pievērs uzmanību, ka tēva vārds bieži sākas ar mājas vārdu (Gesinde), kam seko statuss (Knecht) un tad uzvārds."
Kāpēc: Kā mēs redzējām ar "Runge Knechts Ans", modelis sākumā nesaprata struktūru. Ja Tu pasaki priekšā formulu [Mājas vārds] + [Statuss] + [Vārds] + [Uzvārds], kļūdu skaits krasi samazinās.
3) Pieprasīt precīzu transkriptu, nevis tulkojumu:
Ko rakstīt: "Transkribē precīzi to, kas rakstīts, burtu pa burtam (verbatim). Neatšifrē saīsinājumus, ja tie nav skaidri. Ja vārds nav salasāms, liec [?]. Nemini."
Kāpēc: Tas piespiež modeli fokusēties uz vizuālo tekstu (kā "Wolgaling" vs "Osoling"), nevis mēģināt uzminēt. Jāatceras, ka modelis nav tikai "lasītājs", bet arī "minētājs". Tas izmanto varbūtības.
4) Iedot vietējo vārdu datubāzi. Ja Tev ir zināmi šī pagasta izplatītākie uzvārdi vai māju vārdi, iedod tos sarakstā.
Ko darīt: "Šajā pagastā bieži sastopami uzvārdi ir: Spurdziņš, Veckungs, Ozoliņš. Pārbaudi, vai neskaidrais vārds sakrīt ar kādu no šiem."
Kāpēc: LLM modeļiem ir grūtības ar īpašvārdiem, jo tiem nav semantiskas nozīmes. Iedodot sarakstu, Tu samazini halucināciju risku.
5) Kļūdu gadījumā, likt domāt vizuāli.
Ja redzi, ka modelis kļūdās (kā ar "Gutszimmermann" vs "Haltpathe"), nepietiek tikai pateikt "nē, tur ir cits vārds".
Ko rakstīt: "Tu izlasīji 'Osoling', bet es redzu burtu, kas izskatās pēc 'W' un beigas '-ling'. Lūdzu, apraksti pirmā burta formu vizuāli un salīdzini to ar citiem 'W' burtiem lapā."
Kāpēc: Tas liek modelim "pārslēgties" no teksta ģenerēšanas režīma uz vizuālās atpazīšanas režīmu. Tas bieži noved pie tā, ka modelis pats "pamana" savu kļūdu un izlabo to, kā mēs to darījām ar galdnieka ierakstu.
P.S. Gemini 3 Pro variet bez maksas izmēģināt Google AI Studio



Komentāri