Debatt ● Helge Høivik
KI-alderen krever presis og strukturert informasjon
Når kunstig intelligens blir tatt i bruk for å dekke dagliglivets og arbeidslivets behov, vokser betydningen av strukturkunnskap og presise datasett.
Denne teksten er et debattinnlegg. Innholdet i teksten uttrykker forfatterens egen mening.
Å kalle det kunstig intelligens har den uheldige tilleggsbetydning — konnotasjon — at KI-maskinenes tekster er sanne. De er ikke det. De uttrykker det som er vanlig å uttrykke rent formmessig — sant eller ikke.
Det kan bli feil, svulstig og stivt, men det skyldes først og fremst at KI forsterker det stive og svulstige som allerede finnes der ute i den akademiske og administrative skrivemåte. Legg til svake filtre i etter-redigeringen før det trykkes på [Send]. Dette kan reguleres i ledeteksten (prompt), men man kan aldri være helt sikker.
Man må derfor lese KI-generert tekst som første gangs framføring fra litt for med høy sigarføring og overdreven sjøltillit — kanskje etter en halvliter for mye.
Det betyr at undervisningens fagstoff, oppgavesett, sensurveiledninger og andre regulerende skrifter har fått nye bruksmåter med tilhørende nye krav. De skal ikke bare leses av studenter og lærere direkte. De leses også av KI-maskiner som så skriver ut just-in-time for tilegnelse av studenter og lærere på forespørsel.
Hvert samtaleunivers (Universe of Discourse — UoD) — enten det omfatter medisinsk forskning, juridiske rammer, finansiell analyse eller vitenskapelige disipliner — har unik terminologi, begrepsrelasjoner og kontekstuelle nyanser.
Det krever presis representasjon. Slike velstrukturerte datasett kan bidra til at KI-systemer utvikler mer nyanserte og treffsikre formuleringer. I praktisk bruk må altså beskrivelser av aktivitetsformål, situasjon og kontekst fra det aktuelle fag- og emneområde mates inn som ressurser i tillegg til spørsmål og ordre.
Tvetydighet kan oppstå når en term har flere tolkninger. Strukturert informasjon hjelper da KI med å avgjøre hva som er riktig. Ordet «bank» refererer både til finansinstitusjoner og å få det — bank altså. Vi forstår umiddelbart at det siste ikke er en donasjon. Hvis KI støter på en setning som Jeg vil ha pengene i bank, kan den bruke informasjon om at penger er relatert til finans, ikke vold, og dermed tolke på riktig måte.
Et annet eksempel er setninger med omtaler av rev for et dyr eller i overført betydning som ringrev, et skjær, fortidsformen (pretertium) av verbet å rive eller en hasjsigarett. Verre blir det med metaforisk glideflukt som når bjørnetjeneste er blitt en stor tjeneste, som jo ikke var meningen …
Ettersom generativ kunstig intelligens blir tatt i bruk for å dekke dagliglivets og arbeidslivets behov, vokser betydningen av slik strukturkunnskap. Det gjelder at data er organisert på en systematisk måte, ofte i form av tabeller, hierarkier eller nettverk. Det skal klargjøre hvilke begreper som er over- eller underordnede, og hvordan de språklig eller semantisk er knyttet til hverandre.
- En database som kartlegger medisinske symptomer og sykdommer kan f.eks. vise at hoste er relatert til både forkjølelse og lungebetennelse, men lungebetennelse kan også være knyttet til feber og kortpustethet.
- I en strukturert ordbok som WordNet kan hund registreres som en underkategori av pattedyr der golden retriever er en type hund.
- I juridiske dokumenter kan strukturert informasjon tydeliggjøre skillet mellom lovparagrafer, dommer og sitater. KI kan bruke dette til å referere til riktig lovtekst når den skal gi juridiske anbefalinger.
Velstrukturert informasjon kan gi mer effektiv databehandling med kjappere mønstergjenkjenning og bedre semantisk interoperabilitet. Dette legger føringer for utviklingen av faglig forfatterskap. Det gjelder forskningslitteraturen, som allerede har strenge formkrav. I større grad i nyutvikling av undervisningsressurser på norsk. Her står det utviklingsoppgaver i kø.