Dum, dummere, dansk med offentlig sprogmodel for kunstig intelligens
SF har foreslået, at Danmark skal have sin egen sprogmodel i stil med ChatGPT, men den vil for længst vil være irrelevant, når projektet engang er færdigt.
Dette er et debatindlæg: Finans bringer løbende indlæg fra specialister og meningsdannere. De er alle udtryk for den pågældende skribents egen holdning.
I 2014 udgav Deloitte en rapport, der gjorde det klart, at Skatteministeriet langtfra besad kompetencerne til at opbygge et ejendomsvurderingssystem. Alligevel kastede ministeriet sig straks over prestigeopgaven, og resultatet var forudsigeligt: Systemet blev mange gange dyrere end budgetteret, og ved lanceringen i 2023 virkede det overhovedet ikke.
For at gnide salt i såret havde det private marked, i form af banker og mindre iværksættervirksomheder, allerede løst udfordringen tilfredsstillende og til en brøkdel af prisen.
En så pinlig offentlig fiasko skal selvfølgelig gentages – nu med kunstig intelligens - AI. Denne gang kommer initiativet fra politisk hold, nemlig SF’s Lisbeth Bech-Nielsen og Karina Lorentzen Dehnhardt, der har foreslået, at Danmark skal have sin egen sprogmodel (LLM) i stil med ChatGPT. En opgave med ny teknologi i et marked, der udvikler sig ekstremt hastigt. Såvel teknologien som markedet overgår faktisk ejendomsvurderingerne mange gange i kompleksitet.
Rent bortset fra, at det offentlige med sikkerhed vil forfejle projektet, hænger spørgsmålet om behovet for en dansk sprogmodel stadig i luften. Svaret må være et klart nej. SF’s lovforslag indeholder ganske vist tilsyneladende gode argumenter såsom, at ChatGPT “tager ikke højde for danske kulturelle normer og værdier”, samt at ChatGPT ikke kender de danske helligdage.
De argumenter falder dog hurtigt til jorden. Man kan nemlig sagtens “fintune” de kendte sprogmodeller, både de frie open source-modeller og kommercielle som ChatGPT, og lære dem vores normer og værdier. Som sidebemærkning kan man også spørge, om staten på den måde virkelig skal diktere vores værdier i en sprogmodel?
Hvad angår problemet med de danske helligdage, bygger det på en stor misforståelse. Sprogmodeller skal nemlig ikke kende fakta eller bruges som søgemaskiner. De skal ræsonnere over sprog og ikke andet. Fakta får de gennem adgang til f.eks. internettet, danske lærebøger, eller hvad man nu har lyst til.
Det stærkeste argument imod en dansk sprogmodel er, at den for længst vil være irrelevant, når projektet engang er færdigt. Teknologien er allerede på vej videre mod nye og større AI-modeller, der kan forstå både tekst, billeder, lyde og videoer. Hvad der herefter sker med teknologien, ved ingen.
Endelig står vi så med dataudfordringen. En dansk sprogmodel kræver danske data. Det har danske AI-folk råbt på i mange år. Fra politisk hold har man dog ikke villet frigive disse data, som bl.a. findes hos bibliotekerne og Danmarks Radio. Det sjove er, at hvis man frigav dem, ville det også hjælpe f.eks. ChatGPT med bedre at forstå dansk sprog og kultur. Så måske man skulle starte her?
Forslaget er altså at bygge en dansk sprogmodel, der bliver dyr at udvikle og vedligeholde, og som vil mangle data og være irrelevant, når den er færdig. Desuden vil den være ringere, end hvad man finder på det frie marked. Konklusionen er enkel: Ud med den idé.
Men hvad så? Jo, i stedet skal vi bruge vores energi på det, vi er gode til i Danmark. Vi har et kæmpe forspring og et enormt potentiale, som vi skal udnytte. Såvel den offentlige sektor som erhvervslivet er allerede stærkt digitaliseret. Den digitale infrastruktur, som AI skal leve på, er vi allerede længst med. Samtidig er vi et land med masser af tillid. Vi stoler på hinanden, hvilket gør det let at afprøve nye teknologier uden alt for meget juridisk tovtrækkeri. Derfor kan og skal Danmark være det land, der bliver bedst til at udbrede og udnytte AI med alle dens fordele.



