Felaktiga slutsatser och snedvridningar samt diskrimineringsrisker vid i användningen av artificiell intelligens kan grovt delas in i:
- sådana som beror på AI:s verksamhet (till exempel snedvridningar i algoritmer och data),
- sådana som beror på användarens verksamhet och tolkning (till exempel användarfärdigheter och tolkning och förståelse av information som AI genererat) och,
- systemiska dvs. sådana som beror på utbildningssystemets verksamhet och organisationens verksamhetskultur (t.ex. utbildningssystemets strukturer och verksamhetssätt kan påverka data som används samt informationshanteringen och skapa snedvridningar).
Dessutom bör man beakta att utvecklingen av AI-applikationer inte kan lösgöras från den kulturella och historiska kontexten, värderingarna och andra bakgrundsfaktorer. För närvarande grundar sig AI-systemen, i synnerhet generativ artificiell intelligens, i hög grad på storbolagens kommersiella utvecklingsarbete och de data de använder samt på beräkningskapaciteten i molnservrarna de erbjuder (cloud computing). AI-applikationerna beaktar sällan till exempel det finska språkets särdrag och kulturella kontext eller värdegrunden i de finländska läroplanerna.
Vid användning av artificiell intelligens påverkas snedvridningar och felaktiga slutsatser samt diskrimineringsrisker till exempel av
Fel i algoritmer eller i skapandet av AI-modeller
Planeringsfel i algoritmers eller AI-modellens utvecklingsskede kan förvränga algoritmerna och tolkningen av data, även om de data som används i sig är korrekt. Felen kan vara såväl logiska planeringsfel som små tekniska fel. Utvecklingen av algoritmer och träning av AI-modellen samt testning och efterprocessering påverkar i hög grad om det förekommer snedvridningar i algoritmerna och AI:ns verksamhet, samt möjliga negativa likvärdighetseffekter som diskriminering.
Användning av data i fel sammanhang
Som undervisningsdata för AI-modellerna har man kunnat välja datamängd (dataset) eller använda variabler som lämpar sig dåligt för AI:ns användningsändamål. Datans uttryckskraft räcker inte nödvändigtvis till för att beskriva det önskade fenomenet, utan i sig korrekta data används i fel kontext eller så har de använda variablerna har valts fel. Till exempel data från lärandeanalytiken som innehåller logguppgifter om inloggning, klickningar och tidsanvändning i webbinlärningsmiljön lämpar sig mycket dåligt för att skapa AI-modeller av elevens motivation eller för att förutspå lärresultat.
Liten mängd data
Mängden data som används för att träna AI-modeller har varit för liten vilket har gjort att det inte har varit möjligt att skapa högklassiga och exakta AI-modeller samt testa dem. Detta leder lätt till felaktiga slutsatser och snedvridningar i användningen av artificiell intelligens. Ofta förutsätter skapandet av modeller för maskininlärning en mycket stor datamängd, så kallad big data.
Snedvridning förknippat med insamling och urval av data
Träningsdata som använts som grund för AI-modellerna har valts felaktigt, kan vara ensidigt eller lämpar sig dåligt för användningsändamålet i fråga. Då kan data till exempel dåligt representera ett större set och dess egenskaper och skapa snedvridningar i AI-modeller och därmed i AI:ns resultat.
Fel och värden som saknas i data
Ofta kan datamängder innehålla felaktiga värden eller sakna uppgifter. Om datan är felaktig kan inte heller AI:ns resultat vara korrekta. Rensning av data och kvalitetssäkring är det viktigaste skedet i utvecklingen av artificiell intelligens. För att korrigera saknade och avvikande värden i data kan man använda olika metoder, vars tillförlitlighet måste bedömas separat.
Fel generalisering
Vid användning av AI eller AI-modeller kan man lätt göra en felaktig generalisering mellan populationerna. Särskilt i lärandeanalytiken ska man beakta att man inte kan dra direkta slutsatser mellan populationerna. Till exempel kan man inte utifrån lärandedata för klass 5A dra särskilt starka slutsatser om klass 5B. Å andra sidan kan lärresultaten från förra årets 5B inte generaliseras till årets 5B.
Aggregering
Om man till exempel räknar ut medelvärden för heterogent material eller skapar modeller som baserar sig på medelvärden, beskriver det inte längre materialets målgrupp särskilt väl eller kan inte tillämpas till exempel på en enskild elev. Istället för beräkningar baserade på gruppen (inkl. Gauss kurva) får man ofta de mest korrekta resultaten inom AI och lärandeanalytik genom att använda individens longitudiella data, den så kallade idiografiska metoden.
Gamla data
Data som används som grund för AI-modellen kan beskriva det förflutna, den gamla situationen och strukturerna och lämpar sig därmed dåligt för att förklara den nuvarande kontexten. Till exempel kan tidigare insamlade data återspegla tidigare eller i nutid förekommande attityder i samhället, olikvärdighet i anknytning till diskrimineringsgrunder eller en ojämställdhet mellan könen. Å andra sidan ska man även noggrant bedöma hur tidigare data om eleverna lämpar sig för nuläget efter ändringar i utbildningssystemet och en reform av läroplanerna. Kärnfrågan är hur väl man kan förutspå framtiden utifrån historien? Dessutom bör man beakta att lagstadgade skyldigheter om likvärdighet och jämställdhet förutsätter att anordnare av utbildning och småbarnspedagogik eliminerar olikvärdighet med aktiva handlingar. En metod för att främja likvärdighet och jämställdhet är positiv specialbehandling.
Utöver AI:ns snedvridningar talar man ibland lite lekfullt om AI-hallucinationer, då AI berättar sagor och hittar på saker som inte är verkliga eller sanna. Då är det oftast inte fråga om en egentlig snedvridning av data eller algoritmer, utan AI producerar till exempel utifrån data eller en omfattande språkmodell resultat som är korrekta enligt språkmodellen och data, men som inte motsvarar fakta i verkligheten.
Vid likvärdighetsauditering och -testning av en AI-modell är det väsentligt att beakta utgångspunkter och skyldigheter i den nationella likabehandlings- och jämställdhetslagstiftningen. Metoder som använts internationellt är inte nödvändigtvis överensstämmande med nationell likabehandlings- och jämställdhetslagstiftning.