Oliver Laas: TI abil profileerimise probleemidest
Tehisintellekti abil inimeste profileerimisega kaasnevad probleemid, millel võib olla seaduskuulekate inimeste jaoks kõrge hind, hoiatab Oliver Laas Vikerraadio päevakommentaaris.
Riigikogu võttis 19. juunil vastu "superandmebaasi seaduse." See annab rahapesu andmebüroole (RAB) õiguse 11 registriga liidestatud andmelaos olevate, pseudonüümitud andmete analüüsimiseks. Rahapesu ja terrorismiga võitlemiseks lubatakse väidetavalt kasutada nii andmekaevet kui ka tehisintellekti (TI) abil profileerimist. Seadust on kritiseeritud nii enne kui ka peale selle vastuvõtmist.
Seaduse pooldajad tunnistavad selle võimalikke negatiivseid mõjusid. Teiste seas toovad nad esile andmelekked ning ebatäpsete andmete põhjal tehtavad valejäreldused. Viimaste tõenäosust hindavad nad keskmiseks.
Teiste riikide kogemused sarnaste süsteemide juurutamisega näitavad, et negatiivsed mõjud ei ole pelgalt teoreetilised. Suure andmelekke hiljutiseks näiteks on National Public Data andmeleke, mis avalikustas sadade miljonite ameeriklaste isikuandmed. Siinkohal keskendun aga TI abil profileerimise probleemidele, sest neist on vähem juttu olnud.
Holland võttis 2013. aastal kasutusele automatiseeritud süsteemi, et elanike kohta koostatud riskiprofiilide alusel riiklike toetuste pettureid tuvastada. Selleks kasutatud masinõppe algoritm oli kallutatud – süüdistatavad olid sageli madalama sissetulekuga või mõne rahvusvähemuse liikmed – ja ebatäpne – kümned tuhanded süüdistused olid alusetud. Paljud pered langesid ekslike kahjunõuete tõttu vaesusesse, Hollandi maksuamet sai kaela 3,7 miljoni euro suuruse trahvi ning Mark Rutte valitsus astus 2021. aasta alguses tagasi.
Alates 2013. aastast kasutas Michigani osariik automatiseeritud süsteemi MiDAS, et tuvastada töötuabiraha pettusi. Millised olid tagajärjed? Kümnete tuhandete inimeste alusetu süüdistamine ja neilt raha sissenõudmine süsteemi poolt, mis eksis 93 protsendil juhtudest.
COMPAS on mitmes USA osariigis kasutatav TI süsteem, mida kasutatakse kahtlusaluste retsidiivsusriski hindamiseks. See ennustab 137 küsimusele antud vastuste ning treeningandmetest õpitud mustrite põhjal, kui suure tõenäosusega kahtlustatav ei ilmu kohtuistungile või sooritab järgmise kahe aasta jooksul uue kuriteo.
Retsidiivsuse ennustamisel on COMPAS ainult veidi parem mündiviskest. Samuti on see kallutatud, sest alahindab valgenahaliste retsidiivsusriski ja ülehindab mustanahaliste oma. Ühe uurimuse kohaselt ei ole COMPAS-i hinnangud täpsemad ega erapooletumad kui erialateadmisteta tavainimeste omad.
Arvind Narayanan ja Sayash Kapoor kirjutavad oma eelmisel aastal ilmunud raamatus "AI Snake Oil", et sellistel TI süsteemidel on fundamentaalne puudus: nende otsused või ennustused peavad paika ainult muus osas muutumatutel tingimustel.
Selle valguses võib RAB-i käsutusse antava superandmebaasi peal treenitud masinõppe algoritmi tulemuste täpsust hakkata mõjutama algoritmi enda lisamine rahapesu tuvastamise protsessidesse. Näiteks masinõppe kasutamine värbamisprotsessis on viinud selleni, et inimesed lisavad oma CV-dele valges kirjas märksõnu või kasutavad muid trikke, et automatiseeritud kontrollist mööda pääseda.
Kui TI kasutamine rahapesu tuvastamiseks viib sarnaste muutusteni kurjategijate käitumises, siis võib heal juhul tulemuseks olla Pyrrhose võit, mille tegelikku hinda seaduskuulekaile kodanikele võime eespool toodud näidete ja teiste sarnaste juhtumite varal ette aimata.
Kõiki Vikerraadio päevakommentaare on võimalik kuulata Vikerraadio päevakommentaaride lehelt.
ERR.ee võtab arvamusartikleid ja lugejakirju vastu aadressil arvamus@err.ee. Õigus otsustada artikli või lugejakirja avaldamise üle on toimetusel.
Toimetaja: Mirjam Mäekivi




