Tækni og fötlun: Áhrif gagnabjögunar á mannréttindi

Inga Björk skrifar (birtist upprunalega í Lestinni á Rás 1, 19. desember 2022)

Allt eru gögn. SMSið sem þú sendir ömmu þinni í gær, selfiemyndin af undirhökunni á þér sem besta vinkona þín fékk, dramatísk samskipti við fyrrverandi maka, hverju þú leitaðir að á Google í gærkvöldi þegar þú sast á klósettinu og hvaða leið þú keyrðir í vinnuna fyrir hálfu ári síðan. Gögn eru nýja olían á 21. öldinni, og hafa þróast frá því að vera persónulegt fyrirbæri sem tilheyra okkur sjálfum og einkalífi okkar og verða eins og náttúruauðlind sem bíður þess að verða beisluð og að fjárfestingu.

Stórt hneykslismál skók bandarísk stjórnmál þegar ENRON lýsti yfir stærsta gjaldþroti í sögu Bandaríkjanna árið 2001. Gjaldþrot fyrirtækisins er, þó ótrúlegt megi virðast, enn þann dag í dag að móta raunveruleika okkar í stafrænum heimi. Við rannsókn málsins lagði bandaríska orkueftirlitið hald á tölvupósta 600 þúsund tölvupósta 158 starfsmanna. Ákveðið var að tölvupóstarnir yrðu opinber gögn, fyrir rannsóknir og fræðastörf og vegna þess að þau vörðuðu almannahagsmuni. Fyrst voru gögnin, sökum stærðar, aðgengileg á hörðum diskum en spólum fram í tímann til dagsins í dag. Nú hafa gögnin verið sett á netið, og útvíkkuð og telja 1,7 milljón skilaboða, aðgengileg með auðveldum hætti á Amazon S3 gagnaskýinu. 

En hvað gerir þessi gögn merkileg? Enron gögnin voru í upphafi 21. aldarinnar, málfræðileg gullnáma. Tölvur þurfa nefnilega óendanlegt magn gagna til þess að læra, og þarna voru gögnin komin ljóslifandi sem áður voru fágæt auðlind og léleg. Þetta var á tíma þar sem internetið var í startholunum, aðgengileg gögn voru fábreytt og eðlilegur hversdagslegur texti til þess að byggja upp gagnasafn um tungumál ekki til staðar fyrir rannsakendur til þess að mata tölvurnar.

En gagnasafnið hafði skekkju sem átti eftir að hafa afleiðingar um ókomna tíð. Kate Crawford, sem fjallar um málið í bók sinni Atlas of AI, biður okkur að hugsa um hvers konar einstaklingar skipuðu stöður æðstu stjórnenda eins stærsta fyrirtækja Bandaríkjanna árið 2001? Með tilliti til kyns, litarhafts, fötlunar, uppruna, stéttarstöðu? 

Einn stærsti vandi tækni samtímans er nefnilega að litið er á textasöfn sem hlutlaus stikkprufu úr tungumálinu, þar sem hægt er að leggja að jöfnu leiðbeiningabækling með þvottavél og tölvupóstsamskipti vinnufélaga. Öllum texta sé hægt að skipta út, endurnýta hann og hagnýta — svo lengi sem að magnið sé bara nógu mikið, til þess að hægt sé að þjálfa kerfið til þess að giska á hvaða orð kæmi á eftir öðru. Það skiptir nefnilega máli hvaðan orðin koma. Ef það eru skekkjur í texta og bjögun eru þær byggðar inn í stærra kerfi og þau kerfi valda svo allskyns afleiðingum í lífi fólks og í samfélögum sem þau nota. 

Það er ekki til hlutleysi tungumáls og öll textasöfn eru til, í samhengi við tíma, stað, menningu og pólitík. Á sama hátt eru tungumál hópa, sem hafa ekki eins mikið magn af gögnum, og þar af leiðandi lægri rödd, ekki aðgang að kerfunum. Þetta hefur sýnt sig í raddstýringum bæði erlendis og hér á landi, að fólk sem talar með hreim, eða á erfitt með mál vegna veikinda eða fötlunar, getur ekki stýrt tækjunum. Hópar sem kannski helst þyrftu á því að halda.

Í kringum aldamótin voru gagnasöfn með andlitsmyndum mjög fágæt auðlind, og var brugðið á það ráð í George Mason háskólanum í Bandaríkjunum að taka ljósmyndir af fólki með mismunandi svipbrigði, í ólíkri lýsingu, frá ólíkum sjónarhornum, í mismunandi fötum og jafnvel yfir nokkurra ára tímabil, til þess að búa til gögn til þess að kenna tölvukerfum hvernig fólk lítur út og hvernig það breytist. Á þessum tíma þurfti samþykki fólks fyrir notkun myndanna, en sú menning átti eftir að breytast. 

Þegar netnotkun fór að aukast þurfti ekki lengur að búa þau til, það var einfaldlega hægt að sækja þau á samfélagsmiðla þar sem sjálfsmyndir fóru að birtast af allskonar fólki í allskonar aðstæðum, lýsingu, pósum og fötum. Tíst og stöðuppfærslur samfélagsmiðla krúguðust í tugþúsundum og síðar milljónum á hverri klukkustund. Fólk hleður inn upplýsingum um sig sjálfviljugt, merkir hver er á hvaða mynd og hvar hún er tekin. Þannig fá tölvurnar ekki bara gögn heldur geta tengt þróun aldurs og merk fólk á tiltekna staði. Vinnan er ynnt af hendi í skiptum fyrir afþreyingu og þátttöku í stafrænum heimi. Með sama hætti fá verktakar greidda smáaura fyrir að skoða myndir og merkja hvað er á myndunum fyrir gagnasöfn á borð við ImageNet, þar sem myndir almennings eru teknar af netinu í tugmilljóna vís. Þannig lærir tölvan að ávali hluturinn er ekki bolti heldur epli — epli séu til í tilteknum litum og líti svona út. Að hundur og ljón séu tvö ólík fyrirbæri. ImageNet hefur umbylt þróun gervigreindar en myrkahlið slíkra gagnasafna er alvarleg. Fólkið sem merkti myndirnar gat valið úr ótal flokkum þegar það merkti efni myndanna. Til dæmis epli, flugvélar og glímukappar. En það voru líka fordómafullar og dónalegar merkingar sem merktu fólk í flokka eins og alkóhólisti, apamaður, klikkaður, hóra, skáeygður, að sögn Crawford. 

Hún hefur bent á að rannsóknarsvið gervigreindar nálgist gögn, og söfnun á þeim, eins og náttúruauðlindir. Uppspretta fyrir aðra til þess að taka og hagnýta, án nokkurrar umræðu um siðferði og persónuvernd viðfanga. Slíkt gildi bæði í einkageiranum og í akademíunni. Þrátt fyrir að eiga við mjög viðkvæm gögn, sem hafa mikil áhrif á líf fólks, mannréttindi og stöðu þess, þá er eftirlitið lítið sem ekkert. 

Á síðustu áratugum hafa komið upp ótal atvik þar sem gögnum hefur verið safnað um fólk án vitundar þess, án samþykkis og með óeðlilegum hætti. Allt til þess að nota í vélnámi og kenna tölvum að læra á mynstur og að þekkja hluti.

En skiptir það kannski engu máli því enginn veit hver er á bakvið gagnasöfnin, þau eru þannig séð, ópersónugreinanleg? 

 

__________________________________________________________________________

Hægt er að hlusta á pistilinn í Lestinni hér (byrjar á mínútu 42)

Hlusta hér

Vegna mikils áhuga á pistlum Ingu Bjarkar Margrétar Bjarnadóttur, sérfræðings Þroskahjálpar í málefnum fatlaðs fólks, um fötlun og tækni höfum við ákveðið að birta þá alla í rituðu máli. Pistlarnir hafa verið spilaðir í útvarpsþættinum Lestin á Rás 1 en þar snertir Inga Björk á ýmsum áskorunum sem fatlað fólk stendur frammi fyrir í sífellt stafrænni heimi