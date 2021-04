Oikeusministeriön raportin mukaan anonyymi Ylilauta-sivusto on merkittävin julkinen vihapuheen alusta Suomessa. Tekoälyn avulla toteutetun selvityksen mukaan lähes kaikki suomenkielisestä vihapuheesta julkaistaan Ylilaudalla.

Selvityksen aineisto kerättiin julkisesta suomenkielisestä sosiaalisesta mediasta viime vuoden syys- ja lokakuussa pääasiassa hakurobottien avulla. Tekoälyn keräämiä viestejä kertyi noin 12 miljoonaa. Tämän lisäksi osa aineistosta jouduttiin keräämään käsin, sillä Hommaforum ja Ylilauta olivat kieltäneet hakurobottien toiminnan sivuillaan.

– Eräs kiinnostava huomio on, että tietyt sivustot, joita pidetään merkittävinä vihapuheen osalta, ovat kieltäneet automaattisen datan keräyksen, sanoo toimitusjohtaja Mari-Sanna Paukkeri selvityksen toteuttaneesta Utopia Analyticsistä.

Mainos alkaa

Mainos päättyy

Hommaforum ja Ylilauta saatiin mukaan selvitykseen siten, että niistä kerättiin käsin aineisto-otos, jonka vihaviestiosuus suhteutettiin kuukausittaisiin kokonaisviestimääriin. Automaattisesti ja käsin kerätty aineisto kattaa yhteensä vajaat 17 miljoonaa viestiä. Vihaviestejä oli kaikkiaan noin 298 000 kappaletta eli 1,8 prosenttia.

– Yksi tutkimuksen tulos on, että vihapuhetta on. 1,8 prosenttia kaikista viesteistä on kohtuullisen iso osuus, Paukkeri sanoo.

Määrällisesti toiseksi eniten vihaviestejä Twitterissä

Kaikista vihaviesteistä 96 prosenttia, noin 285 000 kappaletta oli julkaistu Ylilaudalla. Vihapuheen osuus kaikista Ylilaudan viesteistä oli noin kuusi prosenttia.

Ylilaudan jälkeen määrällisesti merkittävin alusta on raportin mukaan Twitter. Tunnistetuista vihaviesteistä 7 450 kappaletta eli 2,5 prosenttia oli julkaistu siellä. Vihapuheen osuus oli Twitterin koko sisällöstä kuitenkin varsin pieni, 0,14 prosenttia. Raportin mukaan Twitterin vihaviesteistä iso osa, liki 40 prosenttia on uudelleentviittauksia.

Yli tuhannen vihaviestin määriin tutkimusaikana ylsivät myös Suomi24- ja Hommaforum-keskustelupalstat. Suomi24:ssa vihaviestejä oli 1 931, mikä on 0,32 prosenttia sen kaikista viesteistä. Hommaforumilla vihaviestejä julkaistiin noin 1 600 kappaletta. Se on vajaat yhdeksän prosenttia sivuston kaikesta sisällöstä.

Blogien, uutiskommenttien ja julkisen Facebookin osuus vihaviesteistä jäi alle 0,2 prosentin. Raportissa huomautetaan, että aineistossa eivät ole mukana Facebookin yksityiset ryhmät ja julkaisut, ja että sen merkitys vihapuheen alustana on oletettavasti huomattavasti raportin antamaa kuvaa suurempi.

Tarkasteluaikajaksolta erottui joitakin piikkejä vihapuheen määrässä. Raportin mukaan niiden kohdalle ajoittui kolme tapahtumaa, jotka ovat saattaneet vaikuttaa vihapuheen lisääntymiseen: Helsinki Pride -viikko, Elokapina-mielenosoitus, jossa poliisi käytti kaasusumutinta mielenosoittajiin sekä Trendi-lehden numero, jossa julkaistiin kuva pääministeri Sanna Marinista (sd.) jakkutakissa ilman aluspaitaa.

Miten vihapuhe määriteltiin?

Vihapuheen tutkiminen tekoälyn avulla lähti siitä, että sille opetettiin, mitä vihapuhe on.

– Tekoäly sinänsä ei osaa mitään. Kun tekoälyä tämän tyyppisissä tilanteissa käytetään, tarvitaan aina ihminen, joka kertoo sille, mitä tehdä, Paukkeri sanoo.

Ensin tutkija määritteli, mitä vihapuheeksi luetaan. Selvityksessä käytetyn määritelmän mukaan vihapuhe on halventavia, nöyryyttäviä, uhkaavia, vihamielisiä tai epäinhimillistäviä ilmaisuja, jotka esimerkiksi liittyvät ihmisen henkilökohtaisiin ominaisuuksiin, kuten sukupuoleen, uskontoon tai ulkonäköön taikka jotka leimaavat jotakin ihmisryhmää. Lisäksi vihapuheeksi määriteltiin ammattiryhmään, kuten poliitikkoihin tai tutkijoihin kohdistuva vihapuhe sekä solvaukset ja kehotukset väkivaltaan.

Paukkeri kertoo, että määritelmä opetettiin tekoälylle niin, että tutkija merkitsi osan aineiston viesteistä vihapuheeksi. Näin se oppi määritelmän ja jatkoi ihmisen aloittamaa työtä. Tekoälyn etu tällaisessa tutkimisessa on Paukkerin mukaan paitsi se, että se pystyy käymään läpi suuria aineistoja, myös tasainen jälki.

– Se tekee aina samanlaisia päätöksiä. Vastaavaa työtä tekevä ihminen voi esimerkiksi aamulla olla vähän väsyneempi. Kone tekee aina samalla tavalla, jolloin mahdollisuus vertailla eri päivien ja alustojen välillä on parempi.

Tekoälyn puutteena taas Paukkeri mainitsee sen, että se kykenee tunnistamaan ainoastaan usein toistuvia tapahtumia ja harvinaisemmat poikkeukset siltä jäävät huomaamatta.