Huomiota herättämässä

Kotimaisten sanomalehtien Facebook-postaukset yleisöhuomion ja -aktiivisuuden kerääjinä

LUOTSIVA-tutkimushankkeen ensimmäisessä tutkimusvaiheessa (1.8.2017–30.4.2018) on selvitetty, minkä tyyppisiä postauksia ja minkälaista sisältöä kotimaisten sanomalehtien Facebook-sivuilla jaetaan ja millaista aktiivisuutta ne lukijoissa herättävät. Hankkeen tutkimuskohteina ovat kaksi maakuntalehteä (Keskisuomalainen ja Kaleva) ja kaksi paikallislehteä (Jämsän Seutu ja Sisä-Suomen Lehti), jotka ovat sitoutuneet hankkeeseen yhteistyöosapuolina.

Tutkimuksen aineisto koostuu em. sanomalehtien yhden vuoden Facebook-datasta aikaväliltä 1.6.2016–31.5.2017. Lisäksi tutkimuksen taustoittamiseksi haastateltiin sanomalehtien edustajia (4 kpl) loppuvuonna 2017. Tutkimuksen yhtenä metodina on käytetty kuvailevaa tilastoanalyysia (KvantiMOTV, 2004), jonka avulla vertailtiin kaikkia lehtien sivuille tehtyjä Facebook-postauksia yhden vuoden ajalta (yhteensä 6674 postausta). Tilastollisessa analyysissä havainnoitiin yleisesti postausmääriä ja niiden tuottamia aktiivisuusmuotoja, eli hymiö-reaktioita, jakoja ja kommentteja, sekä tarkasteltiin seuraajamääriä. Tilastollinen analyysi keskittyi erityisesti selvittämään, mitkä tekijät (vuorokauden ja viikon ajat, kuukauden ajat, postaustyypit, yleisön tai lehden tekemät postaukset) herättävät huomiota ja aktivoivat yleisöä. Toisena metodina käytettiin lähilukuanalyysiä (Kain, 1998), jonka avulla analysoitiin manuaalisesti 16 kokonaisdatasta aktiivisuusmäärän perusteella lohkaistua otosta (yhteensä 1076 postausta). Otoksiin koottiin jokaisen lehden eniten ja vähiten hymiö-reaktioita saaneet postaukset sekä eniten jakoja ja kommentteja saaneet postaukset. Lähilukuanalyysin keinoin tarkasteltiin seikkaperäisemmin asioita, jotka vaikuttavat lukijoiden aktiivisuuteen. Tutkittiin, miten postauksien tarkempi sisältö (postaustyyppi, aihealue, uutiskriteerit ja emotionaalinen sävy) vaikuttaa siihen, että sanomalehtien postaukset saavat paljon tai vähän huomiota.

Tutkimuksessa käytettyjä käsitteitä ja määritelmiä

Aktiivisuusmuoto ilmaisee, miten yleisö on reagoinut postaukseen. Aktiivisuusmuotoja ovat hymiöreaktiot (tykkäys, ihastu, haha, vau, surullinen, vihainen), kommentit sekä jaot.

Postaustyypit on määritelty Facebookin postaustyyppien mukaan: tapahtumailmoitus [Event], postaus jossa linkki [Link], postaus jossa kuva [Photo], postaus vain tekstillä [Status], postaus jossa video [Video]). Edellä mainittua jakoa on käytetty tilastollisessa analyysissä. Lähilukuanalyysissä käytetty jaottelu tuo erikseen esiin ns. natiivipostaukset (tekstiä, kuvaa tai videota, jota ei löydy sanomalehden verkkosivuilta, vaan postauksen sisältö sijaitsee alunperin ja vain Facebookissa) ja kilpailu/kyselypostaukset, joissa on yleensä palkinto ja ne ovat joko natiiveja (sijaitsevat Facebookissa) tai ei-natiiveja (on linkitetty lehden verkkosivuille tai on toteutettu reaalimaailmassa). Lähilukuanalyysissä on käytetty vain kolmijakoa linkkipostaus, natiivipostaus ja kilpailu/kyselypostaus.

Aihealue kuvaa yksityiskohtaisesti postauksen sisällön aihepiiriä ja/tai uutisen genreä (esim. luonto, urheilu, politiikka). Juttuaihe puolestaan kuvaa yksityiskohtaisemmin, mitä postaus käsittelee, esim. paikallisvaalit.

Uutiskriteerit (9 kpl) määrittelevät tapahtuman uutisarvon. (Uutiskriteerit on muokattu aiempia tutkimuksia apuna käyttäen: Galtung & Rugen, 1965; Golding & Elliott, 1979; Harcup & O´Neill, 2001; Rauhala, 2016):
ajankohtaisuus: juttu kertoo tapahtumasta, joka on tapahtunut hetki sitten tai tapahtuu lähiaikoina
henkilöityvyys: juttu henkilöityy yhteen tai useampaan ihmiseen, mm. henkilökuvat; seuranta: jutun aihe on ollut esillä viime aikoina – kuluvalla tai aiemmilla viikoilla
laajuus: juttu kertoo aiheesta, joka voi koskettaa tai voi koskettaa useampaa ihmistä
paikallisuus: juttu käsittelee maantieteellisesti lähellä olevia tapahtumia ja ihmisiä (myös ennen paikkakunnalla asuneet ihmiset), lehden levikkialueen uutisointia
negatiivisuus: jutun aihe on erityisen negatiivinen eli järkyttävä, dramaattinen tai muutoin huono uutinen
positiivisuus: jutun aihe on erityisen positiivinen kuten pelastusoperaatio tai selviytymistarina
vallankäytön korostuminen (vallankäyttäjät): jutut käsittelevät vaikutusvaltaisia ihmisiä, organisaatioita ja yrityksiä, kuin myös puolueita ja työmarkkinajärjestöjä
viihdyttävyys: juttuaiheet ovat viihteellisiä ja käsittelevät aiheita kuten human interest, eläimet, lapset tai julkkikset
visuaalisuus: juttuun sisältyy (merkittävässä roolissa) video-, ääni-, still-kuvaa tai muita näyttäviä visuaalisia elementtejä
yllättävyys: jutun aihe on yllättävä tai poikkeuksellinen.

Emotionaalisen sävyn kategorisoinnissa on hyödynnetty tunnesävyanalyysiä ’sentiment analysis’ (ks. tunnesävyanalyysin kategorioinnista esim. Kiritchenko, Zhu & Mohammad, 2014).
Emotionaalisen sävyn suhteen postauksia on tarkasteltu aiheen, postauksen/uutijutun otsikon sekä mahdollisen viesti/saatetekstin perusteella. Analyysiin ei ole otettu mukaan postauksen aktiivisuusmuotoja (hymiö-reaktiot, jaot, kommentit), vaan postaus on tarkasteltu puhtaasti toimituksen tekemän ja tuottaman tekstisisällön perusteella, eli mm. toimittajan sanavalinnoilla on ollut merkitystä. Postaukset on jaoteltu emotionaalisen sävyn perusteella kolmeen eri kategoriaan: negatiiviseen (kielteisiä, negatiivisia tunteita ilmaiseva postaus), neutraaliin (neutraaleja tai sekä positiivisia että negatiivisia tunteita yhtä aikaa ilmaiseva postaus) tai positiiviseen (myönteisiä, positiivia tunteita ilmaiseva postaus).

Sanomalehtien Facebook-seuraajamäärät

Suomessa yleinen kiinnostus Facebookia kohtaan näyttää useiden lähteiden mukaan tällä hetkellä (syksyllä 2018) laskevaa trendiä (ks. esim. Pönkä, 2018). Yksi suurimmista spekulaation kohteista laskeviin käyttäjämääriin on tämän vuoden keväällä julkisuuteen noussut Cambridge Analytica -tietovuoto – suurelle yleisölle paljastui miljoonien Facebook-käyttäjien tietojen päätyminen väärinkäytön kohteeksi. Cambridge Analytica -yhtiö oli kehittänyt Facebookin käyttäjätietojen avulla ohjelman, jonka avulla voitiin kohdistaa mainontaa Facebook-käyttäjille. Yhtiön toiminnan vaikutuksien on katsottu ulottuneen aina Yhdysvaltain (vuoden 2016) presidentin vaaleista Iso-Britannian brexitiin.

Mielenkiintoista on kuitenkin huomata, että tässä tutkimuksessa mukana olevien sanomalehtien seuraajamäärät eivät ole laskeneet yhtä lehteä lukuun ottamatta elokuusta 2017 elokuuhun 2018 välisellä ajalla, vaan ne ovat kolmen lehden kohdalla nousseet (ks. alla oleva taulukko). Sisä-Suomen Lehden Facebook-sivujen seuraajamäärä on kasvanut 321 seuraajalla ja tykkäysmäärä 308 tykkäyksellä, Jämsän Seudulla seuraajamäärä on kasvanut 825 seuraajalla ja tykkääjämäärä 775 tykkäyksellä, Kalevalla nousua on tullut seuraajien kohdalla 2465 ja tykkäysten 2293. Keskisuomalaisen seuraaja- ja tykkäysmäärät ovat laskeneet: 94 seuraajalla ja 267 tykkäyksellä. Voidaan spekuloida, että yhtenä mahdollisena syynä olisi Keskisuomalaisessa vuoden 2018 aikana aloitettu käytäntö linkittää entistä enemmän maksumuurin takana olevia juttuja Facebook-sivuilleen. Viime vuoden puolella kaikki lehden Facebookin viedyt uutiset pystyi vielä lukemaan maksutta postauksien kautta. Varsinainen syy vaatii kuitenkin lisää analyysiä, koska esim. Jämsän Seudun samanlainen käytäntö ei ole ainakaan vielä aiheuttanut seuraaja-aktiivisuuden laskua.

 

Sanomalehtien seuraaja- ja tykkääjämäärät (24.8.2017–28.8.2018)

Sisä-Suomen Lehti Jämsän Seutu KSML Kaleva
Follow Like Follow Like Follow Like Follow Like
24.8.2017 2388 2432 2625 2634 31245 32650 29916 30684
28.8.2018 2709 2740 3450 3409 31151 32383 32381 32977

Tärkeää on kuitenkin huomata, että vellovassa, spekuloidussa Facebookin laskusuhdanteessa kotimaiset sanomalehdet ovat onnistuneet jopa kasvattamaan Facebookin seuraaja- ja tykkääjämääriään.

 

Tutkimuksen tuloksia ja pohdintaa

Tilastollisten tulosten yhteenvetona voidaan todeta, että lehtien kannattaa suuren postausmäärän sijasta kiinnittää huomiota postausten sisältöön, postaustyyppeihin ja myös (vuorokauden) ajankohtiin. Tilastollisen analyysin tulokset osoittavat, että linkkipostaukset (jotka useimmiten ovat lehtien verkkosivuilta Facebookiin linkitettyjä uutisjuttuja) ovat olleet lehtien suosituimpia valintoja postaustyypiksi ja ne ovat toimineet hyvin kaikilla lehdillä – herättäneet huomiota ja aktivoineet yleisöä. Otosanalyysin tulokset tukevat sitä, että linkkipostaukset ovat saaneet aikaan aktiivisuutta, mutta tarkempi postaustyyppien tarkastelu paljastaa lisäksi sen, että myös muut postaustyypit ovat synnyttäneet aktiivisuutta. Esim. linkkipostaukset ovat keränneet eniten hymiö-reaktioita, mutta myös natiivipostauksilla on saatu aikaan suuria hymiö-reaktiomääriä Jämsän Seudussa ja Kalevassa. Myös tilastolliset tulokset osoittavat, että vaikka natiivipostauksia on tehty vähän, ne ovat tuottaneet hyvin aktiivisuutta per postaus.

Sanomalehdet ovat postanneet jonkin verran kilpailu/kyselypostauksia Facebook-sivuillensa. Sellaiset lehtien järjestämät kilpailut/kyselyt, joihin ei ole voinut osallistua suoraan Facebookissa, ovat voineet olla onnistuneitakin lehtien mielestä, mutta tämä kuva ei välity Facebookin kautta. Lehdet ovat järjestäneet myös sellaisia kilpailuja, joihin on voinut osallistua suoraan Facebookissa. Nämä satunnaiset kilpailupostaukset ovatkin saaneet hyvin aktiivisuutta, jonka voi havaita suoraan Facebookista. Lehtien onkin hyvä pohtia, mitä kilpailuilla ja kyselyillä halutaan tavoittaa, ja miettiä myös sitä, että miten sosiaalisen median yleisö voitaisiin ottaa jatkossa paremmin huomioon.

Eniten jakoja saaneiden postauksien postaustyyppi on kaikilla lehdillä ollut lähes aina linkkipostaus. Mukaan mahtuu jokunen natiivi- ja kilpailu/kyselypostaus, jotka ovat aiheuttaneet jakointoa yleisössä. Myös kommenttien osalta yleisin postaustyyppi on kaikilla lehdillä linkkipostaus. Jämsän Seudulla myös natiivipostaukset ovat saaneet hyvin kommentteja. Sisä-Suomen Lehdellä ja Kalevalla puolestaan kilpailu/kyselypostaukset ovat olleet jokseenkin suosittuja kommenttipaikkoja. Linkkipostaus itsessään ei siis kerro sitä, saako postaus paljon aktiivisuutta yleisön suunnalta. On tarkasteltava muitakin seikkoja kuin postaustyyppiä, jotta postausten suosiota selittäviä syitä saadaan selville.

Tilastollisen vertailun mukaan lehdet ovat tehneet kuva-, video- ja tekstipostauksia (ns. natiivipostauksia) yleisesti vähän, vaikka tulokset osoittavat niissä olevan paljon potentiaalia aktiivisuuden kasvulle. Vertailun mukaan vain yksi paikallislehti on ottanut kuva- ja videopostaukset aktiivisemmin ja hyvällä menestyksellä käyttöön. Samaan johtopäätökseen tultiin myös otosten lähilukuanalyysissä.  Erityisesti natiivina postatut kuvat, lukijoiden ottamat luonto- ja maisemakuvat, omaavat potentiaalia aktiivisuuden ja keskustelunkin rakentamisessa. Tilastollinen vertailu paljastaa myös, että paikallislehdillä kommenttien määrää voidaankin lisätä potentiaalisesti kuva- ja tekstipostauksilla ja maakuntalehdillä kuva- ja videopostauksilla. Kaikilla lehdillä video- ja kuvapostauksilla voidaan potentiaalisesti lisätä jakojen ja hymiö-reaktioiden määrää. Tähän kohtaan on hyvä muistuttaa, että tutkimuksen data on kerätty ajanjaksolta, jolloin muun muassa Facebook Live teki vielä tuloaan (Facebookin live-mahdollisuudet olivat kaikkien käyttäjien käytössä huhtikuusta 2016 alkaen). Voisikin ajatella, että videoiden tekomäärät ovat yleisestikin olleet hieman eri luokkaa tarkasteluajanjaksolla kuin ne ovat tänä päivänä.

Lehdet suosivat linkkipostauksia varmasti syystä – näin saadaan ohjattua liikennettä suoraan heidän omille verkkosivuille. Facebook alustana tuo lehdille paikan näkyä, mutta selkeä ansaintalogiikka siitä puuttuu. Mielenkiintoista onkin nyt seurata, kuinka tuloillaan oleva EU:n tekijänoikeusdirektiivi ja ns. “linkkivero” mahdollisesti vaikuttavat jatkossa mediatoimijoiden sosiaalisen median toimintaan (lue lisää  tekijänoikeusdirektiivistä esim. Helsingin Sanomien sivuilta).  Natiivipostauksien ja Facebookissa toteutettavien kilpailuiden ja kyselyiden tarkoitusta ja hyötyä lehdille tulisikin katsoa muusta kuin suorasta rahallisesta hyötymisestä. Imagolliset hyödyt ja brändääminen ovat näitä seikkoja, joita lehdet voivat vahvistaa natiivipostauksilla ja kilpailuilla. Lehdet voivat rakentaa suhdetta lukijoihinsa oikeanlaisten sosiaalisen median sisältöjen ja vuorovaikutuksen avulla, mikä puolestaan edesauttaa brändin vahvistumista sekä lukijoiden sitoutumista lehteen. Natiivipostauksia ja natiivisti järjestettyjä kilpailuja ja kyselyitä voisikin ajatella pienenä ekstrana nykyisille ja potentiaalisille lukijoille – satsauksena lehden imagollisiin seikkoihin.

Yleisön tuottaman materiaalin käyttöä ja vapaasti saatavilla olevan tiedon välittämistä sosiaalisen median palveluissa vs. lehtien omilla julkaisualustoilla on hyvä miettiä. Muun muassa yleisön sanomalehdille lähettämät lukijakuvat nousivat esiin tässä tutkimuksessa erittäin potentiaalisina aktiivisuuden tuottajina kuten myöskin esim. poliisin tiedotteiden postaaminen. Jos yleisön lehdelle (ilmaiseksi) käyttöön antama kuva julkaistaan lehden Facebook-sivuilla, voidaan ajatella kaikkien voittavan tilanteessa – yleisönjäsen saa kuvalleen näkyvyyttä ja lehti mahdollista aktiivisuutta ja näkyvyyttä sivullensa.  Jos puolestaan tämän tyylinen kuva tai julkinen materiaali (esim. viranomaisten tiedotteet) viedään maksumuurin taakse, saattaa maksumuurillisen julkaisukanavan valinta herättää ihmetystä. Luottamuksen rakentaminen yleisöön on haastavaa ja tämänkaltaisilla valinnoilla lehdet voivat itse vaikuttaa yleisösuhteeseensa.

Jo pienillä valinnoilla lehdet voivat saavuttaa itselleen hyvää. Olisi tärkeää ottaa huomioon se arvokas määrä lehden seuraajia, potentiaalisia tilaajia, joita he ovat Facebookin kautta jo tavoittaneet. Mikäli lehdet haluavat saada Facebookista ja muista sosiaalisen median palveluista lisäarvoa omalle toiminnalleen, jotain arvoa on annettava myös sosiaalisen median yleisölle. Kaikkea sisältöä ei pidä ymmärrettävästi antaa ilmaiseksi, mutta jotta saadaan lisää näkyvyyttä ja lukijoiden aktiivisuutta Facebookissa, olisi pyrittävä vastavuoroisuuteen.

Aihealueista nousee mielenkiintoiseesti esiin politiikka-aiheiset postaukset. Nämä postaukset ovat keränneet vähän hymiö-reaktioita, mutta saaneet osakseen paljon kommentointia. Tarkemmin ottaen kevyemmät (viihteellisemmät) politiikka-aiheet ovat synnyttäneet hyvin kommentointia, kun taas kovemmat politiikka-aiheet sekä ulkomaiden politiikkaa käsittelevät aiheet ovat keränneet vähäisempää aktiivisuutta, etenkin hymiö-reaktioiden kohdalla. Sanomalehtien lukijat tuntuvatkin siis olevan herkkiä kommentoimaan viihteellisiä politiikka-aiheita. Herääkin kysymys, ovatko tässä tutkimuksessa esiin nousseet lehdille suotuisat postausaiheet yleisesti sellaisia, jotka synnyttävät rakentavaa keskustelua. Tilastollinen vertailu paljastaa sen verran, että yleisö ei ole tehnyt missään lehdessä suurta määrää postauksia ja että nämä postaukset ovat tuottaneet vähän aktiivisuutta. Vain yhdessä paikallislehdessä yleisön postauksiin on tullut vähän enemmän aktiivisuutta. Esiin nouseekin myös kysymys: voidaanko keskusteluja ohjailemalla, niihin osallistumalla ja vuorovaikutusta rakentamalla, saavuttaa lehdille ja myös yleisölle suotuisia lopputuloksia. Muun muassa näihin asioihin etsitään vastauksia hankkeen toisessa tutkimusvaiheessa.

Postauksien ajankohtia tarkastelemalla selviää, että tilastollisen vertailun perusteella jakojen kulta-aika arkisin vaikuttaa olevan klo 8–16, ja kommenttien ja hymiö-reaktioiden myöhemmin klo 16 jälkeen. Jakojen kannalta lehdet postaavat arkena jo ns. ”oikeaan” aikaan, mutta kommenttien ja hymiö-reaktioiden näkökulmasta lehdet postaavat jokseenkin liian aikaisin.  Ilta- ja yöaika sekä viikonloput ovat lisäksi hyvää postausaikaa aktiivisuuden kannalta, mutta esimerkiksi viikonloppuna lehdet ovat postanneet sisältöä usein liian aikaisin.  Hankkeen toisessa vaiheessa tarkastellaan myös tarkemmin aikatekijöitä, voidaanko postausajankohtia tietoisesti valitsemalla saada aikaan halutunlaista tulosta.

Uutiskriteereiden tarkastelu vahvistaa sen, että maakunta- ja paikallislehdet täyttävät hyvin paikkakuntansa tärkeimmän tietokanavan tehtävän. Lehtien Facebook-sivuilla juuri paikalliset aiheet ovat tuottaneet paljon monenlaista aktiivisuutta.

Postauksien emotionaalisen sävyn tarkastelu paljastaa, että yleisö reagoi hymiö-reaktioilla mieluiten positiivisen sävyisiin postauksiin. Jakojen suhteen tulokset eivät ole aivan yhtä selkeät, mutta jakoja ovat saaneet enemmän aikaan kahdessa lehdessä negatiivissävytteiset postaukset ja kahdessa lehdessä postauksien emotionaalinen sävy on jakautunut melko tasaisesti. Yhteisenä tekijänä nousee esiin, että useat negatiivissävyiset postaukset viittaavat yleisön haluun tiedottaa muita Facebook-käyttäjiä vaaroista ja valjastaa postauksia muiden auttamiseen (tällaiset postaukset ovat saaneet hyvin jakoja).

Vuorovaikutuksen ja luottamuksen rakentamisen näkökulmasta keskustelua synnyttävien postauksien emotionaalisella sävyllä (aihealueen lisäksi) on varmastikin jonkin verran merkitystä. Kevyempiin ja positiivissävytteisempiin postauksiin on varmasti helpompi ennakoida tulevien kommenttien laatua, ja mahdollinen keskustelun ohjaaminen tuntuisi olevan tämän tyylisiin postauksiin lähtökohtaisesti helpompaa. Toisaalta lehtien on myös osattava varautua vastaamaan ja ottamaan kantaa kiperämpien postausten mukanaan tuomiin kommentteihin. Pääasia olisikin, että jos Facebookiin viedään erityisen negatiivinen tai muuten kuuma puheenaihe, toimitus pystyisi seuraamaan postausta edes tovin verran ja ottamaan tarpeen vaatiessa kantaa keskustelun kulkuun. Julkisen sanan neuvosto on ottanut päätöksessään kantaa (lue lisää JSN:n päätöksestä), että vaikka yleisön keskusteluketjut eivät ole toimituksellista materiaalia, tulisi toimituksen seurata tällaista yleisön tuottamaa aineistoa ja poistetaa ihmisarvoa ja yksityisyyden suojaa loukkaavat kommentit. Tämän hankkeen kautta on noussut esiin, etteivät toimitukset ole välttämättä perillä niiden sosiaalisen median toimintaan kohdistuvista JSN:n ohjeistuksista.

Tulokset myös osoittavat, että postauksia Facebookiin vievät toimittajat pystyvät vaikuttamaan sanavalinnoillaan postauksien emotionaaliseen sävyyn ja samalla siihen, ohjataanko keskustelua esimerkiksi mahdollisella avauskysymyksellä. Myös tätä seikkaa tutkitaan tarkemmin tutkimushankkeen toisessa vaiheessa.

 

Tutkimusraportti saatavilla Jyväskylän yliopiston JYX-julkaisuarkistosta: https://jyx.jyu.fi/handle/123456789/59961

 

Lähteet:

Galtung, J. & Ruge, M. 1965. The structure of foreign news: The presentation of the Congo, Cuba and Cyprus crises in four Norwegian newspapers.  Journal of International Peace Research 2, 64–91. Noudettu 16.8.2018: https://www.jstor.org/stable/423011

Golding, P. & Elliott, P. 1979. Making the news. London: Longman. Viitannut O’Neill, Deirdre & Harcup, Tony 2009: News Values and Selectivity. Teoksessa Wahl-Jorgensen, Karin & Hanitzsch, Thomas (2009): The Handbook of Journalism Studies. New York: Routledge. 161–174.

Harcup, T. & O’Neill, D. 2001. What is news? Galtung and Ruge revisited. Journalism studies, 2, 261–268. Noudettu 16.8.2018: https://www.tandfonline.com/doi/abs/10.1080/14616700118449

Helsingin Sanomat, 12.9.2018. Laura Halminen: “EU äänesti kohutun tekijänoikeus­direktiivin puolesta – Näin ”linkkivero” ja ”meemikielto” voivat vaikuttaa yrityksiin ja tavallisiin ihmisiin”. Noudettu 13.9.2018: https://www.hs.fi/teknologia/art-2000005824483.html

Julkisen sanan neuvoston ohjeistusta tiedotusvälineiden sosiaalista media koskien (ratkaisu 20.9.2017): Noudettu 14.9.2018: http://www.jsn.fi/sisalto/6630-yle-17/?year=2017&search=instagram

Kain, P. 1998. How to Do a Close Reading. Writing Center at Harvard University. Noudettu 16.8.2018: https://writingcenter.fas.harvard.edu/pages/how-do-close-reading

Kiritchenko, S., Zhu, X. & Mohammad, S. M. 2014. Sentiment Analysis of Short Informal Texts. Journal of Artificial Intelligence Research, 50, 723 – 762. Noudettu 16.8.2018: https://jair.org/index.php/jair/article/view/10896

KvantiMOTV, 2004. Yhteiskuntatieteellinen tietoarkisto. Menetelmäopetuksen tietovaranto: Tilastollinen päättely. Noudettu 12.9.2018: http://www.fsd.uta.fi/menetelmaopetus/paattely/paattely.html

Pönkä, H. 6.9.2018. Lehmätkin lentäis -blogi. Tilastoanalyysi: Voiko Facebookin ilmoittamiin käyttäjämääriin luottaa? Noudettu 11.9.2018: https://harto.wordpress.com/2018/09/06/tilastoanalyysi-voiko-facebookin-ilmoittamiin-kayttajamaariin-luottaa/

Rauhala,T.  2016. Somehuomion jäljillä: käyttäjien reagointi journalistisiin sisältöihin Ilta-Sanomien ja Helsingin Sanomien Facebook-sivuilla. Pro gradu -tutkielma. Jyväskylän yliopisto. Noudettu 16.8.2018: https://jyx.jyu.fi/handle/123456789/50103

 

Kirjoittajat: 
Margareta Salonen, Epp Lauk & Niina Sormanen (8.10.2018)

 

Eettisyyttä etsimässä

Luotsiva-hankkeen tutkimussuunnitelman eettinen ennakkoarviointi ja sen vertaisarviointi Rajapintapäivillä

Internetin, sosiaalisen median ja suurten datamassojen (big datan tai massadatan) tutkimus on tuonut tutkijoille uusia eettisiä ja juridisia haasteita ja kysymyksiä. Sosiaalisen median eri palveluilla, kuten Facebook, Twitter tai Instagram on omat käyttöehtonsa, jotka koskevat myös tutkimusdatan koneellista hakua ja yksityishenkilöiden tuottaman sisällön keräämistä. Tämän lisäksi tutkimuksessa tulisi huomioida mitä ja miten some-aineistoa voidaan tutkia ja tutkimustuloksia julkaista eettisesti mm. yksilöiden yksityisyyden turvaamiseksi. Yksityisyyden suojan näkökulmasta eettinen tarkastelu tutkimuksenteon eri vaiheissa on erittäin tärkeää. Yleisesti näkemykset yksityisyyden suojelemisesta eri tieteenalojen välillä vaihtelevat: yhdestä näkökulmasta yksilöiden dataa saa käytää, jos tutkimus ei tuota heille tarpeetonta harmia, ja toisesta näkökulmasta yksilöiden dataa ei saa koskaan käyttää ilman heidän tietoista suostumustaan (mm. Jouhki ym., 2016).

Esimerkiksi Association of Internet Researchers (AoIR) ohjeissa painotetaan yksilön suojelemista sen perusteella, kuinka haavoittuvaksi hänet luokitellaan (AoIR, 2012). Valitettavasti ohjeistukset internetin ja sosiaalisen median datan tutkimuksesta ovat vielä vaikeasti laitettavissa käytäntöön, koska esimerkiksi haavoittuvuutta ja harmin määrää on usein hankala arvioida. Vaikka jo akateemisten tutkimushankkeiden rahoitusten hakemusvaiheessa nykyisin vaaditaan tutkimuseettistä selvitystä, yksi hyvä tapa turvata hankkeen hyvä tieteellinen käytäntö ja tutkimuksen käsittelemien kohteiden oikeudet on tehdä eettinen ennakkoarviointi ja palata siihen aina tarpeen vaatiessa hankkeen edetessä.

luotsiva dia


Ennen Luotsiva-hankkeen alkua tutkimusryhmämme teki tutkimushankkeen ensimmäiselle vaiheelle eettisen ennakkoarvioinnin. Arvioinnissa keskityttiin erikseen datan keräämisen, analyysimetodien ja tutkimustulosten julkaisemisen eettisiin kysymyksiin. 

 

LUOTSIVA:n data  

Projektissa käytettävä data sisältää sanomalehtien FB-sivuilla julkaistut aineistot: data voi olla joko sanomalehden verkkosivuilta löytyvän uutisjutun vienti lehden FB-sivuille tai niin sanottu natiivipostaus, joka sijaitsee vain somessa (tässä tapauksessa lehden Facebook-sivuilla) ja on tehty vain some-julkaisemista ajatellen. Lisäksi yleisön edustaja on voinut tehdä oman postauksen sanomalehden julkiselle FB-sivulle, vaikka nämä postaukset ovat murto-osa edellä mainitusta kokonaisdatasta. Datan jokainen yksittäinen julkaisu sisältää niin sanottuja postaustietoja, kuten postauksen tekijän, otsikon, tekopäivämäärän ja –kellonajan, tyypin (esim. kuva, video, linkki tai statuspäivitys), jakojen määrän, kommenttien määrän, reaktioiden yhteismäärän sekä linkit alkuperäiseen Facebook-julkaisuun ja lehden alkuperäiseen uutisjulkaisuun. Lisäksi datassa on eriteltynä yksittäiset Facebookin reaktio-toiminnot (vihainen, haha, tykkää, ihastu, vau ja surullinen) ja niiden määrät postauksia kohden.

data talu kuva
Näkymä Exceliin viedystä datataulusta

Facebookin API:en kautta haetun puolijulkisen datan käsittelyä varten on luotu tähtimallinen tietovarasto. Tietovarasto koostuu datatauluista ja niille luoduista yhteyksistä. Esimerkiksi yhteen tauluun tallentuu kaikki tapahtumat (postaukset tai kommentit), toiseen tauluun kaikki postausten sisältötiedot ja seuraavaan tauluun kaikki postauksiin liittyvät toiminnot, kuten jaot tai reaktiot (lue lisää tietovarastosta: Sormanen ym., 2015). Hankkeessa käytettävä datanhakusysteemi eroaakin muista verkossa vapaasti käytettävissä olevista työkaluista, kuten Netvizz:stä siinä, että työkalu ei muodosta listoja vaan tallentaa tiedon tähtimalliseen tietovarastoon.

Tietovaraston ansiosta datasta voidaan tehdä harkitumpia, tiettyyn tutkimukseen sopivia datalistoja (esim. lista postauksista tai vaikka lista postauksissa käytetyistä linkeistä). Lisäksi dataan voidaan liittää uutta metatietoa (yleisesti massadatassa metatieto tarkoittaa esim. käyttäjätunnisteita, id) eli sisältöä kuvailevaa ja määrittävää tietoa, joka auttaa ymmärtämään paremmin dataa. Tutkimuksessa voisi esimerkiksi olla tärkeää tunnistaa päivämääristä juhlapäivät ja loma-ajat erikseen ja tämä tieto voitaisiin lisätä metatietona. Varaston dataa voidaan myös rikastaa eli liittää paikkatieto sisällöstä tai päätellä etunimen perusteella henkilön sukupuoli. Rajapintojen kautta työkalulla saa myös vielä yksittäisten postaajien julkiset tiedot, kuten etunimen ja sukunimen. Luotsiva-hankkeessa data kuitenkin anonymisoitiin heti sen haun jälkeen sopivaksi tutkimuskäyttöön. It-asiantuntija Jukka Rohila ja hankkeen tutkija Niina Sormanen ovat yhteisvoimin suunnitelleet datan hakusysteemiä ja Rohilan rakentamaa tietovarastoa akateemisen tutkimuksen näkökulmasta sekä tehneet koneiston avulla tutkimusta myös aiemmin, joten tutkimukseen käytettävän datan tiedetään olevan luotettavaa.

Datan haku juridisesti ja eettisesti

Tutkimushankkeessa käytetty Facebook-sivudata on haettu koneellisesti. Facebookin käyttöehtojen (Facebook Page Terms, 2017) mukaan Facebookista saa hakea dataa sen ohjelmointirajapintojen kautta, kunhan dataa ei haeta millään automaattisilla roboteilla. Lisäksi mm. juristi Marjut Salokanteleen viime syksynä pitämän Tietoarkiston tilaisuuden esitelmän mukaan Facebookista saa hakea aineistoa tutkimukseen, kunhan sitä ei käytetä kaupalliseen tarkoitukseen (Salokannel, 2016). Täten hankkeen datan haun katsottiin olevan juridisesti hyväksyttävää, kun Facebookin API:en avulla kerätty sivudata tallennetaan tietokantaan, josta se viedään IT-asiantuntijan koodaamaan tietovarastoon.

Vaikka Facebookin käyttöehtojen mukaan dataa saa hakea, on samaisten ehtojen mukaan datan kerääjän kuitenkin itse varmistettava käyttäjiltä lupa heidän tuottamansa sisällön keräämiseen sekä varmistettava käyttäjien olevan tietoisia datan keräyksestä:

If you collect content and information directly from users, you will make it clear that you (and not Facebook) are collecting it, and you will provide notice about and obtain user consent for your use of the content and information that you collect. (Facebook Page Terms, 2017)

Tutkimushankkeessa ei kysytty lupaa jokaiselta lehtien Facaebook-sivujen yksityiseltä käyttäjältä ladata heidän sivuille postaamaansa sisältöä. Kaikki sivuilta haettu data kuitenkin anonymisoitiin heti haun jälkeen, jotta yleisön edustajat pysyisivät paremmin tunnistamattomina. Luvan kysymättä jättäminen perusteltiin mm. data-aineiston laajuudella ja anonymisoinnin tuomalla suojalla (ks. mm. Henkilötietolaki, HetiL 14§, 1999). Yksityisille käyttäjille ei katsottu tutkimuksen ensimmäisestä vaiheesta aiheutuvan haittaa enempää kuin mitä tutkimustulosten hyödyt ovat.

Datan analyysi ja tutkimustulosten julkaisu juridisesti ja eettisesti

Datan analysoinnin katsottiin olevan eettisesti kaikkein yksiselitteisintä tämän tutkimushankkeen kohdalla, koska datan määrällinen käsittely ja sen tulokset säilyttävät käyttäjien anonymisyyden. Tehdyssä laadullisessa analyysissä puolestaan ainoastaan tämän hankkeen tutkijat näkevät datan ja voivat siten suojella yleisön edustajia analyysiratkaisuillaan. Suurimmaksi ongelmaksi muodostuikin laadullisten analyysitulosten julkaisemiseen liittyvät kysymykset erityisesti siitä, minkä aineiston katsotaan olevan julkista ja minkä ei. Aloimme pohtia, saako tutkimuksesta julkaista tapauksia (tai ns. caseja) Facebook-sivuilla julkaistuista uutisjutuista ja niiden ympärille muodostuneista keskusteluista. Niistä voisi nettihaulla alkuperäisen uutisen perusteella mahdollisesti tunnistaa uutisessa olleet henkilöt tai uutisen ympärille muodostuneeseen keskusteluun liittyvät henkilöt. Periaatteessa uutiset ovat julkisia ja hankkeen Facebook-aineisto keskusteluineen on kaikkien luettavissa lehtien Facebook-sivuilta. Eettisesti katsoen ei kuitenkaan voida olettaa kaikkien sivuille postanneiden tiedostavan keskusteluiden julkisuutta tai keskusteluiden seuraamuksia. Lisäksi erityisesti haavoittuvia yksilöitä, esim. alaikäisiä, ja muita arkaluonteisia tapauksia pitäisi käsitellä varoen.

Pyrimme ratkaisemaan tapaustulosten julkaisun eettisyysongelman tekemällä alkuperäisen uutisjutun ja keskustelun löytämisestä vähintäänkin mahdollisimman vaikeaa anonymisoimalla lehden, uutisjutun ja siihen liittyvät henkilöt. Lisäksi pyrimme kuvailemaan tuloksissa uutisjutun tapausta ja siinä käytyä keskustelua omin sanoin käyttämättä tapauksesta suoria lainauksia, jotka olisi helppo löytää nettihaulla.

 

Luotsiva Rajapinnoilla

Luotsiva-hankkeen tutkijat Margareta Salonen ja Niina Sormanen osallistuivat Rajapinta ry:n järjestämille Rajapintapäiville 2.-3.11.2017 keskustelemaan verkkotutkimuksen eettisistä ohjeista ja digiaineistoista sekä esittelemään Luotsiva-hanketta ja sen tutkimuseettisiä kysymyksiä. Rajapinta ry on vuonna 2017 perustettu Koneen Säätiön tukema teknologian, yhteiskunnan ja yhteiskuntatieteellisen tutkimuksen kohtaamispaikka. (https://rajapinta.co/)

Workshop-päivä
Rajapintapäivien torstain 2.11. työpajoissa yleisesti tunnistettuja internetin ja sosiaalisen median tutkimuseettisiä ongelmia olivat mm. tutkittavien anonymiteetin säilyttäminen ja oikeuksien turvaaminen sekä vanhentuneet lakipykälät koskien tutkimusta. Ensinnäkin osallistujat tulivat siihen tulokseen, että Internet- ja some-tutkimusta tehdessä ei saisi koskaan olettaa, että pelkkä yksilöiden anonymisointi kerätystä datasta takaisi sen, ettei tutkimuskohteita voisi nykyisin tunnistaa, koska esimerkiksi metatieto tai verkostoanalyysit voivat johtaa tunnistamiseen. Muuttuvien (esim. Facebookin) rajapintojen vuoksi verkostoanalyysien teko on viime aikoina kuitenkin vaikeutunut. Lisäksi ei voida keskittyä ainoastaan yksilöiden anonymisointiin ja heidän etujen turvaamiseen, vaan sosiaalisessa mediassa pitää ottaa huomioon tutkimuksen potentiaalinen vaikutus yksilöön, yhteisöön (esim. ryhmät) ja jopa yhteiskuntaan. Esimerkiksi paljastamalla tietyn suljetun ryhmän jäsen- tai toimintatietoja voidaan koko ryhmän olemassaolo vaarantaa. Toiseksi lakien todettiin olevan ainakin viisi vuotta vanhentuneita ja sopimattomia internetin ja sosiaalisen median tutkimusaikakauteen. Lakien pitäisi sekä antaa yleispäteviä ohjeita tutkimuksen tekoon että sisältää tapauksia, joita tutkijat voisivat soveltaa omaan tutkimukseensa. Internet- ja some-tutkijat odottavatkin mielenkiinnolla uutta EU:n tietosuoja-asetusta ja sen seurauksia eli mahdollisuuksia ja uhkia tutkimuksen teolle.

23469207_10155237520438845_2034004547_o (1)
Internet- ja some-aineistojen analyysin yleistä eettistä pohdintaa torstain workshopissa

Lisäksi torstaina Luotsivan tutkijat kertoivat seuranneensa kuluvan syksyn aikana Julkisen sanan neuvoston (JSN:n) tekemiä somen toimitustyöhön liittyviä ratkaisuja ja ideoineet kokoavansa näitä päätöksiä yhteen oman tutkimushankkeensa käyttötarkoituksia varten. Rajapintapäivien aikana ilmenikin tarvetta löytää sosiaalista mediaa koskevaa ohjeistusta ja päätimme viedä tutkimushankkeemme tässä vaiheessa JSN:n someen kohdistuvia ratkaisuja pureskeltuina Luotsivan kotisivuille.

 

23157353_2024716011145480_1609622619339049274_o (1)
Kuvasta kiitos Rajapinnalle © Salla-Maaria Laaksonen

Epäkonferenssi-päivä
Rajapintapäivien perjantain 3.11. epäkonferenssi muodostui rinnakkaisista tutkimusten esittelysessioista, joissa tutkimusten tekijöillä oli mahdollisuus käydä asiantuntijayleisön kanssa läpi omaa tutkimusta puhuttavia aiheita. Epäkonferenssi on perinteistä konferenssia epämuodollisempi ja rennompi tapa koota yhteen tutkimuksen tekijöitä ja niistä kiinnostuneita kuulijoita paikalle jakamaan tutkimustietoa ja keskustelemaan tutkimusmaailman asioista. Tapahtuman iltapäiväsessiossa Margareta Salonen esitteli Facebook-datan haun, tutkimusmetodien ja -tulosten esittämisen eettisiä ja juridisia kysymyksiä Luotsiva-tutkimushankkeen valossa. Tavoitteena oli saada muilta tutkijoilta ja alan osaajilta vertaistukea ja -arvioita omassa arvioinnissa esiin nousseisiin eettisiin ja juridisiin kysymyksiin. Tutkimusryhmämme kaipasi avointa keskustelua Facebookista esiin nousseiden arkaluonteisten tapausten julkaisumahdollisuuksiin ja näiden eettiseen pohdintaan.

Yleisö nosti keskusteluun juuri aineiston anonymisoinnin mahdollisuudet ja sen, että onko näitä caseja edes mahdollista täysin anonymisoida. Suorien lainauksien tai kuvasitaattien käyttö olisi hankalaa varsinkin jos mahdollinen harmi kohdistuisi sellaisiin ryhmiin, joiden on hankalampi puolustaa itseään. Koska caset ovat julkisesti lähestulkoon kaikkien saatavilla, meidän tulisi tutkijoina kuitenkin miettiä tutkimuksen hyödyn vs. yksilöille aiheutuvien ongelmien suhdetta. Lisäksi keskustelua käytiin Facebookin omista ehdoista ja siitä, miten ne rajaavat tai eivät rajaa tutkimuskäyttöä ja/tai kaupallisia tarkoitusperiä. Facebookin ehdot koskien tutkimusaineiston kaupallisia tarkoitusperiä eivät olleet asiantuntijayleisön mielestä yksiselitteisiä. Luotsivan kohdalla ei kuitenkaan nähty selkeää yhteyttä kaupallisuuteen (emme esimerkiksi myy tutkimustuloksia tai palveluja), joten tämä kysymys ei tämän tutkimushankkeen kohdalla ole kriittinen. Tutkijoista ja viestinnän asiantuntijoista koostunut yleisö antoi kokonaisuudessaan Luotsivalle ”synninpäästön” eikä nähnyt akateemisen tutkimuksen tämänhetkisiä eettisiä kysymyksiä merkittävänä esteenä tutkimuksen teolle.

Erilaisten tapahtumien, kuten Rajapintapäivien ja tulevan SOMERI-seminaarin ja niissä käytyjen ja käytävien keskustelujen avulla päästään toivottavasti lähemmäs yhtenäisiä ja käytännöllisiä internetin ja sosiaalisen median tutkimuksen eettisiä ohjeita. Luotsiva-hankkeen eettisten ja juridisten kysymysten pohdintaa jatketaan ja hankkeen tutkimuksen toiseen vaiheeseen tehdään uusi tutkimuseettinen arviointi.

Kirjoittajat:
Luotsiva-hankkeen tutkijat Margareta Salonen ja Niina Sormanen  (14.11.2017)

 

Lähteet:

Association of Internet Researchers, AoIR. 2012. https://aoir.org/reports/ethics2.pdf

Facebook Pages Terms. 2017. https://www.facebook.com/page_guidelines.php

Henkilötietolaki, HetiL 14§. 1999. http://www.finlex.fi/fi/laki/ajantasa/1999/19990523

Jouhki, J., Lauk, E., Penttinen M., Sormanen, N. & Uskali, T. 2016. Facebook’s Emotional Contagion Experiment as a Challenge to Research Ethics. Media and Communication, 4 (4), pp. 75-85. doi: 10.17645/mac.v4i4.579

Salokannel, M. 2016. SOME-tietojen tutkimuskäyttö oikeudellisesta näkökulmasta – Marjut Salokannel.
https://www.youtube.com/watch?v=zXTawzRMx8M&feature=youtu.be

Sormanen, N., Rohila, J., Lauk, E., Uskali, T., Jouhki, J. & Penttinen, M. 2015. Changes and Challenges of Computational Data Gathering and Analysis: The case of issue-attention in Facebook cycles. Digital Journalism, 4 (1), 55-74.
https://jyx.jyu.fi/dspace/handle/123456789/48335