Big data utfordrer forskningen

– Kommersielle aktører har i mye større grad tilgang til data om folks liv, og kan utføre analyser forskere ikke kan gjøre. Samfunnsforskere bør virkelig være bekymret, advarer Bernard Enjolras. 

Enjolras leder forskningsprosjektet Social media and the new public sphere som har forsøkt å ta i bruk Big data. Det har vist seg vanskelig.
– Vi står nå overfor et skille i forskningen, hvor akademia kan bli den store taperen.

BIG DATA

Big data er ikke noe presist begrep. Betegnelsen refererer både til dataene i seg selv og aktiviteten knyttet til å samle inn, lagre, analysere og presentere dem. Både IT-folk, markedsførere og forskere forsøker å få noe fornuftig ut av et voksende fjell med digitale ettall og nuller.

– Giganter som Google, Twitter, Facebook og Amazon har alle egne forskningssentre. De kan utføre analyser som andre forskere ikke kan gjøre, fordi de har eksklusiv tilgang på data om ditt og mitt liv.Gigantene har ingen plikt til å gjøre dataene sine tilgjengelige for andre. Vi kan ikke en gang evaluere om dette er god eller dårlig forskning. Selskapene med de store faktadatabasene om deg og meg publiserer hva de vil, og bruker forskningen sin akkurat slik de vil.

En samfunnsrisiko

Enjolras ser flere betenkelige sider ved utviklingen.

– Jeg mener dette er en samfunnsrisiko. Når enormt mye informasjon på denne måten samles om ulike enkeltindivider, kan dette i mye større grad enn hva som har vært mulig med tradisjonelle surveydata tidligere, brukes til å avdekke atferdsmønstrene hos store menneskegrupper. Denne mer eller mindre hemmelige forskningen fanger ikke bare opp hva vi mener. Den fanger også opp hva vi gjør.

Vi har bare så vidt sett begynnelsen, mener Enjolras.

Etiske problemstillinger

Kari Steen-Johnsen er forsker i det samme prosjektetsom Enjolras leder. Prosjektet undersøker hva sosiale medier gjør med offentligheten.

– Vi studerer hva sosiale medier betyr for sosial deltakelse og for den offentlige debatten, altså på rollen sosiale medier spiller i dagens politiske virkelighet.

Forskerne bruker mange forskjellige typer data, også Internett-data. De følger politiske nettsteder i Norge, politiske partier, og profilerte bloggere og bruker dataverktøy for å kartlegge hvordan de ulike nettstedene er knyttet til hverandre.

I henhold til retningslinjene fra Norsk Samfunnsvitenskapelig Datatjeneste (NSD) skal disse dataene, selv om de blir betraktet som offentlige, behandles på samme måte som andre data, fordi de faller inn under personopplysningsloven. Forskeren kan ikke publisere verken data eller resultater hentet fra bloggposter, uten å informere bloggerne det gjelder, uansett om postene anonymiseres.

Tvitring om terror

Forskerne ønsket også å bruke Twitter-meldinger rett etter 22. juli som et eksempel på hvordan slike meldinger spredte seg i et nettverk. Men det skulle ikke bli så enkelt.

Twitter eier sine egne data og Institutt for samfunnsforskning fikk beskjed fra selskapet at de ikke leverte ut data til forskningsformål. Likevel fikk NRK Beta tilgang på 250 000 tweets fra terrordøgnene. 5 000 av dem ligger åpent på nrk.no/terrortwitter

– Det var jo klar beskjed om at Twitter prioriterer media framfor offentlig forskning, sukker Steen-Johnsen.

Forskerne kunne selv ha «høstet» tweets fra nettet. Men det krever stor datakapasitet, noe som igjen er avhengig av økonomiske ressurser. Behandlingen av dataene krever også metodeutvikling og refleksjon. Hva er for eksempel et representativt utvalg på Twitter? Og hva med forskningsetikken? Må man be alle som har ytret seg om samtykke?

Bernard Enjolras peker på at det foreløpig er svært uklart hvilken status denne typen data har i samfunnsforskningen:

– Ta for eksempel en tweet. Når den legges ut på Twitter, oppfattes den som offentlig tilgjengelig for alle. Men høster vi inn denne tweeten til forskningsformål, må vi da søke om tillatelse til det? Må alle de 50 000 som har ytret seg i debatten som vi er interessert i, offentlig samtykke i at deres ytringer brukes i forskning? Det samme gjelder for blogger og i nettavisenes debatter. Dette er offentlig tilgjengelig, men er det forskningsetisk forsvarlig å bruke ytringene til forskningsformål? For oss er dette helt uklart. Og det er ikke mye hjelp å få i det forskningsetiske regelverket.

– Hvis vi skal følge retningslinjer for forskning generelt, blir det etter mitt skjønn et misforhold mellom regelverket, og hva det er mulig å gjøre både teknisk og kommersielt med disse dataen. Slik taper forskningen, mens de kommersielle aktørene kan gjøre hva de vil og går ut som vinnere.

Av Klaveness Luisa (luisa.klaveness@samfunnsforskning.no)
Publisert 5. apr. 2013 17:13 - Sist endret 3. aug. 2023 12:40