Åpen Vitenskap: Samfunnsvitenskap og humaniora for lite integrert med naturvitenskap, praktiske tiltak til hva som kan gjøres.

Jeg skrev for noen dager siden om humaniora sin plass i universitetet, men her vil jeg si noe om helt konkrete tiltak som jeg tror kan være lurt å satse på. Forslagene er inspirert av Software Carpentry som har fullbookede kurs hver gang og ser ut til å bli en suksess i både verden og UiO, og Open Science Mooc som er under utvikling. Software Carpentry folka ved UiO lager nå kurs som er på såpass lavt nivå at de passer for humaniorastudenter som har glemt matematikken fra videregående ser det ut til. De er i ferd med å få et veldig godt pedagogisk opplegg som tar hensyn til alle studenter og ikke bare legger det opp til folk med beste karakter i matte fra videregående. Det er en bragd i selvinnsikt ;-)

Jeg har ikke akkurat utviklet, men satt sammen biter jeg har funnet, til et PhD kurs for kulturell introduksjon til åpen vitenskap, men det har jeg ikke publisert, men dette "kulturkurset" er basert på hovedtankene i Walter og Mullins "On Publishing and the Sneetches: A Wake-up Call?*" Denne bloggposten er bare 10 konkrete forslag til kurs som Universitetsbiblioteket kunne ha ansvar for å fasilitere og delvis undervise i ved å lage UB til et slags flipped classroom for åpen vitenskap og tverrfaglig samarbeid.

Introduksjon:
Det at naturvitenskap og humaniora har utviklet to ulike kulturer er ikke noe nytt. C. P. Snow holdt talen "The Two Cultures 7. mai 1959. For samfunnsvitenskapene så har positivismen nærmest innvadert psykologi og samfunnsøkonomi og gitt disse fagene en flik av naturvitenskapenes status. Men her har problemet vært at samfunnsvitenskapene ikke skjønner statistikk og eksperimenter noe særlig, så her har de til og med innarbeidet fundamental feil statistiske metoder inn i læreverkene fra de mest rennomerte forskerselskapene (se s. 2 og 3) og de har blitt en sentral del av den samfunnsvitenskapelige kulturen fordi det er så lett å få publisert når man driver med p-hacking og får en p-verdi etter langvarige fisketurer i datasettene som åpner for publisering. Innen pedagogikk så er systematiskee review i slik litteratur som John Hattie driver med kan jo neppe bli bedre enn kvaliteten på primærstudiene? Men det bryr ikke rektorer som er ansvarliggjort for læringsprosessene seg noe om, de tar nok det som kommer fra vitenskap som god fisk. Når de ikke driver med analyser av sammenhenger mellom klassestørrelser, gruppearbeid, tester osv. så går det mye i selfølgeligheter maskert som tung teori, ofte med en siteringsskikk som er helt meningsløs.

EU og mange andre har forsøkt å få til en økende tilnærming mellom humaniora, samfunnsvitenskap og naturvitenskap uten å ha lykkes, som Marthe Njåstad fra "På Høyden" skriver om i reportasjen "Samfunnsvitskap og humaniora for lite integrert i EU-forskinga" Selv om det har vært en sterkt tendens til mer sitering på tvers av naturvitenskapene og samfunnsfagene/humaniora, så har professorene fortsatt med å binde seg til disipinene når det gjelder organiseringen av utdanningen og forskningen.

Hva kan gjøres? Jeg foreslår noen enkle grep:

1) Statistikkprogrammet R har tusenvis av pakker tilgjengelig, det byr på helt andre muligheter enn Excel, er åpent tilgjengelig, du kan publisere script sammen med artiklene så man øker transparensen, det er gratis og åpent slik at alle forskere i verden kan bruke det og man kan beskytte seg mot overvåkning, personvernbrudd og spionasje effektivt. Men viktigst er kanskje at det kan bygges inn i alle slags nye moderne samarbeidsverktøy og publiseringsverktøy innen vitenskapelig kommunikasjon som gjør den livsviktige verifiseringen og replikasjonen mulig. Feilprosent på minst 50 prosent innen statistiske analyser av alt fra klassestørrelser til atferdsøkonomi kan man ikke leve med. R burde blitt standardverktøy for alle fag, også humaniora siden de må ha et vitenskapelig grunnlag for å samarbeide med naturvitenskap, og da er statistikk kjempesentralt, ellers så har man langt mindre sjanser til å sette seg inn i hva andre fagfelt driver med engang.

Tre dagers kurs vil være tilstrekkelig for at alle lærer dette.

2) LaTeX er en annen grunnteknologi. Hvis naturvitere ikke kan dele en formel eller figur engang med humanistene og samfunnsvitere i samme skriveverktøy og tidsskrifter, hvordan kan de da drive med samskriving og sampublisering? LaTeX er også gratis og open source som har tusenvis av pakker og versjoner og blir brukt i stadig mer av den åpne vitenskapelige infrastrukturen der samskriving og åpen fagfellevurdering blir implementert i moderne infrastruktur. Overleaf blir stadig tettere integrert med open science framework for eksempel.

To dagers kurs

3) Tidsmaskinen GIT er et versjonskontrollsystem som egner seg like godt for tekst som statistikk og er også open source, gratis og blir implementert i utallige verktøy. For eksempel så er dette systemet implementert i Authorea. Er det noe åpen vitenskap trenger er det å holde orden på versjoner for å kunne si hvem som kom på noe først slik at man får belønnet de som er flinke. Det er dessuten viktig å kunne gå tilbake til noe som ble forkastet på et tidlig stadium som likevel var en god ide, og finne ut hvem som skrev det og hva som nøyaktig ble skrevet. Statistikkprogrammet R bruker også GIT.

To dagers kurs.

Disse tre nærmest "muliggjørende teknologiene" prøver jeg å lære meg nå, men de har en bratt lærekurve, men man trenger ikke noen naturfaglig bakgrunn eller være spesielt intelligent for å lære dette. Det er likevel det som krever mest av studentene, men ærlig talt, man driver med vanskelige saker på et universitet.

Så de enkle og raske:

4) Zotero og lignende åpen kildekode referansehåntering er et godt alternativ til det proprietære programmet Endnote som er på kinesisk eierskap. Dvs. kinesiske myndigheter kan mest sansynlig gå ut og inn av dette programmet og skaffe seg oversikt over hva folk har i bibliotekene sine. Det kan gi god informasjon om for de som er interessert i å kartlegge folk. Zotero er moderne add-on i nettleseren, bruker webteknologi som er like god eller bedre enn gammeldagse lokalt installerte programmer. Zotero er moderne og kan kobles til moderne tjenester, Zotero er koblet til Open Science Framework for eksempel. Alle studenter trenger maks en time på å lære å bruke programmet, lage åpne eller private grupper ( også for deling og annotering av fulltekst selv om dette trengs mer enn en time).

5) Annotering ble 23. februar 2017 en webstandard og kommer til å bli bakt inn i alle nettlesere. Det kan brukes i "flipped classroom" undervisning, MOOCs, fagfellevurdering, borgervitenskaplig deltagelse, evaluering, på både PDF, nettsider, og flere andre formater som akademia bruker. Man trenger ca. 30 minutter på å sette opp konto og lære å bruke systemet.

6) OrcID er en tjeneste som identifiserer hvem som sier hva, og er derfor ypperlig for åpen vitenskap. Da kan man samle opp og dokumentere hva slags bidrag man har kommet med på for eksempel fagfellevurderinger, veiledning, samskriving osv. Dette tar 30 sekunder og sette opp konto, og kanskje en halvtime på å lære å bruke det til søknadesskriving og når man sender inn manus osv.

7) DOI er også en identifikator som brukes over alt, og som man kan få på arbeidsnotater og fagfellevurderinger. Det gjør det enklere å se hvem som har bidratt til forskningen. Jeg tipper at et undervisningsopplegg neppe trenger å ta mer tid enn en halvtime.

8) Tekst- og datautvinning kan brukes for å identifisere, kjemiske forbindelser, figurer, molekylstrukturer, norske dialekter, gener, DNA, osv. Det er derfor et felles verktøy som naturvitere og forskere kan ha stor nytte av. Supert for å gjøre unna den delen av systematic review som krever eksperter og arbeid. Peter Murray-Rust sier programmet bruker fem minutter på å gjøre det samme som eksperter ville brukt flere uker på. Teknologien er ikke søk, det er analyse, og akkurat som en student med Google kan gjøre like mye som et team med eksperter brukte ukesvis på for 20 år siden, slik vil analyse revolusjonere systematic review og mye annet. Teknologien kan forklares med et eksempel: Emneordsystemet til JSTOR består av 50 000 ord med forbindelser seg i mellom. Når man laster inn en bok, og maskinen leser appelsin, eple, pærer, så analyserer JSTOR det til å fortelle deg at boka handler om frukt. Jeg gjorde dette på en bok i JSTOR. To-timers kurs burde holde.

9) Bruk av preprintarkiver og åpne forskningsprosjekter og må læres. Studenter slipper ofte ikke inn i disse nettstedene, men det finnes mange alternativer der man får prøve åpen vitenskapsmetodene. Man kan for eksempel lage oppgaver på kurs der kravet er at man skal samarbeide med en student i en bestemt verdensdel eller et bestemt land, dele på fulltekstreferansene i Zotero, analysere datasettet i fellesskap, annotere i fellesskap, og skrive en felles rapport. To timer med kurs burde holde.

10) Preregistrere datainnsamling og en datahånteringsplan burde være obligatorisk for alle å lære. UB har allerede gitt kurs i dette. To timer bør kanskje holde.

Konklusjon: Tre kursdager med R må nok til for å få inn kommandoene og kunne komme så langt at man kan gjenfinne data og reprodusere grafer man finner i for eksempel The Economist. To kursdager på henholdsvis LaTeX og GIT må til for å kunne bruke systemene. Det blir til sammen 7 kursdager. De øvrige kan spres som minikurs på til sammen åtte timer.

Dvs. for å få lagt grunnlaget for samarbeid på tvers av naturvitenskapene, humaniora og samfunnsvitenskapene, så kan det, med gode kursopplegg, holde med 8 kursdager. Og istedenfor å lage et komplisert eksamensopplegg, så kan man kanskje legge opp pensum og innleveringsoppgaver slik at de blir uoverkommelige uten den kunnskapen som man lærer på kursene. Og legger man alt ut åpent, med OrcID og DOI, så er sjansene for å bli tatt i juks så høye og så lett å bevise at man får lære at åpen vitenskap nettopp motvirker juks, ikke legger til rette for scooping eller data parasitteri.

(Juks blir oftere og oftere avslørt. Roboter har så vidt begynt å ta over arbeidet i vitenskapelige tidsskrifter, og de blir sendt ut på nettet for å avsløre "fake News"slik IBM, VG og Aftenposten har begynt med, men de brukes også på vitenskapelige artikler med stor "suksess". Men også enkle men målrettede søkemetoder kan avdekke mye. For eksempel så ble Darwin ble tatt for juks etter at Google Books hadde fått digitalisert og OCR-skannet gamle bøker som viste at tre forskere i Darwins nærmeste krets kjente til teorien om makroseleksjon lenge før Darwin publiserte Origin of Species 1859. Her er beviset og den enkle metoden som ble brukt for å avdekke jukset (se lenke i første avsnitt).)

Åpen Vitenskap

Thursday, April 6, 2017

Samfunnsvitenskap og humaniora for lite integrert med naturvitenskap, praktiske tiltak til hva som kan gjøres.

No comments:

Post a Comment

Blog Archive