För att få en bild av de löften om forskningsmöjligheter, som det europeiska infrastrukturprojektet CLARIN – som Swe-Clarin ingår i – ställer i utsikt är det värdefullt med ett tankeexperiment.
Vi föreställer oss en humanistisk forskare – låt oss säga en historiker – som vill undersöka hur djurmetaforer används i europeisk press och politiska skrifter mellan franska revolutionen och första världskrigets utbrott.
Vidare tänker vi oss att alla relevanta dokument har digitaliserats och finns tillgängliga i offentliga ”elektroniska arkiv för kulturarv”, en inte orimlig fantasi i vår tid. Hur vore det om denna forskare kunde ge sin sökmotor en instruktion av typen: ”Plocka fram alla passager i texter om politiska frågor från den här tidsperioden där djur förekommer antingen som *agent* eller *patient*. Ordna sökträffarna efter graden av *bildlighet*. Gör detta för svenska, finska, ryska, danska, franska, tyska och engelska källor. Markera särskilt formuleringar som också förekommer i bibeln och sådana som endast förekommer på ett språk. Ge mig översättning av alla sökträffar till svenska.”
Reflektera nu en stund över vilken teknologi som krävs för att förverkliga sådana möjligheter till sökning i källorna. Det finns förstås en teoretisk möjlighet att för hand förbereda allt textmaterial och då försöka förutse vilka frågor som framtidens forskare kommer att ställa. Men detta är – av flera anledningar – knappast ett realistiskt tillvägagångssätt.
Tillbaka till forskaren. Efter att ha sett resultaten från sin första sökning säger hon nu: ”Då vill jag se bara de träffar där djurmetaforer används nedsättande, men lägga till passager där en namngiven person eller ett land liknas vid ett djur, och lägg till även spanska, italienska och ungerska källor.” Och så vidare.
Termen ”e-vetenskap” används ofta för att beteckna vetenskap som med hjälp av modern informationsteknik kan angripa problem av en omfattning och komplexitet som inte skulle kunna hanteras utan digitala hjälpmedel och möjligheten att dra fördel av geografiskt spridda resurser.
Traditionellt har detta angreppssätt främst förknippats med extremt beräkningsintensiv forskning inom teknik- och naturvetenskap. Men i själva verket skulle man kunna säga att till exempel korpuslingvistiken (som med hjälp av språkteknologi bedriver forskning på stora insamlade textmassor) är ett mycket tidigt exempel på e-vetenskap.
Detta är också ett område som utvecklats starkt över 50 år, och den teknologi och teoribildning som utvecklats i anslutning till detta forskningsfält har idag fått en rik flora av applikationer utanför den rent lingvistiska intressesfären.
Det europeiska infrastrukturprojektet CLARIN syftar till att göra digitala språkresurser – textsamlingar, inspelningar av ljud och bild, lexikon och så vidare – tillsammans med de språkteknologiska verktyg som behövs för att hantera dem, tillgängliga för forskare inom alla discipliner.
CLARIN erbjuder en möjlighet för forskare inom humaniora och samhällsvetenskap att använda sig av e-vetenskapliga metoder och Swe-Clarin bygger upp den nationella infrastrukturen inom området. Med en sådan infrastruktur på plats – enkelt tillgänglig i den dagliga verksamheten – är vi nära förverkligandet av det inledande tankeexperimentet.