Kvantitativ formalisme

Er nypositivismen på vei inn i litteraturvitenskapen? Vi spør fordi siste nummer av n+1 bringer en artikkel med ikke-ironiske fotnoter, matematisk vokabular og nærmere tjue diagrammer basert på prinsipalkomponentanalyse (PCA). Tittelen? «Quantitative Formalism: A Research». De fem artikkelforfatterne sogner til den såkalte Stanford Literary Lab, som ifølge selvpresentasjonen «explores quantitative approaches to textual form». Det høres for så vidt spennende ut – og er det òg, i hvert fall om man skal dømme etter denne smakebiten.

Oppdraget forskerne har gitt seg selv, er å undersøke om en datamaskin kan skjelne mellom litterære sjangrer. Og det kan den. Ved å søke på enkeltord og ord-strenger, og matche disse mot 101 forhåndsprogrammerte lingvistiske kategorier kalt «Language Action Types», evner maskinen å sortere Shakespeares skuespill i fem grupper – tilfeldigvis sammenfallende (på et par unntak nær) med den tradisjonelle litteraturvitenskapelige inndeling i «tragedier», «komedier» og så bortetter. Ikke fullt så overbevisende er resultatet når datamaskinen får bryne seg på 250 britiske 1800-tallsromaner. Forskerne oppdager at programmet er bedre egnet til å distingvere mellom forfatterskap enn mellom sjangrer. Hvorfor? Fordi datamaskinen ikke registrerer plott, men tekstens stilistiske signatur. Og sistnevnte er en mer stabil størrelse: På vei fra arbeiderromanen Hard Times (1854) til dannelsesromanen Great Expectations (1861) har Dickens kanskje byttet sjanger og plott, men han komponerer setningene sine på noenlunde samme vis. Hånden overtrumfer ånden, på en måte.

Foreløpig er prosjektet helt i startfasen. Men la oss tenke oss, for moro skyld, at en framtidig versjon av samme program kan brukes til å identifisere de lingvistiske forskjellene mellom Solstad, Kjærstad og Fløgstad – eller til å sjangerbestemme oppmeldte bøker til innkjøpsordningen for ny, norsk skjønnlitteratur. Øyner vi et framtidig sparetiltak i Kulturrådet? Ut med bedømmelseskomiteene, inn med en harddisk på 100+ terrabyte? Littlab-forskerne vil neppe anbefale det siste: Datamaskinens problem er at den potensielt kan skjelne perfekt mellom ulike sjangrer, og likevel fortelle oss null og niks om verkenes gehalt. Spørsmålet er om ikke dén anklagen også kan rettes mot dagens «analoge» litteraturvitenskap …?

Relaterte artikler