Sprogbanken er en fremtidsinvestering, som skal tjene forskningen i finlandssvenske både i og uden for Finland. Arbejdet med den finlandssvenske sprogbank løber over en treårig periode (2011–2013) og er et samarbejdsprojekt mellem Svenska litteratursällskapet i Finland, Forskningscentralen för de inhemska språken og Göteborgs universitet. Målet er at oprettet en tekstsamling med mindst 70 millioner ord fra tekster, der er skrevet på svensk i Finland. Der skal indgå både moderne og historiske tekster af forskellige genrer i banken.
Den finlandssvenske tekstsamling er placeret i Sprogbanken på Göteborgs Universitet som en del af Korp-samlingerne. Korp er et konkordansværktøj til tekstsamlinger og er netop udgivet i en ny version (1.0), som ligger frit tilgængeligt via http://spraakbanken.gu.se/korp/#corpus=fisk. Den indeholder i dag ca. 30 millioner ord. Teksterne i korpusset kodes, så det er muligt at foretage grammatiske søgninger af forskellig type, hvilket giver en helt anden indgang til sproget end blot en søgning på enkeltstående ord. Korpusset giver både forskere, sprogrøgtere og andre interesserede adgang til finlandssvenske tekster til forskellige fremtidige studier, men materialet er frit tilgængelig for alle interesserede.
Det finlandssvensk materiale består i øjeblikket af materiale fra Astra Nova, Källan, Nya Argus, Meddelanden från Åbo Akademi, Svenskbygden, Hufvudstadsbladet, Jakobstads Tidning, Vasabladet og litteratur udgivet af Söderströms förlag og Svenska litteratursällskapets förlag.
Hvad er et korpus?
Et korpus er en samling tekster, som anvendes til sprog- og litteraturvidenskabelige studier. Der findes omfattende korpusser til et stort antal sprog. De største af dem indeholder flere hundrede millioner ord. Derved er der i dag store tekstmængder til forskernes disposition i maskinlæsbar form, hvilket gør det muligt at undersøge sproglige variationer i tid og rum på en måde, der ikke tidligere har været muligt. Flere delkorpusser kan samles i én sprogbank, som dog også kan indeholde meget andet sprogligt materiale.
Et dansk korpus er f.eks. tilgængeligt på sproget.dk.