Om Ordbog over Dansk Talesprog
Ordbog over Dansk Talesprog (ODT) er et ordbogsprojekt på Sprogforandringscentret på Københavns Universitet. Ordbogen er baseret på 1600 taletimer med sociolingvistiske interviews der i udskrevet form tæller næsten 7 mio. ord (tokens). Ordbogen profilerer talesprog på talesprogets præmisser.
Talesprog og skriftsprog
Talesprog er på flere måder mere grundlæggende end skriftsprog. Vi lærer at tale før vi lærer at skrive, og der findes mange sprog uden skriftsystemer, men ingen levende sprog som er udelukkende skriftlige. Ordbog over Dansk Talesprog ønsker at afspejle dette faktum ved at udarbejde en ordbog over dansk talesprog, udelukkende baseret på et korpus af autentisk talesprog.
Traditionelle ordbøger bygger på skriftsprog og medtager typisk talesprogskilder som et supplement. Opslagsord med relation til talesproget fremstilles ofte som afvigelser eller stilvarianter i forhold til skriftsproget. ODT vender denne relation på hovedet og tager udgangspunkt i talesproget. Det har mange konsekvenser for udarbejdelsen af en ordbog. For eksempel må arbejdet nødvendigvis tage udgangspunkt i lyd, og opslagsord må være lydbaserede.
Netportal
ODT’s leksikografiske mål er at udarbejde en netbaseret talesprogsordbog som er tilgængelig, forståelig og interessant for både den generelt sprogligt interesserede dansker og for sprogforskeren som ønsker detaljeret faglig viden om talesprog. Det er ikke ODT’s hensigt at udarbejde en ordbog over hele det leksikalske inventar i dansk men snarere at virke supplerende i forhold til traditionelle skriftsprogsbaserede ordbøger.
Ordbogsportalen vil på sigt også indeholde en række faktabokse med oversigts- hhv. dybdegående artikler om talesprogsfænomener dokumenteret i korpus og relateret til ordbogsartiklerne I den endelige version kan brugeren gå bag om de redigerede fremstillinger såvel i ordbogsartikler som i bokse ved at foretage direkte søgninger i korpus. Men i demo-ordbogen dokumenteres søgningerne som belæg i selve artiklen.
En talesprogsbaseret ordbog over dansk er selvfølgelig et meget tidskrævende projekt. Derfor arbejder ODT med mindre projekter som efterhånden akkumuleres til en ordbog over dansk talesprog. ODT arbejder med et pilotprojekt om interjektioner – et arbejde der vil munde ud i Ordbog over Danske Interjektioner (ODI).
Korpus
Ordbog over Dansk Talesprogs arbejde bygger på DGCSS' LANCHART-korpus som består af cirka 6,5 millioner transskriberede tokens af 1.600 samtaletimer. Korpusset består primært af sociolingvistiske interviews fra 1978 til 2010 fra syv forskellige områder i Danmark. Talesprogskorpusset er designet med henblik på at undersøge indflydelsen på talesprog fra de traditionelle sociolingvistiske variable køn, alder, klasse men især tid og sted. Altså for eksempel om unge og gamle taler forskelligt. Korpusset omfatter ikke kun traditionelle sociolingvistiske interviews med én informant og én interviewer, men også gruppesamtaler hvor flere informanter taler sammen med eller uden interviewer.