FÖRFATTARE

Leif-Jöran Olsson
Språkbanken Text

Johanna Berg
Digisam på Riksarkivet
 

ORDLISTA

Annotering information som tillförs en text, manuellt av en människa eller automatiskt av ett verktyg. Annotering kan göras på olika nivåer (ord, mening, stycke)

Entitet benämnd enhet

Flerordsuttryck ord som ofta uppträder ihop och som språkligt beter sig som en enhet, till exempel ad hoc

KWiC (keyword in context) visuell uppställning av ett ord eller uttryck i sitt samman­hang, ofta benämnt konkordans

Korpus samling texter som sammanställts i ett visst syfte

Lemgram ordklassbaserat samlings­begrepp för ett ords eller flerords­uttrycks samtliga böjningsformer

Lexicographer's Mutual Information-värde mått på i vilken utsträckning ord uppträder nära varandra, mer frekvent än vad som skulle kunna förklaras med slump­mässigt samman­träffande

Parsning, syntaktisk analys som identifierar beståndsdelarna i en sats och deras inbördes relationer

Precision frekvens relevanta entiteter i en sökning/filtrering

Segmentering sätt att dela upp en text i ord eller ordliknande enheter som är användbara i det fortsatta arbetsflödet

Sökaktiviteter filtrering, gruppering, navigering

Token ord, flerordsuttryck, interpunktion med mera enligt en specifik segmentering

Karp Språkbanken Texts lexikala plattform Karp

Korp Språkbanken Texts korpussökningsverktyg Korp

Sparv Språkbanken Texts annoteringskedja Sparv

Sidan uppdaterad 2020-06-22 15:22