Språkteknologiska verktyg är användbara för att analysera data i all forskning som rör språkets form och innehåll. Verktygen gör det till exempel lättare att identifiera namn och platser i texter, känna igen talmönster eller berika källor med annotering. De kan med expertstöd anpassas till specifika forskningsfrågor och kopplas samman med andra verktyg och sedan tillgängliggöras för återanvändning av andra forskare inom Swe-Clarins infrastruktur.
Ett urval
Korp är ett korpusverktyg och korpusinfrastruktur med fokus på analys av språklig form. Bland annat "ordbilder" visualiserar ett sökt ord i relation till andra ord som det står i relationer till – till exempel visas subjekt och objekt som är utmärkande för ett verb. Korp används internationellt och utvecklas av Språkbanken Text, som även tillhandahåller en användarhandledning.
Strix är ett korpusverktyg med fokus på dokument- och innehållsbaserad analys. Strix, som utvecklas av Språkbanken Text, stödjer avancerade interaktioner med stora textmängder för när- och fjärrläsning. Verktyget erbjuder filtreringsfunktionalitet och ett läsläge som kan markera alla metadata i texten.
SWEGRAM är ett annoteringsvertyg för att märka upp och analysera texter på både svenska och engelska. Texter kan laddas upp och annoteras på olika språkliga nivåer. SWEGRAM, som utvecklas vid Uppsala universitet, kan ta fram statistik om bland annat meningslängd, antal ord, läsbarhetsmått och ordklasser.
Sparv är ett annoteringsverktyg som kopplar ihop flera språkteknologiska resurser i en arbetsprocess. Det har en nättjänst som möjliggör vidare annotering och berikning av material från andra parter. Sparv förutsätter språkteknologisk kompetens för användning. En användarhandledning finns på Språkbanken Texts webbplats.