Hoppa till huvudinnehåll
sweclarin logo
Sök | English
Start
English
  • Start
  • Om oss
  • Våra resurser
  • Samarbeta med oss
  • Aktuellt
  • Om Swe-Clarin
  • Katalog
  • Kontakt
  • Dokument
  • CLARIN.EU
  • Logga in

Svensk text

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet

Beskrivning

Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera.

Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas.

Materialet utökas och uppdateras kontinuerligt under öppna licenser.

Ämnesområde

Språkteknologi (språkvetenskaplig databehandling) (Standard för svensk indelning av forskningsämnen 2011)

Nyckelord

politik, språk, nationalitet, Yrken, Städer, Geografi, Namn, Datorhantering av naturligt språk, Programmeringsspråk

Huvudman

Göteborgs universitet

Tillgänglighetsstatus

Åtkomst till data via extern aktör
Data är fritt tillgängliga

Hemsida

Data via GitHub

Ansvarig institution/enhet

Göteborgs universitet

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet

Identifierare

SND-ID: EXT 0278

Beskrivning

Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera.

Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas.

Materialet utökas och uppdateras kontinuerligt under öppna licenser.

Geografisk utbredning

Geografisk plats: Sverige

Ämnesområde

Språkteknologi (språkvetenskaplig databehandling) (Standard för svensk indelning av forskningsämnen 2011)

Nyckelord

politik, språk, nationalitet, Yrken, Städer, Geografi, Namn, Datorhantering av naturligt språk, Programmeringsspråk

Ladda ner metadata

  • DataCite
  • DCAT-AP
  • DDI 2.5
  • JSON

Upphovsrätt

Särskild upphovsrätt (t.ex. Creative Commons) för respektive material beskrivs på https://github.com/peterdalle/svensktext

Svensk text

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet

Dataformat / datastruktur

Text

Publicerad: 2018-12-20
Senast uppdaterad: 2019-12-16

Medintressenter

CLARIN ERIC
Nationella språkbanken
Vetenskapsrådet

Medlemmar

Språkbanken Text, GU
Språkbanken Tal, KTH
Språkbanken Sam, Isof
Centrum för digital humaniora, GU
Datorlingvistikgruppen, UU
Humanistlaboratoriet, LU

Humlab, UmU
Institutionen för lingvistik, SU
Kungliga biblioteket
NLPLab, LiU
Riksarkivet

Kontakta oss

info@sweclarin.se