Hoppa till huvudinnehåll
sweclarin logo
Sök | English
Start
English
  • Start
  • Om oss
  • Våra resurser
  • Samarbeta med oss
  • Aktuellt
  • Om Swe-Clarin
  • Katalog
  • Kontakt
  • Dokument
  • CLARIN.EU
  • Logga in

Gold standard for English-Swedish Europarl data (GES)

Skapare/primärforskare

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Beskrivning

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Ämnesområde

Språkteknologi (språkvetenskaplig databehandling), Teknik (Standard för svensk indelning av forskningsämnen 2011)

Nyckelord

översättning, Datorhantering av naturligt språk

Huvudman

Linköpings universitet

Tillgänglighetsstatus

Åtkomst till data via extern aktör
Data är fritt tillgängliga

Hemsida

A Gold Standard Word Alignment for English-Swedish

Ansvarig institution/enhet

Linköpings universitet, Institutionen för datavetenskap

Skapare/primärforskare

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Identifierare

SND-ID: EXT 0283

Beskrivning

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Ämnesområde

Språkteknologi (språkvetenskaplig databehandling), Teknik (Standard för svensk indelning av forskningsämnen 2011)

Nyckelord

översättning, Datorhantering av naturligt språk

Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Tvåspråkig
  • Språk

    • Engelska (eng)

    • Svenska (swe)

      Meningar: 1164

    Mer..
  • Modalitet

    Skriftspråk
  • Size

    Meningar: 1164

  • Uppmärkning

    • Länkning

      Manuell uppmärkning

Kontakt för frågor om data

Lars Ahrenberg

Ladda ner metadata

  • DataCite
  • DCAT-AP
  • MetaShare
  • MetaShare-CMDI
  • DDI 2.5
  • JSON

Publikationer

Maria Holmqvist and Lars Ahrenberg (2011). A Gold Standard for English-Swedish Word Alignment. In Proceedings of the 18th Nordic Conference on Computational Linguistics, Riga, Latvia, May 11-13, 2011.

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Licens

Creative Commons  Erkännande 4.0 Internationell (CC BY 4.0)

Engelsk-svensk guldstandard för ordlänkning (GES)

Skapare/primärforskare

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Beskrivning

Data är skapade från den engelsk-svenska delen av den parallella korpusen Europarl och utgörs, för varje meningspar, av par av tokenidentifierare på formen n-m där n och m är heltal.

Dataformat / datastruktur

Numeriska

Text

Publicerad: 2019-05-15

Medintressenter

CLARIN ERIC
Nationella språkbanken
Vetenskapsrådet

Medlemmar

Språkbanken Text, GU
Språkbanken Tal, KTH
Språkbanken Sam, Isof
Centrum för digital humaniora, GU
Datorlingvistikgruppen, UU
Humanistlaboratoriet, LU

Humlab, UmU
Institutionen för lingvistik, SU
Kungliga biblioteket
NLPLab, LiU
Riksarkivet

Kontakta oss

info@sweclarin.se