Norsk dependenstrebank 2.0
Utvidet metadata
- resource Common Info:
- resource Type: corpus
- identification Info:
- resource Name: Norsk dependenstrebank 2.0
- resource Name: Norwegian Dependency Treebank 2.0
- description: Dette er versjon 2.0 av Norsk dependenstrebank (NDT), opphavleg utvikla av Språkbanken/Nasjonalbiblioteket i 2011-2014. I versjon 2.0 av NDT er den grammatiske annotasjonen behaldt frå tidlegare versjonar. Metadata frå UD-versjonen av NDT er lagt til, og det er gjort eit forsøk på å parallellisere ordtokenisering og setningssegmentering av UD- og NDT-versjonene. Trebanken er òg delt opp i test-, trenings- og evalueringssett etter mønster frå UD-versjonen. Sjå dokumentasjonsfila for detaljar. Den originale versjonen er framleis tilgjengeleg; søk på «sbr-10» i søkjefeltet i katalogen for å finne den. Kontakt oss gjerne på sprakbanken@nb.no om du har spørsmål eller kommentarar til denne ressursen.
- description: This is version 2.0 of the Norwegian Dependency Treebank (NDT), developed by the National Library of Norway in 2011-2014. In version 2.0 of NDT, the grammatical annotations remain the same as in the previous NDT version, but metadata from the UD version of the treebank has been added, and an effort has been made to parallelise the word tokenization and sentence segmentation of the UD and NDT versions. The treebank has also been split into test, train and evaluation sets following the UD splits. See the documentation file for details. The original version is still available; type “sbr-10” in the search box to find it. If you have questions or comments about this resource, please contact us at sprakbanken@nb.no.
- resource Short Name: NDT 2.0
- resource Short Name: NDT 2.0
- url: https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-86/
- P I D: hdl:21.11146/86
- identifier: sbr-86
- distribution Info:
- licence Info:
- user Category: Public
- distribution Access Medium: downloadable
- download Location: https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-86/
- licence:
- licence Family: Creative Commons (CC)
- licence Name: Creative_Commons-ZERO (CC-ZERO)
- licence Url: https://creativecommons.org/publicdomain/zero/1.0/
- conditions Of Use: *
- non Standard Conditions Of Use: * NORED * No redistribution * The original third-party contents are not included in this CC-0 license, and these individual works may not be republished as stand-alone texts.
- licensor:
- actor Info:
- actor Type: organization
- role: Licensor
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- communication Info:
- email: sprakbanken@nb.no
- url: https://www.nb.no/sprakbanken/
- address: P.O. Box 2674 Solli
- zip Code: 0203
- city: Oslo
- region: Oslo
- country: Norway
- contact
- actor Info:
- actor Type: organization
- role: Contact
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: The National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- communication Info:
- email: sprakbanken@nb.no
- url: https://www.nb.no/sprakbanken/
- address: P.O. Box 2674 Solli
- zip Code: 0203
- city: Oslo
- region: Oslo
- country: Norway
- actor Info:
- actor Type: organization
- role: Metadata Creator
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: The National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- actor Info:
- actor Type: organization
- role: Resource Creator
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: The National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- corpus Info:
- corpus Type: Treebank
- corpus Part Info:
- media Type: text
- corpus Text Info:
- text Format Info:
- mime Type: text/x-conll
- character Encoding Info:
- character Encoding: UTF-8
- corpus Part General Info:
- linguality Info:
- linguality Type: bilingual
- multilinguality Type: multilingualSingleText
- multilinguality Type Details: Blog text, news text, parliament proceedings, government white papers in Norwegian Bokmål and Norwegian Nynorsk
- language Info:
- language Id: nb
- language Name: Norwegian Bokmål
- size Per Language:
- size Info:
- size: 300000
- size Unit: tokens
- size Info:
- size: 3
- size Unit: files
- size Info:
- size: 15,3
- size Unit: mb
- language Variety Info:
- language Variety Type: other
- language Variety Name: Blog text, news text, parliament proceedings, government white papers
- language Info:
- language Id: nn
- language Name: Norwegian Nynorsk
- size Per Language:
- size Info:
- size: 300000
- size Unit: tokens
- size Info:
- size: 3
- size Unit: files
- size Info:
- size: 15,0
- size Unit: mb
- language Variety Info:
- language Variety Type: other
- language Variety Name: Blog text, news text, parliament proceedings, government white papers
- modality Info:
- modality Type: writtenLanguage
- modality Type Details: Blog text, news text, parliament proceedings, government white papers
- size Info:
- size: 5,8
- size Unit: mb
- annotation Info:
- annotation Type: morphosyntacticAnnotation-posTagging
- annotation Description: conll-u
- annotation Format: conll-u
dc:type | corpus |
dc:title | Norsk dependenstrebank 2.0 |
dc:identifier | oai:nb.no:sbr-86 |
dc:description | Dette er versjon 2.0 av Norsk dependenstrebank (NDT), opphavleg utvikla av Språkbanken/Nasjonalbiblioteket i 2011-2014. I versjon 2.0 av NDT er den grammatiske annotasjonen behaldt frå tidlegare versjonar. Metadata frå UD-versjonen av NDT er lagt til, og det er gjort eit forsøk på å parallellisere ordtokenisering og setningssegmentering av UD- og NDT-versjonene. Trebanken er òg delt opp i test-, trenings- og evalueringssett etter mønster frå UD-versjonen. Sjå dokumentasjonsfila for detaljar. Den originale versjonen er framleis tilgjengeleg; søk på «sbr-10» i søkjefeltet i katalogen for å finne den. Kontakt oss gjerne på sprakbanken@nb.no om du har spørsmål eller kommentarar til denne ressursen. |
dc:publisher | |
dc:format | downloadable |
dc:date | 2011-01-03 |
dc:date | 2023-08-24 |
dc:rights | Public |
dc:rights | Creative Commons (CC) |
dc:rights | Creative_Commons-ZERO (CC-ZERO) |
dc:rights | https://creativecommons.org/publicdomain/zero/1.0/ |
dc:creator | Nasjonalbiblioteket |
dc:creator | Universitetet i Oslo |
dc:lang | bokmål |
dc:lang | nynorsk |