Hopp til innhold

Korpus med bokomtalar frå Bokelskere.no

Dette korpuset inneheld ein dump av brukargenererte bokomtalar og diskusjonar frå Bokelskere.no, ein nettstad der brukarane skriv omtalar av og diskuterer nye og eldre bøker, både skjønnlitteratur og fagprosa.

Korpuset er på JSON-format, der kvart objekt svarar til ein omtale eller ein kommentar til ein omtale på Bokelskere.no. Kvart objekt inneheld dei følgjande felta:

– «post_id»: unik identifkator for omtalen
– «date»: dato når omtalen blei posta
– «user_id»: unik identifikator for brukaren
– «isbn13»: ISBN-nummer for den aktuelle boka
– «post_title»: tittel på omtalen
– «text»: omtalen
– «score»: evaluering (terningkast 1-6)
– «main_title»: tittel på boka
– «author»: forfattar av boka
– «parent_id»: identifikator for ein omtale som er kommentert

Korpuset inneheld omlag 219.000 postar/objekt, og 1,5 millionar ord (i «text»-feltet).

Dette korpuset inneheld ein dump av brukargenererte bokomtalar og diskusjonar frå Bokelskere.no, ein nettstad der brukarane skriv omtalar av og diskuterer nye og eldre bøker, både skjønnlitteratur og fagprosa.

Korpuset er på JSON-format, der kvart objekt svarar til ein omtale eller ein kommentar til ein omtale på Bokelskere.no. Kvart objekt inneheld dei følgjande felta:

– «post_id»: unik identifkator for omtalen
– «date»: dato når omtalen blei posta
– «user_id»: unik identifikator for brukaren
– «isbn13»: ISBN-nummer for den aktuelle boka
– «post_title»: tittel på omtalen
– «text»: omtalen
– «score»: evaluering (terningkast 1-6)
– «main_title»: tittel på boka
– «author»: forfattar av boka
– «parent_id»: identifikator for ein omtale som er kommentert

Korpuset inneheld omlag 219.000 postar/objekt, og 1,5 millionar ord (i «text»-feltet).

Utvidet metadata

Last ned ressurser

Last ned metadata