Eesti artiklid Rahvusraamatukogu kollektsioonis dea.digar.ee

DIGARi Eesti artiklite portaali on koondatud hulk Eestis ilmunud või välismaal eesti keeles avaldatud ajalehetekste (alates 1821. aastast) ja ajakirja ja muude perioodiliste väljaannete tekste (alates 2017. aastast). dea.digar.ee portaalis saab neis teha tekstiotsingut ning lugeda artikleid algkontekstis. data.digar.ee tekstilaboris saab avatud täistekste alla laadida ning neid kasutada otsingutes ja andmetöötluses. Ajakirjad ja muu perioodika on enne 2017. www.digar.ee kollektsioonis ja ei ole tekstikogusse veel kaasatud.

See dokument annab ülevaate kollektsiooni sisust. Kollektsioonis on praegu 386 950 numbrit 2200 väljaandest (sh. ajalehed, ajakirjad). Kokkku teeb see 3 635 503 lehekülge teksti ja 6 298 369 segmenteeritud artiklit. Mõned neist tekstidest on vabalt kättesaadavad, teistel on ligipääsupiirangud autoriõiguste ja muude kokkulepete tõttu kirjastustega. Vabalt kättesaadavad tekstid on saadaval esialgu pilootrakenduse kaudu siit.

Millised väljaanded on kogus?

Järgnevalt on kogus olevad väljaanded kujutatud graafikus ja otsitavas tabelis. Graafiku ja tabeli vahel valimiseks kasutage allolevaid nuppe.

Graafik

Graafikul on kujutatud kõik kollektsioonis olevad ajalehenumbrid. Näiteks aastast 1933 on kogus üle 9000 numbri 1880ndatel aga ligi 1000 numbrit aastast. Nõukogude ajast on lehti vähem. Alates 2017 aastast on kollektsioonis ka ajakirjad ja muu perioodika.

Tabel

Järgnevalt on kuvatud samad andmed interaktiivse tabelina. Tabelis ja tekstitulpades saab otsida väljaandeid nimede kaupa. Valiku võib teha ka väljaande esimese ja viimase ilmumisaja järgi.

Suurimad väljaanded

20 väljaannet, millel on kõige rohkem ilmunud numbreid kollektsioonis.

Nende 20 suurima väljaande ilmumisajad.

Keeled, ilmumiskohad, žanrid

Kogus on väljaandeid mitmes keeles. Enamik väljaandeid on ilmunud eesti keeles, hulk materjali on ka vene ja saksa keeles. Mõned uuemad ajakirjad on ilmunud inglise keeles. Üksikud väljaanded on ilmunud teistes keeltes. Liigutades hiirt graafiku kohal on näha ka info täpsete väljaannete kohta siin ja järgnevates tabelites.

Kogus on informatsioon ka ilmumiskoha kohta. Enamik ajalehtedest ja perioodikast on ilmunud Eestis. Paar ajalehte kogus on ilmunud Lätis ja Venemaal. Nõukogude ajal moodustavad suure osa kollektsioonist hetkel välis-eesti väljaanded.

All on toodud ajalehed tüüpide kaupa kollektsioonis. Suurima osa kogust enne teist maailmasõda moodustavad suured päevalehed. Aastast 2000 moodustavad olulise osa kollektsioonist kohalikud ajalehed.

Alates aastast 2017 on kollektsiooni kaasatud ka ajakirjad ja muu perioodika. Nende žanriline jaotus on näha all.

Kui palju on ligipääsetavaid materjale?

Suur osa kollektsioonist on vabalt kasutatav ja jagatav igasuguseks analüüsiks. Artiklite taasavaldamisel tuleks küll kontrollida tekstide autoriõiguste kohta. Kasutamist teadus- ja hariduseesmärkidel need autoriõigused ei takista. Ajalehenumbrid, millele ligipääsupiirangud puuduvad, oleme teinud allalaetavaks pilootlahenduse kaudu. Piiratud juurdepääsuga tekstidele vahetut ligipääsu ei saa pakkuda, aga Rahvusraamatukogu töötab selle nimel, et võimaldada andmekaevet neile autoriseeritud töökoha kaudu.

Kokku on dea.digar.ee kollektsioonis 440 405 ajalehenumbrit. Allalaetavas tekstikollektsioonis on hetkel saada 403 201, s.o. 91.5%.

Ülevaade

Graafik

All on ülevaade ajalehenumbritest kollektsioonis. Rohelised numbrid on vabalt ligipääsetavad, punastele saab hetkel ligi autoriseeritud töökoha kaudu, kus on võimalik tekste lugeda.

Tabel

Järgnevalt on kuvatud samad andmed interaktiivse tabelina. Tabelis ja tekstitulpades saab otsida väljaandeid nimede kaupa. Valiku võib teha ka väljaande esimese ja viimase ilmumisaja järgi.

Massdigiteerimise projekt (2019-2021)

“Kultuuripärandi digiteerimine 2018-2023” raames on hetkel digiteerimisel 1,5 miljonit lehekülge tekste (sh. 700 000 lk ajalehti ja 800 000 lk raamatuid). Suur osa sellest on nõukogudeaegne ajakirjandus, misläbi paraneb 20. sajandi teise poole kate kollektsioonis oluliselt.

Digiteeritavate väljaannete nimekiri täieneb jooksvalt. Praegu on töös järgnevas tabelis toodud väljaanded. Kui digiteerimisprotsess on lõppenud, kaasame need samuti ka siinsesse tekstikollektsiooni.

Ligipääs materjalidele

Materjalidele ligipääsuks on hetkel võimalik kasutada Rahvusraaamatukogu JupyterHub-il põhinevat lahendust. Loodud on abipakett, millega saab korraga ligi kasutaja poolt valitud osale tekstidest. Ligipääs toetub R-ile, tekstide töötlemiseks keskkonnas saab kasutada R-i või Pythonit.