Korpus

Allikas: Keeleteaduse wiki
Redaktsioon seisuga 2. november 2021, kell 10:32 kasutajalt Keeletark (arutelu | kaastöö) (Uus lehekülg: ''''Korpus''' – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308). ==Korpuste liigitus== *'''Suletud korpus''' – kindla...')
(erin) ←Vanem redaktsioon | Viimane redaktsiooni (erin) | Uuem redaktsioon→ (erin)
Mine navigeerimisribale Mine otsikasti

Korpus – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308).

Korpuste liigitus

  • Suletud korpus – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust.
  • Avatud korpus – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused.
  • Erikorpus – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused)
  • Suulise keele korpus – suulise keelekasutuse litereeringutest koosnev korpus.
  • Multimodaalne korpus – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali.


Korpused eesti keele uurimiseks

Kasutatud kirjandus

Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339