Korpus
Mine navigeerimisribale
Mine otsikasti
Korpus – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308).
Korpuste liigitus
- Suletud korpus – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust.
- Avatud korpus – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused.
- Erikorpus – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused)
- Suulise keele korpus – suulise keelekasutuse litereeringutest koosnev korpus.
- Multimodaalne korpus – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali.
Korpused eesti keele uurimiseks
Kasutatud kirjandus
Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339