Erinevus lehekülje "Korpus" redaktsioonide vahel

Allikas: Keeleteaduse wiki
Mine navigeerimisribale Mine otsikasti
14. rida: 14. rida:


==Korpused eesti keele uurimiseks==
==Korpused eesti keele uurimiseks==
[https://www.sketchengine.eu/estonian-national-corpus/ Eesti keele ühendkorpus 2019]


[https://www.cl.ut.ee/korpused/segakorpus/ Eesti keele koondkorpus]
[https://www.cl.ut.ee/korpused/segakorpus/ Eesti keele koondkorpus]
20. rida: 22. rida:


[https://vakk.ut.ee/ Vana kirjakeele korpus]
[https://vakk.ut.ee/ Vana kirjakeele korpus]
[https://www.keel.ut.ee/et/keelekogud/murdekorpus Murdekorpus]
[https://metashare.ut.ee/repository/browse/corpus-of-spoken-estonian/36d19e1c5a4511e2a6e4005056b4002400068e3651e841f5b4002067f439f7aa/ Suulise keele korpus]


==Kasutatud kirjandus==
==Kasutatud kirjandus==


Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339
Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339

Redaktsioon: 2. november 2021, kell 11:02

Korpus – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308).

Korpuste liigitus

  • Suletud korpus – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust (Muischnek, Lindström 2020: 308–309).
  • Avatud korpus – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused. (Muischnek, Lindström 2020: 309–310)
  • Erikorpus – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused) (Muischnek, Lindström 2020: 310).
  • Suulise keele korpus – suulise keelekasutuse litereeringutest koosnev korpus (Muischnek, Lindström 2020: 310).
  • Multimodaalne korpus – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali (Muischnek, Lindström 2020: 310).

Korpused eesti keele uurimiseks

Eesti keele ühendkorpus 2019

Eesti keele koondkorpus

Eesti kirjakeele korpus 1890–1990

Vana kirjakeele korpus

Murdekorpus

Suulise keele korpus

Kasutatud kirjandus

Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339