Erinevus lehekülje "Korpus" redaktsioonide vahel
Mine navigeerimisribale
Mine otsikasti
| 14. rida: | 14. rida: | ||
==Korpused eesti keele uurimiseks== | ==Korpused eesti keele uurimiseks== | ||
[https://www.sketchengine.eu/estonian-national-corpus/ Eesti keele ühendkorpus 2019] | |||
[https://www.cl.ut.ee/korpused/segakorpus/ Eesti keele koondkorpus] | [https://www.cl.ut.ee/korpused/segakorpus/ Eesti keele koondkorpus] | ||
| 20. rida: | 22. rida: | ||
[https://vakk.ut.ee/ Vana kirjakeele korpus] | [https://vakk.ut.ee/ Vana kirjakeele korpus] | ||
[https://www.keel.ut.ee/et/keelekogud/murdekorpus Murdekorpus] | |||
[https://metashare.ut.ee/repository/browse/corpus-of-spoken-estonian/36d19e1c5a4511e2a6e4005056b4002400068e3651e841f5b4002067f439f7aa/ Suulise keele korpus] | |||
==Kasutatud kirjandus== | ==Kasutatud kirjandus== | ||
Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339 | Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339 | ||
Redaktsioon: 2. november 2021, kell 11:02
Korpus – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308).
Korpuste liigitus
- Suletud korpus – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust (Muischnek, Lindström 2020: 308–309).
- Avatud korpus – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused. (Muischnek, Lindström 2020: 309–310)
- Erikorpus – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused) (Muischnek, Lindström 2020: 310).
- Suulise keele korpus – suulise keelekasutuse litereeringutest koosnev korpus (Muischnek, Lindström 2020: 310).
- Multimodaalne korpus – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali (Muischnek, Lindström 2020: 310).
Korpused eesti keele uurimiseks
Eesti kirjakeele korpus 1890–1990
Kasutatud kirjandus
Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339