Erinevus lehekülje "Korpus" redaktsioonide vahel

Allikas: Keeleteaduse wiki
Mine navigeerimisribale Mine otsikasti
(Uus lehekülg: ''''Korpus''' – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308). ==Korpuste liigitus== *'''Suletud korpus''' – kindla...')
 
 
(ei näidata sama kasutaja 7 vahepealset redaktsiooni)
3. rida: 3. rida:
==Korpuste liigitus==
==Korpuste liigitus==


*'''Suletud korpus''' – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust.
*'''Suletud korpus''' – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust (Muischnek, Lindström 2020: 308–309).


*'''Avatud korpus''' – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused.
*'''Avatud korpus''' – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused. (Muischnek, Lindström 2020: 309–310)


*'''Erikorpus''' – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused)
*'''Erikorpus''' – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused) (Muischnek, Lindström 2020: 310).


*'''Suulise keele korpus''' – suulise keelekasutuse litereeringutest koosnev korpus.
*'''Suulise keele korpus''' – suulise keelekasutuse litereeringutest koosnev korpus (Muischnek, Lindström 2020: 310).


*'''Multimodaalne korpus''' – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali.
*'''Multimodaalne korpus''' – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali (Muischnek, Lindström 2020: 310).


==Korpused eesti keele uurimiseks==
[https://www.sketchengine.eu/estonian-national-corpus/ Eesti keele ühendkorpus 2019]
[https://www.cl.ut.ee/korpused/segakorpus/ Eesti keele koondkorpus]
[https://portaal.eki.ee/corpus Eesti Keele Instituudi tekstikorpus]
[https://www.cl.ut.ee/korpused/baaskorpus/index.php?lang=et Eesti kirjakeele korpus 1890–1990]
[https://vakk.ut.ee/ Vana kirjakeele korpus]
[https://www.keel.ut.ee/et/keelekogud/murdekorpus Murdekorpus]
[https://metashare.ut.ee/repository/browse/corpus-of-spoken-estonian/36d19e1c5a4511e2a6e4005056b4002400068e3651e841f5b4002067f439f7aa/ Suulise keele korpus]
[https://foneetikakorpus.ut.ee/ Spontaanse kõne foneetiline korpus]
[http://peeter.eki.ee:5000/ Emotsionaalse kõne korpus]
[https://www.eki.ee/piibel/ Eesti piiblitõlke ajalooline konkordants]
[https://metashare.ut.ee/repository/browse/estonian-learners-language-corpus-web-application/1af964c406e911eaa6e4005056b40024007f4445a103461ab9d3da94e1257646/ Eesti keele õppija korpus]
[https://metashare.ut.ee/repository/browse/corpus-of-estonian-web-sentences-2020/53f347debb6d11eaa6e4fa163e9d45476c2f2fd1786a43eabd0ccf391f42d588/ Veebilausete korpus]
[https://metashare.ut.ee/repository/browse/estonian-as-a-second-language-coursebook-content-corpus-2017/a23a3cf6cdd911e7a6e4005056b400243c0fd0d1773b49cdb9aa42a4a0ab5cae/ Eesti keele A1-C1 õpikute sisu korpus]
[https://metashare.ut.ee/repository/browse/estonian-as-a-second-language-coursebook-sentences-corpus-2021/91fa4ad42fd311eba6e4fa163e9d45479d3e516973b9484e94607fe1ab01382f/ Eesti keele A1-C1 õpikute lausete korpus]


==Korpused eesti keele uurimiseks==
[https://metashare.ut.ee/repository/browse/estonian-as-a-second-language-school-coursebook-content-corpus-2021/32153bca387e11eba6e4fa163e9d45472652ed473e9f4fdf860820d4d9fbf304/ Eesti keele kui teise keele kooliõpikute sisu korpus]


[https://metashare.ut.ee/repository/browse/estonian-as-a-second-language-school-coursebook-sentences-corpus-2021/4131847032e711eba6e4fa163e9d45472e036a9438774feab9f2f7084dffc580/ Eesti keele kui teise keele kooliõpikute lausete korpus]


==Kasutatud kirjandus==
==Kasutatud kirjandus==


Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339
'''Muischnek, Kadri, Liina Lindström 2020.''' Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339

Viimane redaktsioon: 23. november 2021, kell 18:02

Korpus – keeleuurimise aluseks olev korrastatud elektrooniliste tekstide kogu (Muischnek, Lindström 2020: 308).

Korpuste liigitus

  • Suletud korpus – kindla hulga tekstidega korpus, mis esindab tasakaalustatult ja representatiivselt ühe ajahetke või teatud tüüpi tekstide keelekasutust (Muischnek, Lindström 2020: 308–309).
  • Avatud korpus – pidevalt täienev korpus, mis ei taotle representatiivsust, vaid võimalikult suurt andmete hulka. Tänapäeval levinum variant kui suletud korpused. (Muischnek, Lindström 2020: 309–310)
  • Erikorpus – vanemat või kitsamalt piiritletud keelekasutust esindav korpus (nt murdekorpused, ajaloolise keele korpused, luulekorpused) (Muischnek, Lindström 2020: 310).
  • Suulise keele korpus – suulise keelekasutuse litereeringutest koosnev korpus (Muischnek, Lindström 2020: 310).
  • Multimodaalne korpus – korpus, mis sisaldab lisaks tekstidele ka audio- ja videomaterjali (Muischnek, Lindström 2020: 310).

Korpused eesti keele uurimiseks

Eesti keele ühendkorpus 2019

Eesti keele koondkorpus

Eesti Keele Instituudi tekstikorpus

Eesti kirjakeele korpus 1890–1990

Vana kirjakeele korpus

Murdekorpus

Suulise keele korpus

Spontaanse kõne foneetiline korpus

Emotsionaalse kõne korpus

Eesti piiblitõlke ajalooline konkordants

Eesti keele õppija korpus

Veebilausete korpus

Eesti keele A1-C1 õpikute sisu korpus

Eesti keele A1-C1 õpikute lausete korpus

Eesti keele kui teise keele kooliõpikute sisu korpus

Eesti keele kui teise keele kooliõpikute lausete korpus

Kasutatud kirjandus

Muischnek, Kadri, Liina Lindström 2020. Digitaalsed tekstiandmed ja korpuslingvistika. – Kuidas mõista andmestunud maailma? Metodoloogiline teejuht. Koost. ja toim. Anu Masso, Katrin Tiidenberg, Andra Siibak. Tallinn: Tallinna Ülikooli Kirjastus, 306–339