Erinevus lehekülje "Valik keeleteaduslikke andmebaase" redaktsioonide vahel

Allikas: Keeleteaduse wiki
Mine navigeerimisribale Mine otsikasti
20. rida: 20. rida:
* '''[http://www.unesco.org/languages-atlas/ UNESCO Atlas of the World's Languages in Danger]''' – UNESCO ohustatud keelte atlas. Lisaks keele nimele saab keeli otsida ka riikide kaupa või kõnelejate arvu järgi. Keele kirjes on välja toodud keele nimi eri keeltes, kõnelejate arv ja levikuala.
* '''[http://www.unesco.org/languages-atlas/ UNESCO Atlas of the World's Languages in Danger]''' – UNESCO ohustatud keelte atlas. Lisaks keele nimele saab keeli otsida ka riikide kaupa või kõnelejate arvu järgi. Keele kirjes on välja toodud keele nimi eri keeltes, kõnelejate arv ja levikuala.


* '''[https://wals.info/ WALS]''' – maailma keelte tüpoloogia andmebaas. Ülevaade keelest on antud tüpoloogiliste joonte (''features'') loetelu kaudu, millele vastavalt keele omadustele on antud väärtus (''value''). Andmebaasi saab kasutada mõlemat pidi, nii joonte kui ka keelte kaudu otsides. Vt lähemalt [[WALSi kasutamine]]
* '''[https://wals.info/ WALS]''' – maailma keelte tüpoloogia andmebaas. Ülevaade keelest on antud tüpoloogiliste joonte (''features'') loetelu kaudu, millele vastavalt keele omadustele on antud väärtus (''value''). Andmebaasi saab kasutada mõlemat pidi, nii joonte kui ka keelte kaudu otsides. Vt lähemalt [[WALSi kasutamine]].


* '''[https://wold.clld.org/ WOLD]''' – maailma keelte laensõnade andmebaas. Iga keele juures on 1000-2000 sõnast koosnev valim, mille iga sõna on varustatud infoga algupära kohta (kindlalt laenatud, X tõenäosusega laenatud, arvatavasti mitte laenatud). Võimalusel on laenatud sõnale lisatud doonorkeel, algne sõnakuju doonorkeeles ja potentsiaalne laenamissituatsioon. Samuti on võimalik sõnade tähendusest ja semantilisest väljast lähtuvalt vaadata statistikat nende laenatavuse sageduse, vanuse ja arusaadavuse kohta (vastavalt ''borrowed'', ''age'' ja ''simplicity score'').
* '''[https://wold.clld.org/ WOLD]''' – maailma keelte laensõnade andmebaas. Iga keele juures on 1000-2000 sõnast koosnev valim, mille iga sõna on varustatud infoga algupära kohta (kindlalt laenatud, X tõenäosusega laenatud, arvatavasti mitte laenatud). Võimalusel on laenatud sõnale lisatud doonorkeel, algne sõnakuju doonorkeeles ja potentsiaalne laenamissituatsioon. Samuti on võimalik sõnade tähendusest ja semantilisest väljast lähtuvalt vaadata statistikat nende laenatavuse sageduse, vanuse ja arusaadavuse kohta (vastavalt ''borrowed'', ''age'' ja ''simplicity score'').

Redaktsioon: 22. november 2021, kell 15:40

Siit leiad tähestikulises järjekorras olulisemad keeleteaduslikud andmebaasid koos sisu lühikirjeldustega.


  • APiCS – pidžin- ja kreoolkeelte andmebaas. Pakub infot keelte tekkimise, tüpoloogiliste joonte ja sotsiolingvistiliste omaduste kohta. Välja on toodud häälikusegmentide loetelu ja IPA tabelid. Samuti on keelte juures lühikesed näitetekstid koos glosside ja tõlgete ning mõnel juhul isegi helisalvestisega.
  • Austronesian Basic Vocabulary Database – austroneesia keelte põhisõnavara andmebaas. Andmebaasis on 210 levinuma sõna kirjeid 1600 selle hõimkonna keelest. Sõnade valim on iga keele kirjes sama. Võimalik on vaadata nii iga keele sõnade nimekirja kui ka eraldi iga sõna vasteid keeltes.
  • CLICS – keeltevaheliste semnatiliste seoste andmebaas. Võimaldab uurida, kuidas sõnade vahelised seosed eri keeltes kattuvad. Otsinguid on võimalik teostada kontseptsioone (concepts) väljendavate märksõnade kaudu: andmebaas näitab selle märksõnaga seotud teisi kontseptsioone eri keeltes ja nende omavahelisi kattumisi. Neid seoseid on võimalik kujutada ka graafikul.
  • Ethnologue – ülevaatlik andmebaas maailma keeltest. Pakub ennekõike sotsiolingvistilist infot (nt kõnelejate hulk, levik riigiti, murded), kuid ka ülevaadet peamistest tüpoloogilistest joontest (nt sõnajärg). Andmebaasi kasutamiseks on vajalik sisse logida TÜ raamatukogu kaudu. Vt lähemalt Ethnologue'i kasutamine.
  • MultiTree – keelte genealoogilise kuuluvuse hüpoteeside andmebaas. Seal on kokku kogutud, süstematiseeritud ja visualiseeritud 263 teadlase teooriad eri keelte algupära ja omavahelise suguluse kohta. Hüpoteese saab otsida vastavalt keelkondadele või autoritele ning avastada interaktiivsetel joonistel. Andmebaasil on väärtus ka keeleteaduse ajaloo uurimisel, kuna vanimad esitatud keelepuud ulatuvad 19. sajandi algusesse.
  • PHOIBLE – maailma keelte häälikusüsteemide andmebaas. See on mõlemat pidi kasutatav: saab otsida nii häälikute (segments) kui ka keelte järgi. Keele kirje juures on esitatud keele häälikute nimekiri koos oma vastavate allofoonidega, häälikute esinemus (representation) ja IPA tabelid.
  • ScriptSource – maailma keelte kirjasüsteemide andmebaas. Otsida saab nii keelte kui ka kirjaviiside ja tähemärkide järgi. Kirjaviisi info juures on mh. välja toodud selle tüüp, kirjutamise suund, diakriitikute olemasolu ning seda kirja kasutavad keeled. Samuti on keelte ja kirjaviiside juurde lisatud allikaid ja materjale ning praktilist infot fontide ja klaviatuurikasutamise kohta.
  • UNESCO Atlas of the World's Languages in Danger – UNESCO ohustatud keelte atlas. Lisaks keele nimele saab keeli otsida ka riikide kaupa või kõnelejate arvu järgi. Keele kirjes on välja toodud keele nimi eri keeltes, kõnelejate arv ja levikuala.
  • WALS – maailma keelte tüpoloogia andmebaas. Ülevaade keelest on antud tüpoloogiliste joonte (features) loetelu kaudu, millele vastavalt keele omadustele on antud väärtus (value). Andmebaasi saab kasutada mõlemat pidi, nii joonte kui ka keelte kaudu otsides. Vt lähemalt WALSi kasutamine.
  • WOLD – maailma keelte laensõnade andmebaas. Iga keele juures on 1000-2000 sõnast koosnev valim, mille iga sõna on varustatud infoga algupära kohta (kindlalt laenatud, X tõenäosusega laenatud, arvatavasti mitte laenatud). Võimalusel on laenatud sõnale lisatud doonorkeel, algne sõnakuju doonorkeeles ja potentsiaalne laenamissituatsioon. Samuti on võimalik sõnade tähendusest ja semantilisest väljast lähtuvalt vaadata statistikat nende laenatavuse sageduse, vanuse ja arusaadavuse kohta (vastavalt borrowed, age ja simplicity score).