D 2016

THE DEVELOPMENT OF CORPUS LINGUISTICS IN THE 20TH CENTURY

SLÁDKOVÁ, Věra

Základní údaje

Originální název

THE DEVELOPMENT OF CORPUS LINGUISTICS IN THE 20TH CENTURY

Název česky

VÝVOJ KORPUSOVÉ LINGVISTIKY VE 20. STOLETÍ

Autoři

SLÁDKOVÁ, Věra (203 Česká republika, garant, domácí)

Vydání

Hradec Králové, MMK 2016: Mezinárodní Masarykova konference pro doktorandy a mladé vědecké pracovníky, od s. 679-686, 8 s. 2016

Nakladatel

Magnanimitas

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/75081431:_____/16:00000892

Organizační jednotka

Vysoká škola technická a ekonomická v Českých Budějovicích

ISBN

978-80-87952-17-7

Klíčová slova česky

korpusová lingvistika; korpusy; anotace; označování slovních druhů

Klíčová slova anglicky

corpus linguistics; corpora; annotation; part-of-speech tagging

Štítky

Změněno: 4. 1. 2017 09:13, Hana Dlouhá

Anotace

V originále

Corpus linguistics has become the major methodology for studying language and corpora as research tools initiated the creation of software applications which have been developing since the 1960s. This paper explains what corpora are, gives a brief overview of their types, and maps the corpus annotation from the diachronic perspective. It also looks for the roots of this scientific field from the very beginning of linguistics and describes the work of the pioneers in humanities, who were not discouraged by Chomsky and other empiricist and laid foundation for the Brown Corpus of American English, which later served as a reference tool for creating the LOB Corpus of British English and a model for other corpora. The major and the most significant corpus projects that affected linguistic research, dictionary building, reference books creation and computational linguistics are presented from the historical perspective until the 1990s with a view to paying tribute to a few scientists of Czech origin who also considerably influenced the field and illustrating how exciting the corpus linguistics was at the very start.

Česky

Korpusová lingvistika se stala jedním z nejvýznamnějších metodologických postupů užívaných ke studiu jazyka a korpusy, jako nástroje výzkumu, iniciovaly tvorbu softwarových aplikací, které se systematicky vyvíjejí od šedesátých let minulého století. Tento článek vysvětluje, co korpusy jsou, podává krátký přehled o jejich typech a mapuje korpusovou anotaci v diachronní perspektivě. Dále hledá kořeny tohoto vědního oboru od samých počátků lingvistiky a seznamuje s prací průkopníků humanitních oborů, kteří se nenechali odradit Chomským a dalšími empiristy a položili základy pro tvorbu tzv. Brownova korpusu americké angličtiny, který později sloužil jako pomocný nástroj při tvorbě tzv. LOB korpusu britské angličtiny a též jako model pro ostatní korpusy. Až do devadesátých let minulého století jsou prezentovány největší a nejvýznamnější korpusové projekty, které ovlivnily lingvistický výzkum, počítačovou lingvistiku, tvorbu slovníků a referenčních příruček, s úmyslem připomenout též některé vědce českého původu, kteří tuto vědní disciplínu výrazně ovlivnili, a ukázat, jak vzrušující byla korpusová lingvistika ve svých začátcích.