Laboratorium 1.1: Badania korpusowe 23-KODL-LBK
Opis treści kształcenia
Kognitywne aspekty użycia, akwizycji i patologii języka w badaniach metodą korpusową.
Werbalne wskaźniki rozwoju poznawczego
Specyfika badania akwizycji języka przy użyciu metody korpusowej.
Metody transkrypcji mowy we wczesnym stadium akwizycji oraz mowy zaburzonej.
Zasady konstruowania korpusów językowych innych typów niż poznane na dotychczasowych zajęciach z językoznawstwa.
Konstrukcja korpusów niestandardowych, bądź do zadań specjalnych a konwencje budowy systemów znaczników.
Uzasadnienie ograniczeń w doborze próbek języka naturalnego dla korpusów mowy i tekstu pisanego.
Konstrukcja korpusu na potrzeby badań do pracy magisterskiej.
Typy anotacji oraz zasady tagowania danych językowych – poziom rozszerzony:
Tagowanie morfosyntaktyczne.
Parsing.
Anotacja semantyczna – metoda ręczna, semi-automatyczna i automatyczna.
Wykorzystanie Latent Semantic Analysis oraz Singular Value Decomposition w tagowaniu semantycznym.
Specyfika anotacji pragmatycznej.
Dobór specjalistycznego oprogramowania do organizowania i analizy danych korpusu.
Zalety lemmatyzacji, listy frekwencyjne zwykłe a zlematyzowane, programy do zautomatyzowanej lemmatyzacji.
Budowa podkorpusów i korpusów do badania pilotażowego.
Korpusy treningowe dla narzędzi NLP.
Translacja automatyczna oparta na korpusowej analizie tekstu.
Wykorzystanie korpusu na potrzeby językoznawstwa stosowanego.
Zastosowanie korpusów w leksykografii.
Wykorzystanie korpusu do znalezienia odpowiedzi na pytanie dot. fonologii, morfologii, składni bądź innych aspektów języka.
Wykorzystanie korpusów przy przygotowaniu bodźców werbalnych/ pytań testowych w eksperymentach behawioralnych także spoza językoznawstwa.
Zaplanowanie i przeprowadzenie badania na istniejącym rozbudowanym korpusie (np. na Korpusie MDP, który zostanie udostępniony studentom). Opracowanie i interpretacja wyników.
Kierunek studiów
Poziom przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Po zakończeniu modułu (przedmiotu) i potwierdzeniu osiągnięcia efektów kształcenia student potrafi:
Dobrać odpowiednio materiał językowy i skonstruować korpus danych na potrzeby dowolnych badań także spoza językoznawstwa.
Wykorzystać dostępne korpusy językowe przy przygotowaniu bodźców werbalnych/ pytań testowych w eksperymentach behawioralnych z dziedziny kognitywistyki, psychologii poznawczej i językoznawstwa kognitywnego.
Dobierać odpowiednie rodzaje korpusów na potrzeby badań językoznawstwa kognitywnego, socjolingwistyki i dziedzin pokrewnych.
Transkrybować i anotować próbki języka naturalnego na poziomach: dyskursowym, morfosyntaktycznym, semantycznym i pragmatycznym tak, aby zwiększyć skuteczność automatycznej analizy dużych zbiorów danych.
Stosować odpowiednio dobrane oprogramowanie służące do automatycznej analizy tekstu korpusu.
Wykorzystać korpus jako pole treningowe i testowe przy tworzeniu narzędzi NLP.
Analizować oraz przetwarzać dane korpusowe.
Zaplanować oraz przeprowadzić proste badanie na korpusie językowym.
Kryteria oceniania
przygotowanie do zajęć i praca na zajęciach
wykonanie zadań
przygotowanie badania korpusowego i opracowanie wyników
Literatura
Aijmer, K. & Altenberg. B. (eds.). (1991). English Corpus Linguistics. Addison Wesley Longman.
Ädel, A. and Reppen, R. (eds). (2008). Corpora and Discourse: The challenges of different settings. John Benjamins.
Baayern, R.H. (2001) Word Frequency Distributions. Dordrecht - Boston - London: Kluwer Academic Publishers (Text, Speech and Language Technology, 18.
Baker, P., Hardie, A., & McEnery, T. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.
Barlow, M. (1996). Corpora for Theory and Practice. International Journal of Corpus Linguistics, 1, 1.
Barnbrook, G. (1996). Language and Computers. Edinburgh University Press.
Biber, Conrad & Reppen. (1998). Corpus Linguistics. Cambridge University Press.
Botley, S.P. (2006). “Indirect anaphora: Testing the limits of corpus-based linguistics”. International Journal of Corpus Linguistics 11,1. Pp. 73-112.
Bougraev, B. & Pustejovsky, J. (red.). (1996). Corpus Processing for Lexical Acquisition. MIT Press.
Church, K., Gale, W., Hanks P. and Hindle, D. (1991). Using statistics in lexical analysis. In U. Zernik (ed.) Lexical Acquisition. Englewood Cliff, NJ: Erlbaum. 115—64.
Clear, J. H. (1992). `Corpus Sampling' in G. Leitner (red.) (str. 21-31) . Mouton de Gruyter, Berlin.
Fabiszak, M. and Kaszubski, P. (2006). "Studying metaphor with the BNC". Poznan Studies in Contemporary Linguistics 41: 111-129.
Facchinetti, Roberta and Matti Rissanen (red.). (2006). Corpus-Based Studies of Diachronic English. Peter Lang Pub Inc.
Fairon, C., Naets, H., Kilgarriff, H., de Schryver, G-M. (red). (2007). Building and Exploring Web Corpora. UCL Presses Universitaires de Louvain.
Garside, Leech, McEnery (red.). (1997). Corpus Annotation. Addison Wesley Longman.
Graeme, Kennedy. (1998). An Introduction to Corpus Linguistics. Addison Wesley Longman.
Jucker, A. H., Schreier, D.and Hundt, M.(red.) (2009). Corpora: Pragmatics and Discourse Rodopi-ebook.
Lewandowska-Tomaszczyk B. (red.). (2005). Podstawy językoznawstwa korpusowego, Łódź: Wydawnictwo Uniwersytetu Łódzkiego.
Lüdeling, A., & Kytö, M. (Eds). (2008). Corpus Linguistics. An International Handbook (Volume 1). Berlin - New York: Mouton de Gruyer.
Lüdeling, A., & Kytö, M. (Eds). (2009). Corpus Linguistics. An International Handbook (Volume 2). Berlin - New York: Mouton de Gruyer.
McEnery, T., and Wilson, A. (2001). Corpus Linguistics, 2nd ed. Edinburgh University Press.
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge: Cambridge University Press.
Ooi, V. B.Y. (1998). Computer Corpus Lexicography. Edinburgh University Press.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: