
2025 m. birželio 16–20 dienomis vyko kasmetinė tarptautinė Lankasterio vasaros mokykla skirta tekstynų lingvistikai (Lancaster Summer Schools in Corpus Linguistics 2025), renginį organizavo Lankasterio universitetas (Lancaster University) (Jungtinė Karalystė).
Ši vasaros mokykla vyko gyvai, tačiau buvo sudarytos sąlygos kai kurių paskaitų klausytis ir nuotoliniu būdu. Dalinamės esminiais paskaitų akcentais iš nuotolinės Lankasterio vasaros mokyklos.
Paskaitų klausytojai buvo supažindinti su tekstynų lingvistikos teoriniais ir praktinio taikymo aspektais, istorija, technologijomis. Jūs taip pat galite sužinoti apie svarbiausius istorijos įvykius tekstynų lingvistikoje paspaudę ant nuorodos https://lancsbox.lancs.ac.uk/history/. Apie tekstynų lingvistiką skaitykite T. McEnery ir V. Brezina knygoje – Fundamental Principles of Corpus Linguistics. Pasižiūrėkite ir kitus naudingus išteklius.

McEnery, T., Brezina, V. (2022). Fundamental Principles of Corpus Linguistics. Cambridge University Press
Kai kurios knygos dalys nemokamai prieinamos čia.

2025 m. Lankasterio vasaros mokyklos vaizdo įrašus galite peržiūrėti čia https://cass.lancs.ac.uk/free-lancaster-lectures-on-corpus-linguistics/

Internete yra viešai prieinami ir senesnių metų vaizdo įrašai panašiomis temomis:
- ● Mokymai apie #LancsBox X ir tekstynų lingvistiką https://cass.lancs.ac.uk/lancsbox-x-innovation-in-corpus-linguistics/ Šiame vaizdo įraše sužinosite apie dažnį, kodėl jis svarbus ir kaip palyginti skirtingų dydžių tekstynų duomenis ir pan.
- ● Mokymai apie tekstynų lingvistiką, duomenų vizualizaciją ir naujausias technologijas https://www.youtube.com/watch?v=lLxMrLSZ6DQ.
Daugiau informacijos apie #LancsBox pateikta žemiau:
- ● Skaitykite įvadą į #LancsBox http://corpora.lancs.ac.uk/lancsbox/index.php.
- ● Mokymai apie #LancsBox: kam jis skirtas, iš kur parsiųsti ir kaip instaliuoti. Taip pat pristatomos pagrindinės šio įrankio funkcijos https://www.youtube.com/watch?v=i7dj7TTDM3E.
- ● Apsilankykite #LancsBox tinklalapyje, kuriame pateikiami mokomieji vaizdo įrašai, naudojimosi vadovas, pratimai, moksliniai straipsniai ir kt. naudingi ištekliai https://lancsbox.lancs.ac.uk/.
2025 m. Lankasterio vasaros mokykloje daug dėmesio buvo skiriama statistikai, buvo:
- ● paaiškinta, kad neturint statistinių žinių neįmanoma sukurti gero tekstyno, o taip pat ir jo analizuoti;
- ● pažymėta, kad siekiant gauti objektyvius ir reikšmingus duomenis, būtina atlikti statistinius skaičiavimus.
Jei domitės statistika ir norėtumėte sužinoti kaip praktiškai ją taikyti tekstynų lingvistikoje skaitykite V. Brezina knygą – Statistics in Corpus Linguistics: A Practical Guide.

Brezina, V. (2018). Statistics in Corpus Linguistics: A Practical Guide. Cambridge: Cambridge University Press.
Sužinokite daugiau apie šią knygą http://corpora.lancs.ac.uk/stats/index.php.
Knygos įvadą galite perskaityti čia.
Kita naudinga informacija apie statistiką tekstynų lingvistikoje: paskaitų vaizdo įrašai, skaidrės (pdf ir ppt formatais), paskaitų planai, naudingi įrankiai ir literatūra. Prieiga per internetą https://corpus-stats.lancs.ac.uk/#8-effect-size.
Renginyje buvo akcentuojama, kad tekstynų lingvistiką galima taikyti ne tik lingvistikoje, bet ir kituose moksluose ir praktinės veiklos srityse, pvz., galime atlikti klientų atsiliepimų analizę (sentiment analysis). Kai atliekama tokia analizė, įmonės sudarytame klientų atsiliepimų tekstyne yra labai svarbu netirti pavienių žodžių, pvz., puikus, geras, ar pavienių konstrukcijų, pvz., geras produktas, puikus produktas ir pan., tačiau būtina analizuoti visą kontekstą nes pozityvią konotaciją turintis žodis gali būti panaudotas su sarkazmu, šmaikščiai, pajuokiančiai, tada nagrinėjamo žodžio reikšmė įgauną visai kitą – neigiamą reikšmę. Žiūrėkite į apačioje pateiktą paveikslėlį.

4 klientų atsiliepimuose apie produktą 4 kartus buvo pasakyta, kad produktas yra geras, todėl be konteksto, žvelgiant skubotai galima padaryti klaidingą išvadą, kad 100 proc. klientų yra patenkinti parduodamu produktu. Visgi suprantama, kad tokios informacijos nepakanka siekiant objektyviai įvertinti klientų atsiliepimus. Būtina analizuoti ir kontekstą, tik tokiu būdu galime pastebėti, kad 4 kartus klientų išsakytas pozityvus būdvardis geras kontekste tampa negatyvus ir atskleidžia, kad didžioji dauguma klientų, net 75 proc., yra nepatenkinti parduodamu produktu. Todėl tiriant klientų atsiliepimus būtina atidžiai įvertinti visus aspektus.
V. Brezina patarė nesinaudoti dirbtiniu intelektu (DI) atliekant tokio tipo analizę, nes DI nesugeba tiksliai įvertinti komentarų, o sugeneruoti atsakymai neatitinka tikrovės. Taip pat mokslininkas pabrėžė, kad DI pateikiami duomenys apie tekstynus yra pramanyti, pvz., paklausus Chat GPT kiek kartų British National Corpus tekstyne (BNC2014) yra pavartotas daiktavardis žmonės (angl. people), sugeneruojamas neteisingas atsakymas, taip pat nutiko pateikus užklausą ir apie kitus tekstynus, nei vieną kartą nebuvo gautas teisingas atsakymas. Todėl siekiant išsiaiškinti su tekstynais susijusius dalykus atsakymų reikia ieškoti tekstyne, nes tik tokiu būdu gauti atsakymai bus teisingi ir nekeliantys abejonių.
Paskaitų metu buvo rekomenduojama perskaityti mokslinį straipsnį:
Adam Kilgarriff. 2007. Last Words: Googleology is Bad Science. Computational Linguistics, 33(1):147–151. Prieiga per internetą: https://aclanthology.org/J07-1010/.
Pasak V. Brezina, nepaisant to, jog šis straipsnis buvo parašytas jau seniai ir apie kitus dalykus, tačiau tą pačią logiką galima pritaikyti ir DI.
Sužinokite apie tekstynų lingvistiką socialiniuose moksluose https://cass.lancs.ac.uk/ (vykdomi projektai sveikatos priežiūros srityje https://cass.lancs.ac.uk/corpus-approaches-to-healthcare-communication/, katalogas apie tekstynų lingvistiką socialiniuose moksluose https://cass.lancs.ac.uk/wp-content/uploads/2025/06/CASS-Brochure.pdf).
Dar keletas naudingų nuorodų:

InteLLA: Išmanusis kalbų mokymosi asistentas (Intelligent Language Learning Assistant) https://www.youtube.com/watch?v=RzCq5Z4cDBk.

Beautiful Evidence
by Edward Tufte
(knyga apie duomenų vizualizaciją)
Xi, X. (2023). Advancing Language Assessment with AI and ML–Leaning into AI is Inevitable, but Can Theory Keep Up? Language Assessment Quarterly, 20(4–5), 357–376. https://doi.org/10.1080/15434303.2023.2291488.

Parašykite komentarą
Tik prisijungę vartotojai gali komentuoti.