{"id":1454,"date":"2022-09-07T16:12:31","date_gmt":"2022-09-07T14:12:31","guid":{"rendered":"http:\/\/ptj-warszawa2022.uksw.edu.pl\/?page_id=1454"},"modified":"2022-09-07T16:12:32","modified_gmt":"2022-09-07T14:12:32","slug":"przetwarzanie-jezyka-naturalnego-na-potrzeby-literaturoznawstwa-na-przykladzie-infrastruktury-golem","status":"publish","type":"page","link":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/?page_id=1454","title":{"rendered":"Przetwarzanie j\u0119zyka naturalnego na potrzeby literaturoznawstwa na przyk\u0142adzie infrastruktury GoLEM"},"content":{"rendered":"\n<p>Agnieszka Karli\u0144ska, Maciej Maryl<\/p>\n\n\n\n<p>Instytut Bada\u0144 Literackich Polskiej Akademii Nauk<\/p>\n\n\n\n<p>Celem wyst\u0105pienia jest przedyskutowanie wynik\u00f3w analizy Korpusu Dyskursu Literaturoznawczego (KDL) uzyskanych za pomoc\u0105 Grafowego Literackiego Eksploratora Maszynowego (GoLEM) i prezentacja wniosk\u00f3w dotycz\u0105cych dostosowywania narz\u0119dzi j\u0119zykoznawczych do bada\u0144 literackich. GoLEM to infrastruktura do zaawansowanej analizy i wizualizacji powi\u0105za\u0144 mi\u0119dzy terminami, bytami i s\u0142owozbiorami (tematami) w wymiarze synchronicznym i diachronicznym, budowana przez Instytut Bada\u0144 Literackich i Politechnik\u0119 Wroc\u0142awsk\u0105 w ramach projektu DARIAH-PL.&nbsp;<\/p>\n\n\n\n<p>W wyst\u0105pieniu przedstawimy za\u0142o\u017cenia teoretyczne i metodologiczne stoj\u0105ce u podstaw GoLEM-a, a tak\u017ce om\u00f3wimy wyzwania zwi\u0105zane z wykorzystaniem metod i narz\u0119dzi wypracowanych na gruncie j\u0119zykoznawstwa komputerowego do pyta\u0144 badawczych stawianych przez literaturoznawc\u00f3w.&nbsp;<\/p>\n\n\n\n<p>GoLEM pomy\u015blany zosta\u0142 jako odpowied\u017a na problem rozproszenia narz\u0119dzi przetwarzania j\u0119zyka naturalnego dla j\u0119zyka polskiego i brak ich dostosowania do konkretnych zada\u0144 literaturoznawczych. Poszczeg\u00f3lne narz\u0119dzia zostan\u0105 po\u0142\u0105czone w ramach sp\u00f3jnego workflow i dostosowane do potrzeb literaturoznawc\u00f3w oraz specyfiki analizowanych przez nich tekst\u00f3w. Infrastruktura zwi\u0119kszy tak\u017ce kontrol\u0119 u\u017cytkownik\u00f3w nad materia\u0142em poprzez \u015bcis\u0142e powi\u0105zanie analizowanych tekst\u00f3w z metadanymi.&nbsp;<\/p>\n\n\n\n<p>W prezentacji skupimy si\u0119 na trzech typach analiz:<\/p>\n\n\n\n<p>1. Analiza byt\u00f3w: rozpoznawanie byt\u00f3w nazwanych, w tym m.in. nazw os\u00f3b (autorzy, t\u0142umacze, badacze literatury i postacie literackie), utwor\u00f3w, miejsc (miejsca rzeczywiste i fikcyjne) i organizacji (grupy literackie, czasopisma literackie i instytucje kultury), analiza cz\u0119sto\u015bci ich wyst\u0119powania w korpusie z uwzgl\u0119dnieniem zmian w czasie, analiza relacji mi\u0119dzy bytami w wybranych ca\u0142ostkach tekstowych i mi\u0119dzy tekstami lub podkorpusami wyr\u00f3\u017cnionymi na podstawie metadanych<\/p>\n\n\n\n<p>2. Analiza poj\u0119\u0107: rozpoznawanie termin\u00f3w literackich i analiza cz\u0119sto\u015bci ich wyst\u0119powania w korpusie, w poszczeg\u00f3lnych tekstach i w podkorpusach z uwzgl\u0119dnieniem zmian w czasie, analiza zmian znaczenia poj\u0119\u0107 w czasie i w obr\u0119bie r\u00f3\u017cnych podkorpus\u00f3w<\/p>\n\n\n\n<p>3. Analiza s\u0142owozbior\u00f3w (temat\u00f3w): cz\u0119\u015bciowo nadzorowane modelowanie tematyczne, LDA z uwzgl\u0119dnieniem byt\u00f3w i termin\u00f3w literackich<\/p>\n\n\n\n<p>W drugiej cz\u0119\u015bci prezentacji zajmiemy si\u0119 interpretacj\u0105 wynik\u00f3w. GoLEM pozwoli na \u015bledzenie i wizualizacj\u0119 sieci i przep\u0142yw\u00f3w idei, problem\u00f3w i poj\u0119\u0107 w czasie, pomi\u0119dzy \u015brodowiskami literackimi i badawczymi, pomi\u0119dzy dyscyplinami czy z teorii literatury do praktyki artystycznej. Tym samym umo\u017cliwi prowadzenie bada\u0144 interdyscyplinarnych m.in. w horyzoncie studi\u00f3w nad transferem kulturowym, semantyki historycznej, analityki kulturowej i socjologii wiedzy.<\/p>\n\n\n\n<p>W swoim wyst\u0105pieniu poka\u017cemy, w jaki spos\u00f3b okre\u015blone poj\u0119cia, byty i tematy \u201cw\u0119drowa\u0142y\u201d (Bal 2002) pomi\u0119dzy autorami. Analiz\u0105 obejmiemy KDL \u2013 korpus tekst\u00f3w historyczno-, teoretyczno- i krytycznoliterackich z lat 1822\u20132022, dobranych wed\u0142ug \u015bcis\u0142ych kryteri\u00f3w metodologicznych, uwzgl\u0119dniaj\u0105cych reprezentatywno\u015b\u0107 i zr\u00f3wnowa\u017cenie, jak dot\u0105d cechuj\u0105ce przede wszystkim korpusy j\u0119zykowe.&nbsp;<\/p>\n\n\n\n<p>S\u0142owa klucze<\/p>\n\n\n\n<p>przetwarzanie j\u0119zyka naturalnego, dyskurs literaturoznawczy, Named Entity Recognition, modelowanie tematyczne, semantyka dystrybucyjna<\/p>\n\n\n\n<p>Bibliografia<\/p>\n\n\n\n<p>Bal, M. 2002. Travelling Concepts in the Humanities. A Rough Guide. Toronto.<\/p>\n\n\n\n<p>Gonen, H., Jawahar, G., Seddah, D., Goldberg, Y. 2020. Simple, Interpretable and Stable Method for Detecting Words with Usage Change across Corpora. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, Association for Computational Linguistics, 538\u201355.<\/p>\n\n\n\n<p>Labatut, V., Bost, X. 2019. Extraction and Analysis of Fictional Character Networks. ACM Computing Surveys (CSUR) 52, 1\u201340.<\/p>\n\n\n\n<p>Mickel, A. 2016. Tracing Teams, Texts, and Topics: Applying Social Network Analysis to Understand Archaeological Knowledge Production at \u00c7atalh\u00f6y\u00fck. J Archaeol Method Theory 23, 1095\u20131126.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Agnieszka Karli\u0144ska, Maciej Maryl Instytut Bada\u0144 Literackich Polskiej Akademii Nauk Celem wyst\u0105pienia jest przedyskutowanie wynik\u00f3w analizy Korpusu Dyskursu Literaturoznawczego (KDL)&hellip;<\/p>\n","protected":false},"author":6,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/pages\/1454"}],"collection":[{"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1454"}],"version-history":[{"count":1,"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/pages\/1454\/revisions"}],"predecessor-version":[{"id":1455,"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=\/wp\/v2\/pages\/1454\/revisions\/1455"}],"wp:attachment":[{"href":"https:\/\/ptj-warszawa2022.uksw.edu.pl\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1454"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}