Problemy opisu związków frazeologicznych w formalizmie „Multiflex” ...

Page 1

Iwona Kosek, Monika Czerepowicka Uniwersytet Warmińsko-Mazurski w Olsztynie

Problemy opisu związków frazeologicznych w formalizmie „Multiflex” (na przykładzie rodzaju wyrażeń frazeologicznych) Wstęp W Polsce od ok. 20 lat żywo rozwija się lingwistyka informatyczna, stawiająca sobie za cel stworzenie formalnego opisu polszczyzny, przynoszącego w konsekwencji różnego typu narzędzia do automatycznego przetwarzania języka naturalnego. Zgodnie z diagnozą postawioną w 2006 r. przez Marka Świdzińskiego, który w znacznej mierze był inspiratorem tego typu badań, „problem automatycznej analizy morfologicznej jest dziś dla polszczyzny rozwiązany” (Świdziński 2006: 31). Badacze języka polskiego dysponują już kilkoma analizatorami morfologicznymi: Pomorem Roberta Wołosza, SAMem Krzysztofa Szafrana, Morfeuszem Marcina Wolińskiego, AMORem Joanny Rabiegi-Wiśniewskiej i Michała Rodolfa. Uwaga lingwistów koncentruje się dziś głównie na analizie składniowej, która dzięki zaawansowanym metodom dehomonimizacji oraz dospecyfikowaniu reguł gramatyki formalnej również posuwa naprzód rygorystyczny opis współczesnej polszczyzny. Poloniści dysponują korpusem narodowym. Przygotowuje się słowniki elektroniczne (programy komputerowe) już nie leksemów, ale połączeń wyrazowych, np. Słownik nazw topograficznych Warszawy, Słownik jednostek wielosegmentowych. Niniejszy artykuł opiera się na doświadczeniach związanych z drugim z wymienionych opracowań. Ponieważ program, o którym mowa (Toposław), korzysta z formalizmu Multiflex, na wstępie kilka objaśnień.

1. Od Multifleksa do Toposława Multiflex (więcej w: Savary 2009) jest formalnym systemem opisu języków naturalnych powstałym na gruncie francuskim, z powodzeniem używanym od około ośmiu lat. Formalizm ten jest częścią obszernego wielofunkcyjnego systemu Unitex, służącego do przetwarzania wielojęzycznych korpusów tekstów. Poza Multifleksem Unitex dysponuje także edytorem grafów (zdających sprawę z relacji morfologicznych między składnikami opisywanych wyrażeń), modułem morfologicznym do odmiany pojedynczych słów, modułem do analizy morfologicznej tekstów, wyszukiwarką wzorców morfoskładniowych w korpusie

1


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.
Problemy opisu związków frazeologicznych w formalizmie „Multiflex” ... by Monika Czerepowicka - Issuu