TOPOSŁAW jako narzędzie znakowania jednostek wieloczłonowych

Monika Czerepowicka Uniwersytet Warmińsko-Mazurski w Olsztynie

TOPOSŁAW JAKO NARZĘDZIE ZNAKOWANIA JEDNOSTEK WIELOCZŁONOWYCH Celem artykułu jest próba przedstawienia polskiemu czytelnikowi narzędzia elektronicznego (programu komputerowego) do opisu jednostek wieloczłonowych o nazwie Toposław. Jako jednostki wieloczłonowe traktuje się połączenia składające się przynajmniej z dwu form wyrazowych, których znaczenie nie wynika wprost z sumy znaczeń składników. Za Kosek przyjmujemy, że główne kryterium wyodrębnienia tego typu jednostek stanowi pojęcie klasy zamkniętej, do której należy przynajmniej jeden ze składników połączenia (Kosek 2008: 48). Jednostki tego typu nazywane są także frazeologizmami, idiomami, frazemami. Zaliczymy do nich również wielosegmentowe nazwy własne, terminy i wyrażenia specjalistyczne. Jednostki języka polskiego zakodowane w Toposławie w pierwszej kolejności zaczerpnięte zostały z pracy Iwony Kosek (Kosek 2008)1. Multiflex a Toposław Multiflex jest formalnym systemem opisu języków naturalnych powstałym na gruncie francuskim, z powodzeniem używanym od niemal 20 lat. Zastosowano go już do opisu wyrażeń frazeologicznych języka francuskiego, portugalskiego, angielskiego, niemieckiego. Pomyślne próby przeprowadzono także dla jednego z języków słowiańskich, a mianowicie – serbskiego (por. Savary 2009:1). Można przypuszczać, że powodzenie tego przedsięwzięcia

1

Toposław jest programem aktualnie wykorzystywanym na potrzeby projektu badawczego pt. „Adapta-

cyjny system wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych”, prowadzonego przez Instytut Podstaw Informatyki Polskiej Akademii Nauk oraz Politechnikę Wrocławską. Projekt ten wpisuje się w rozwój narzędzi elektronicznych w Polsce, jest odpowiedzią na konkurs ogłoszony w ramach Programu Operacyjnego „Innowacyjna gospodarka 2007–2013”. W dużej mierze jest finansowany przez Unię Europejską (więcej na stronie internetowej projektu: http://www.ipipan.waw.pl/nekst/). W ramach grantu planuje się stworzenie opisu elektronicznego 20 tys. jednostek należących do języka specjalistycznego ekonomii oraz 5 tys. wyrażeń języka ogólnego. Autorka niniejszego tekstu pracuje nad drugim z wymienionych zadań. 1

Turn static files into dynamic content formats.

Create a flipbook