TWOJA PRZEGLĄDARKA JEST NIEAKTUALNA.
Wykryliśmy, że używasz nieaktualnej przeglądarki, przez co nasz serwis może dla Ciebie działać niepoprawnie. Zalecamy aktualizację lub przejście na inną przeglądarkę.
Data: 12.12.2022 Kategoria: aktualności ogólne, nagrody/odznaczenia/medale, nauka/badania/innowacje, Wydział Informatyki i Telekomunikacji
Projekt „Słowosieć” realizowany na PWr w ramach konsorcjum naukowego CLARIN-PL został nagrodzony w konkursie Komitetu Językoznawstwa PAN na wybitne osiągnięcia naukowe w dziedzinie językoznawstwa.
„Słowosieć” (ang. wersja nazwy plWordNet) to relacyjny słownik semantyczny, który odzwierciedla system leksykalny języka polskiego. Obecnie zawiera blisko 200 tys. rzeczowników, czasowników, przymiotników i przysłówków, 295 tys. znaczeń oraz ponad 700 tys. relacji. Już teraz jest największym wordnetem na świecie i nieustannie się rozrasta.
Pojedyncze znaczenia w słowniku połączone są wzajemnymi relacjami i na tej podstawie powstaje sieć, w której każdy wyraz jest zdefiniowany poprzez odniesienie do innych wyrazów. Na przykład: samochód jest rodzajem pojazdu drogowego i dwuśladu, stanowi całość, na którą składają się np. silnik, spryskiwacz, podwozie, zaś jego wyrazami bliskoznacznymi są fura i bryka.
Wyjątkową cechą słownika jest jego powiązanie z analogiczną siecią dla języka angielskiego z Princeton University o nazwie WordNet. Synonimiczne zbiory polskich jednostek leksykalnych zostały powiązane przy pomocy ponad 300 tys. wystąpień relacji międzyjęzykowych kilkunastu typów z ich odpowiednikami w języku angielskim tworząc unikatowy, relacyjny słownik dwujęzyczny.
„Słowosieć” powstaje od 2005 roku w ramach wielu projektów, a ostatnio głównie w ramach konsorcjum naukowego CLARIN-PL, w którym tworzone są elektroniczne zasoby językowe i narzędzia do pracy z dużymi zbiorami tekstów w języku polskim. Polski węzeł infrastruktury – Centrum Technologii Językowych CLARIN-PL działa przy Politechnice Wrocławskiej.
– To najwyższe wyróżnienie jakie nasz zespół mógł otrzymać, ponieważ zostało przyznane przez grono wybitnych polskich językoznawców, w tym wielu znakomitych leksykografów – mówi dr hab. inż. Maciej Piasecki, prof. uczelni, koordynator konsorcjum naukowego CLARIN-PL. – Po wielu latach nasza praca nad wielkim, relacyjnym słownikiem semantycznym języka polskiego została uznana za dzieło leksykograficzne. Dla naszego interdyscyplinarnego zespołu to ogromne wyróżnienie, o jakim nawet nie marzyliśmy – dodaje.
„Słowosieć” jest także bardzo ważnym zasobem w komputerowym przetwarzaniu języka i badaniach nad sztuczną inteligencją, ponieważ znajduje m.in. zastosowanie w automatycznych tłumaczeniach Google Translate.
– Rozwój naszej „Słowosieci” nigdy się nie skończy, bo język jest naturalnym, żywym systemem i śledzenie jego rozwoju to nieustannym wyzwanie, także w relacji do języka angielskiego. To także setki zastosowań w zakresie sztucznej inteligencji, humanistyki cyfrowej i cyfrowych metodach badawczych w naukach społecznych – podkreśla prof. Maciej Piasecki.
Prace nad słownikiem realizowane są dzięki grantom Ministerstwa Edukacji i Nauki i funduszom unijnym.
mic
Nasze strony internetowe i oparte na nich usługi używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Ochrona danych osobowych »