TWOJA PRZEGLĄDARKA JEST NIEAKTUALNA.
Wykryliśmy, że używasz nieaktualnej przeglądarki, przez co nasz serwis może dla Ciebie działać niepoprawnie. Zalecamy aktualizację lub przejście na inną przeglądarkę.
Data: 16.03.2021 Kategoria: aktualności ogólne, nauka/badania/innowacje, projekty międzyuczelniane, współpraca z przemysłem
Zbudowanie platformy do przetwarzania języka naturalnego i eksploracji wielkich danych językowych, to główny cel projektu CLARIN-PL-Biz realizowanego m.in. na Politechnice Wrocławskiej. Będą z niej mogli korzystać naukowcy i przedsiębiorcy.
Projekt ma być rozszerzeniem skupionej infrastruktury badawczej CLARIN-PL (Common Language Resources & Technology Infrastructure), instytucji powstałej w wyniku współpracy jednostek naukowych budujących elektroniczne zasoby językowe i narzędzia do pracy z dużymi zbiorami tekstów w języku polskim.
Początkowo odbiorcami CLARIN-PL byli głównie naukowcy z dziedzin humanistycznych i społecznych, jednak z czasem wzbudził on też zainteresowanie przedstawicieli różnych obszarów nauki, instytucji publicznych, organizacji oraz sektora komercyjnego. Dlatego właśnie powstała idea rozszerzenia wersji CLARIN-PL i włączenia się w ogólny trend rozwoju sztucznej inteligencji.
CLARIN-PL-Biz będzie realizowany przez konsorcjum składające się z pięciu jednostek naukowych oraz 22 partnerów biznesowych. Liderem projektu jest Politechnika Wrocławska.
Na świecie zaledwie ok. dziesięć języków ma więcej niż 100 milionów użytkowników. Język polski, będąc na ok. 30 miejscu tej klasyfikacji, pozostaje poza głównym nurtem badań międzynarodowych.
– W dobie wspólnego rynku cyfrowego widoczność Polski można zwiększyć za pomocą tworzenia odpowiednich cyfrowych narzędzi - platformy gromadzącej dane, udostępniającej odpowiednią moc obliczeniową oraz algorytmy wyspecjalizowane dla języka polskiego i innych języków słowiańskich powiązanych za pośrednictwem angielskiego z zasobami światowymi – mówi prof. Maciej Piasecki z Wydziału Informatyki i Zarządzania PWr, krajowy koordynator projektu.
Nowa platforma badawczo-rozwojowa połączona będzie z centrum technologicznym zapewniającym bazę sprzętową. Projekt zrealizują wyspecjalizowane zespoły złożone z programistów i lingwistów, specjalistów w zakresie przetwarzania języka naturalnego. Do konsorcjum projektowego dołączyły 22 firmy wraz ze swoim zapleczem badawczym. Osiem kolejnych firm polskich i zagranicznych wsparło projekt wkładem w postaci baz danych i oprogramowania.
Infrastruktura zapewni dostęp do uniwersalnych komponentów technologii językowej oraz mechanizmy łączenia tych komponentów na potrzeby konstruowania zarówno ogólnych jak i wyspecjalizowanych systemów analizy tekstu. W ramach infrastruktury powstanie też architektura informatyczna przeznaczona do konstrukcji skutecznych i wydajnych systemów eksploracji wielkich danych językowych (tekstów i mowy) oraz danych multimodalnych.
– Uprzywilejowana pozycja języka angielskiego sprawia, że bardzo wiele badań wykonuje się przede wszystkim dla tekstów w tym języku, tymczasem to rozwój narzędzi dla języka polskiego i innych języków naturalnych wpływa w dużej mierze na wzrost konkurencyjności rodzimych przedsiębiorstw – dodaje prof. Maciej Piasecki.
Dostarczone przez CLARIN-PL-Biz narzędzia i usługi mają umożliwić łatwy i wszechstronny dostęp do archiwum zasobów i technologii językowych oraz aplikacji dla użytkownika końcowego, kompleksowe wydobywanie informacji i wiedzy z danych tekstowych, rozwój gospodarki opartej na danych i wiedzy w Polsce, a dzięki temu wzrost konkurencyjności polskich przedsiębiorstw i nauki.
Projekt będzie realizowany do 2023 r. w ramach Programu Operacyjnego Inteligentny Rozwój, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury. Budżet projektu wynosi ponad 136 mln zł.
Więcej o projekcie na stronie.
Nasze strony internetowe i oparte na nich usługi używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Ochrona danych osobowych »