Българският език – заплашен от дигитална смърт 25.09 | 19:23

За 21 европейски езици има реален риск, заради липсата на достатъчно езикови технологии

От Диана Цветкова

Много от европейските езици, включително и българският, са заплашени от "дигитална смърт" и шансовете им да оцелеят в съвременната епоха на технологии не са големи.

За това предупреждава ново изследване, проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които и Институтът за български език "Проф. Любомир Андрейчин". Изводите им са на база анализ и оценка на наличните езикови технологии в четири различни категории – автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

Българският език е поставен сред езиците с висок риск от отмиране в съвременната епоха на дигитални технологии.

Езиковите технологии за 21 от 30 европейски езици, които учените са изследвали, са категоризирани като "недоразвити" или като "слабо развити".

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории. Състоянието на наличните езикови ресурси и технологии не е оценено като "отлично" за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като "средно развити".

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като "фрагментарно развити", което означава, че те са сред езиците с висок риск от отмиране в дигиталната епоха, се посочва в изследването.

За момента българският не е застрашен (получил е средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси), но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, се посочва в изследването, публикувано в сайта на БАН.

"Резултатите от проведения от нас анализ са силно обезпокоителни. По-голямата част от европейските езици не разполагат с достатъчно количество адекватни ресурси, които да гарантират оцеляването им в епохата на развити технологии", казва проф. Ханс Уцкорайт, координатор на инициативата META-NET.

"Пропастта между т. нар. "големи" и "малки" езици продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт", отбелязва един от редакторите – Георг Рем.

Под "езикови технологии" най-общо се разбира софтуер, който може да обработва говорима и писмена човешка реч, като програми за правописна и граматична корекция, системи за автоматичен превод, уеб търсачки, синтезатори на реч в GPS-ите и др. В това отношение езиците, говорени от по-малко хора като българския, са в незавидно положение.

От META-NET посочват, че повечето научно-изследователски инициативи в областта поставят твърде голям акцент върху английския език и му отделят много време, средства и ресурси. Повечето познати системи са изградени около или са насочени към английски и поддържат превод от и на малко други езици, например български език.

За разработването на езикови технологии за езиците извън английския не са били поемани нито политически, нито финансови ангажименти и липсва ясна изследователска и технологична визия за развитие, посочват авторите на изследването. "Европа трябва да предприеме необходимите действия, за да подготви езиците, които се говорят на територията ѝ, за живот в дигиталната епоха, тъй като тези езици са ценна част от европейското културно наследство и заслужават да са с нас и занапред", призовават учените.

Водещи

Най-четени