Європейські програмісти розробили універсальний розпізнавач абревіатур

Європейські програмісти запропонували алгоритм, який дозволяє розпізнавати абревіатури та їх розшифровку в текстах на 22 мовах.

Алгоритм показав ефективність близько 90 відсотків при аналізі масиву з 400 статей на семи мовах : англійській, угорській, іспанській, німецькій, румунській, французькій та чеській. Для визначення точності пошуку розшифровок, абревіатури з усіх статей були попередньо визначені вручну. Про це повідомляє Lenta.Ru.

Програмісти розробили методику, який базується на принципі, що в стандартних новинних або наукових текстах абревіатура зазвичай укладена в дужки і розташована відразу після розшифровки терміна або назви. Наприклад: Організація об'єднаних націй (ООН).

Потенційною сферою застосування своєї розробки вчені назвали програми для автоматичного аналізу новинних і наукових статей на основі статистики використання тих чи інших абревіатур. Для цього вони планують створити каталог абревіатур з розшифровками на різних мовах.