Короткий опис(реферат):
Проаналізовано основні методи, що лежать в основі відкритого програмного забезпечення з виявлення дублікатів електронних документів, зазначено їх недоліки: відсутність компоненти семантичного та змістовного аналізу текстів. Запропоновано систему автоматизованого формування логіко-лінгвістичних моделей як допоміжний механізм вилучення змісту з речень природної мови, на основі якого можна вирішити проблему екстракції знань з текстової інформації.
Суть розробки, основні результати:
Вавіленкова А.І. Програмне забезпечення для виявлення текстових документів, ідентичних за змістом / А.І. Вавіленкова // Вісник Чернігівського державного технологічного університету: Серія: Технічні науки - Чернігів: ЧНТУ, 2013. – №2 (65). – C. 125-132.