Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://ir.stu.cn.ua/123456789/15832
Повний запис метаданих
Поле DCЗначенняМова
dc.contributor.authorФоменко, В. А.-
dc.contributor.authorЛуцький, Г. М.-
dc.contributor.authorРегіда, П. Г.-
dc.contributor.authorВолокита, А. М.-
dc.date.accessioned2015-09-22T12:38:53Z-
dc.date.accessioned2018-02-25T12:59:25Z-
dc.date.available2015-09-22T12:38:53Z-
dc.date.available2018-02-25T12:59:25Z-
dc.date.issued2017-
dc.identifier.urihttp://ir.stu.cn.ua/123456789/15832-
dc.descriptionFomenko, Volodymyr Thematic texts generation issues based on recurrent neural networks and word2vec / Volodymyr Fomenko, Heorhii Loutskii, Pavlo Rehida, Artem Volokyta // Технічні науки та технології. – 2017. – № 4 (10). – C. 110-115.en_US
dc.description.abstractUrgency of the research. The problem of natural language generation is becoming more actual in recent days due to the growing demand for automated generation of object descriptions, article excerpts, news summaries, passages in microblogging services, response messages used by chat bots, etc. Thus, the problem is to generate a text given the context. This paper deals with the problem of generating text specifically in Russian since each language group requires an individual approach. Target setting. There is no method to generate thematic texts automatically, especially in Russian language, that gives well-interpreted and suitable results. Actual scientific researches and issues analysis. In the past few years, more articles have been devoted to the topic of generating thematic texts, due to the emergence of new methods for sequences generation using recurrent neural networks. However, approaches related specifically to thematic texts generations, in Russian are insufficiently explored. Uninvestigated parts of general matters defining. This article focuses on a study and analysis of the proposed approach for generating Russian-language thematic texts. It is specialized in one language group and specific approach in terms of model selection. The research objective. Create model trained on a group of short passages that identifies a context of a text and as output generates a well-interpreted natural text in Russian. The statement of basic materials. The analysis of the joint use of the RNN and word2vec models is conducted. Approaches for the transformation of the input text, analysis of sentences structure, prediction of subsequent parts of speech, prediction of following words and the general model structures are proposed. The results of the models are appeared to be well interpreted and meaningful. Conclusions. The iinterpretability, structure and parameters of the models that showed the best results for the generation were analyzed. The approach proved to be good for generating thematic texts. The results and analysis of the subsequent steps are given.en_US
dc.language.isoenen_US
dc.publisherЧернігів: ЧНТУen_US
dc.relation.ispartofseriesТехнічні науки та технології; № 4 (10)-
dc.subjectгенерація текстуen_US
dc.subjectрекурентні нейронні мережіen_US
dc.subjectдовга короткочасна пам’ятьen_US
dc.subjectword2vecen_US
dc.subjecttext generationen_US
dc.subjectrecurrent neural networksen_US
dc.subjectlong short-term memoryen_US
dc.subjectword2vecen_US
dc.subjectгенерация текстаen_US
dc.subjectрекуррентные нейронные сетиen_US
dc.subjectдолгая краткосрочная памятьen_US
dc.subjectword2vecen_US
dc.titleThematic texts generation issues based on recurrent neural networks and word2vecen_US
dc.title.alternativeПитання генерації тематичних текстів на основі рекурентних нейронних мереж та word2vecen_US
dc.title.alternativeВопросы генерации тематических текстов на основе рекуррентных нейронных сетей и word2vecen_US
dc.typeArticleen_US
dc.description.abstractalt1Актуальність теми дослідження. Проблема генерації текстів стає більш актуальною в останні дні у зв’язку зі зростаючим попитом на автоматичне створення описів об’єктів, уривків статей, підсумків новин, повідомлень у службах мікроблогів, відповідей чат-ботів тощо. Таким чином, проблемою є створення текстів, що відповідають заданій тематиці. Ця робота присвячена проблемі генерації текстів саме російською мовою, оскільки кожна мовна група вимагає індивідуального підходу. Постановка проблеми. Відсутність добре інтерпретованого методу для автоматичного створення російськомовних тематичних текстів за допомогою рекурентних нейронних мереж. Аналіз останніх досліджень і публікацій. Протягом останніх років з’являється все більше статей, присвячених генерації тематичних текстів, зокрема, завдяки появі нових методів генерації послідовностей з використанням рекурентних нейронних мереж. Проте підходи специфічні для генерації тематичних текстів, особливо російською мовою, все ще недостатньо вивчені. Виділення не вирішених раніше частин загальної проблеми. Стаття присвячена вивченню та аналізу запропонованого підходу для генерації тематичних текстів, зокрема написаних російською мовою. Дослідження сфокусовано на вивченні застосування рекурентних нейронних мереж та word2vec. Постановка завдання. Завданням є створити модель, натреновану на групі уривків російськомовних статей, що навчиться визначати контекст тексту, і як результат видавати добре інтерпретований текст за тією ж самою тематикою. Виклад основного матеріалу. Проведено аналіз спільного використання моделей RNN та word2vec. Описано підходи для обробки вхідного тексту, аналізу структури речень, прогнозування наступних частин мови, прогнозування наступних слів та структури відповідних моделей. Результати виявились добре інтерпретованими та змістовними. Висновки. Проаналізовано зміст, структуру та параметри моделей, які показали найкращі результати для генерації текстів. Підхід показав себе добре для створення тематичних текстів. Наведені результати експериментів та аналіз наступних кроків.en_US
dc.description.abstractalt2В статье рассматривается вопрос генерации псевдослучайных текстов на заданную тематику. Для генерации текстов используются рекуррентные нейронные сети (LSTM) с предварительной обработкой слов с помощью модели word2vec. Тема текста задается с помощью набора ключевых слов. Модели тренируются на наборе русскоязычных статей.en_US
Розташовується у зібраннях:№4 (10)

Файли цього матеріалу:
Файл Опис РозмірФормат 
351.pdfстаття899,97 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.