Использование машинной лингвистики для анализа торгово-экономических новостей

Using Machine Linguistics to Analyze Trade and Economic News

Страницы: 55-67

Pages: 55-67

Авторы:

Олейников И.Н.

Место работы, должность: Всероссийская академия внешней торговли, Центр анализа данных – программист
oleynikov-in@ranepa.ru;

Спартак А.Н.

Член-корр. РАН, доктор экономических наук, профессор, заслуженный деятель науки России
Место работы, должность: Всероссийская академия внешней торговли, кафедра международной торговли и внешней торговли РФ, заведующий
Spartak@vniki.msk.ru

Шатилов А.А.

Место работы, должность: Всероссийская академия внешней торговли, Центр анализа данных – аналитик
shatilov-aa@ranepa.ru;

Яронский Ф.М.

Место работы, должность: Всероссийская академия внешней торговли, Центр анализа данных – аналитик
yaronskiy-fm@ranepa.ru

Authors:

Oleynikov I.N.

Place of work, post: Russian Foreign Trade Academy, Data Analysis Center, Developer
oleynikov-in@ranepa.ru;

Spartak A.N.

Corresponding member of the Russian Academy of Sciences, Doctor of Economic Sciences, Honored Worker of Science of RF
Place of work, post: Russian Foreign Trade Academy, Department of international trade and foreign trade of the RF, the Head
Spartak@vniki.msk.ru

Shatilov A.A.

Place of work, post: Russian Foreign Trade Academy, Data Analysis Center, Analyst,
shatilov-aa@ranepa.ru;

Yronskiy F.M.

Place of work, post: Russian Foreign Trade Academy, Data Analysis Center, Analyst
yaronskiy-fm@ranepa.ru

Аннотация к статье:

Мониторинг международных торгово-экономических новостей, выбор актуальных среди них и быстрый анализ текущей экономической ситуации в мире является необходимым процессом в работе экономических подразделений. Но ручной сбор необходимых статей среди огромного количества интернет-источников, визуальная проверка и классификация текстов по категориям представляется практически невозможной. Цель данной работы показать этапы сбора, подготовки новостных текстов к обработке, разметки и дальнейшей классификации торгово-экономических новостей с помощью моделей машинной лингвистики, описать, какие программные средства и подходы к моделированию были использованы в работе, продемонстрировать полученные результаты и практическое применение построенной системы.

Abstract:

Monitoring international trade and economic news, selecting the relevant ones and quickly analyzing the current state of the world economy is an important activity of economic departments. However, it is practically impossible to manually collect the necessary articles from a huge number of online sources, to visually check and then categorize them. Th e purpose of this paper is to show the stages of collection, preparation of news texts for processing, markup and further classifi cation of trade and economic news using machine linguistics models, to describe which soft ware tools and modeling approaches were used in the paper, and to demonstrate the results practical application of the built system.

Ключевые слова:

обработка естественного языка, информационная система обработки текстов, торгово-экономические новости, модель, парсинг, разметка, сбор данных, обучение модели, база данных

Keywords:

natural language processing, text analysis information system, trade and economic news, model, parsing, markup, data collection, model training, database






Номер:

2 - 2024


Выбрать другой:





Партнеры


Адрес: 119285, Россия, г. Москва, ул. Воробьевское шоссе, 6А
Тел.: +7(499) 143-12-35; Факс: +7 (499) 783-02-63
Яндекс.Метрика