Информационные технологии интеллектуальной поддержки принятия решений, Информационные технологии интеллектуальной поддержки принятия решений 2019

Размер шрифта: 
Сравнение эффективности методов автоматической классификации текстов
Дарья Александровна Кондрашова, Р. В. Насыров

Изменена: 2019-05-27

Аннотация


Автоматическая классификация текста, т.е. определение принадлежности входного текста к некоторой категории, является весьма актуальной и интересной задачей в связи с высокой скоростью развития информационных технологий и постоянно растущего объема используемой информации. Классификация текста применяется в решении многих практических задач: технической поддержки, анализе медицинских текстов, документообороте, поиске документов, навигации в больших информационных ресурсах, фильтрации спама, подборе контекстной рекламы, составлении интернет-каталогов и др. Цель данной статьи - исследовать эффективность работы различных алгоритмов машинного обучения применительно к задаче классификации текста. В данной статье будет производиться сравнение таких методов как, метод опорных векторов(SWM), метод K-ближайших соседей, нейронные сети прямого распространения, рекуррентные нейронные сети(RNN), свёрточные нейронные сети(CNN)


Ключевые слова


нейронные сети; анализ текстов; многослойный персептрон; долгая краткосрочная память; сверточные нейронные сети; рекуррентные нейронные сети; нейронные сети прямого распространения; метод опорных векторов; метод k-ближайших соседей; MLP; LSTM; RNN; CNN;

Литература


1.            https://ru.wikipedia.org/wiki/Обработка_естественного_языка

2.            https://neurohive.io/ru/osnovy-data-science/5-metodov-v-nlp-kotorye-izmenjat-obshhenie-v-budushhem/

3.            https://ru.wikipedia.org/wiki/ /Машинное_обучение

4.            http://www.aiportal.ru/articles/neural-networks/multi-perceptron.html

5.            https://ru.wikipedia.org/wiki/ Долгая_краткосрочная_память

6.            https://ru.wikipedia.org/wiki/ Свёрточная_нейронная_сеть

7.            https://ru.wikipedia.org/wiki/ Метод_опорных_векторов

8.            https://ru.wikipedia.org/wiki/Метод_k-ближайших_соседей

9.            https://keras.io/

10.          https://www.python.org/

11.          https://deeplearning4j.org/

12.          https://www.tensorflow.org/

13.          http://www.deeplearning.net/software/theano/

14.          https://scikit-learn.org/stable/index.html

15.          http://www.cyberforum.ru


Полный текст: PDF