Изменена: 2019-05-27
Аннотация
Автоматическая классификация текста, т.е. определение принадлежности входного текста к некоторой категории, является весьма актуальной и интересной задачей в связи с высокой скоростью развития информационных технологий и постоянно растущего объема используемой информации. Классификация текста применяется в решении многих практических задач: технической поддержки, анализе медицинских текстов, документообороте, поиске документов, навигации в больших информационных ресурсах, фильтрации спама, подборе контекстной рекламы, составлении интернет-каталогов и др. Цель данной статьи - исследовать эффективность работы различных алгоритмов машинного обучения применительно к задаче классификации текста. В данной статье будет производиться сравнение таких методов как, метод опорных векторов(SWM), метод K-ближайших соседей, нейронные сети прямого распространения, рекуррентные нейронные сети(RNN), свёрточные нейронные сети(CNN)
Ключевые слова
Литература
1. https://ru.wikipedia.org/wiki/Обработка_естественного_языка
2. https://neurohive.io/ru/osnovy-data-science/5-metodov-v-nlp-kotorye-izmenjat-obshhenie-v-budushhem/
3. https://ru.wikipedia.org/wiki/ /Машинное_обучение
4. http://www.aiportal.ru/articles/neural-networks/multi-perceptron.html
5. https://ru.wikipedia.org/wiki/ Долгая_краткосрочная_память
6. https://ru.wikipedia.org/wiki/ Свёрточная_нейронная_сеть
7. https://ru.wikipedia.org/wiki/ Метод_опорных_векторов
8. https://ru.wikipedia.org/wiki/Метод_k-ближайших_соседей
9. https://keras.io/
10. https://www.python.org/
11. https://deeplearning4j.org/
12. https://www.tensorflow.org/
13. http://www.deeplearning.net/software/theano/
14. https://scikit-learn.org/stable/index.html
15. http://www.cyberforum.ru