Информационные технологии интеллектуальной поддержки принятия решений, Информационные технологии интеллектуальной поддержки принятия решений 2018

Размер шрифта: 
Проблемы поиска противоправной информации в сети «Интернет»
Семен В. Волошин

Изменена: 2019-11-02

Аннотация


В настоящее время одной из актуальных задач информационного поиска является выявление в сети "Интернет" противоправной информации. По данным Роскомнадзора, за третий квартал 2017 года количество обращений от граждан увеличилось в 3.5 раза, по сравнению с аналогичным периодом прошлого года. В докладе приведены некоторые особенности поиска противоправной информации и описан ряд проблем, возникающих при ручном поиске информации. Предложены пути решения перечисленных проблем. Приведено описание модели сбора и выдачи информации для оптимизации выявления противоправной информации экспертами.

Ключевые слова


поиск информации в сети; поиск противоправной информации в сети; безопасность в интернет

Литература


1.            Смирнов А. А. Роль и место средств массовой информации в механизме детерминации противоправного поведения //Библиотека криминалиста. Научный журнал. – 2012. – №. 1. – С. 288-299.

2.            Кублин И. М., Тинякова В. И. Инструменты управления лояльностью пользователей в социальном медиа-маркетинге, их разновидности и функции //Поволжский торгово-экономический журнал. – 2013. – №. 5. – С. 56-62.

3.            Волошин С. В. и др. Анализ качества бинарной классификации веб-страниц методом опорных векторов //Известия Алтайского государственного университета. – 2017. – №. 4 (96).

4.            Карташев Е. А., Царегородцев А. Л. Автоматизированная информационная система поиска и анализа информации в сети Интернет //Фундаментальные исследования. – 2016. – Т. 2. – №. 10.

5.            Kotelnikov E., Razova E., Fishcheva I. A Close Look at Russian Morphological Parsers: Which One Is the Best? //Conference on Artificial Intelligence and Natural Language. – Springer, Cham, 2017. – С. 131-142.

6.            Сулейманов Р. С. Извлечение метаданных из полнотекстовых электронных русскоязычных изданий при помощи Томита-парсера //Программные продукты и системы. – 2016. – №. 4 (116).

7.            Anh L. T., Arkhipov M. Y., Burtsev M. S. Application of a Hybrid Bi-LSTM-CRF model to the task of Russian Named Entity Recognition //arXiv preprint arXiv:1709.09686. – 2017.

8.            Dernoncourt F., Lee J. Y., Szolovits P. NeuroNER: an easy-to-use program for named-entity recognition based on neural networks //arXiv preprint arXiv:1705.05487. – 2017.

9.            Soloshenko A. N. et al. Establishing Semantic Similarity of the Cluster Documents and Extracting Key Entities in the Problem of the Semantic Analysis of News Texts //Modern Applied Science. – 2015. – Т. 9. – №. 5. – С. 246.

10.          Зеленков И. В., Сегалович И. В. Сравнительный анализ методов определения нечетких дубликатов для Web-документов //Труды 9ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». – RCDL’2007, Переславль-Залесский, Россия, 2007. – С. 166-174.

11.          Joachims T. Text categorization with support vector machines: Learning with many relevant features //European conference on machine learning. – Springer, Berlin, Heidelberg, 1998. – С. 137-142.

12.          Кафтанников И. Л., Парасич А. В. Особенности применения деревьев решений в задачах классификации //Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. – 2015. – Т. 15. – №. 3.

13.          Tang J. et al. Understanding the limiting factors of topic modeling via posterior contraction analysis //International Conference on Machine Learning. – 2014. – С. 190-198.

14.          Potapenko A., Popov A., Vorontsov K. Interpretable probabilistic embeddings: bridging the gap between topic models and neural networks //Conference on Artificial Intelligence and Natural Language. – Springer, Cham, 2017. – С. 167-180.

15.          Shi B., Bai X., Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition //IEEE transactions on pattern analysis and machine intelligence. – 2017. – Т. 39. – №. 11. – С. 2298-2304.

16.          Wolpert D. H. Stacked generalization //Neural networks. – 1992. – Т. 5. – №. 2. – С. 241-259.

17.          Pasternack J., Roth D. Extracting article text from the web with maximum subsequence segmentation //Proceedings of the 18th international conference on World wide web. – ACM, 2009. – С. 971-980.

18.          Hong K., Nenkova A. Improving the estimation of word importance for news multi-document summarization //Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics. – 2014. – С. 712-721.


Полный текст: PDF