Информационные технологии интеллектуальной поддержки принятия решений, Информационные технологии интеллектуальной поддержки принятия решений 2018

Размер шрифта: 
Обработка больших данных в системах мониторинга банковских транзакций
А. М. Вульфин, Д. В. Курамшин, А. В. Чуйков, М. Ю. Сапожникова, М. М. Гаянова

Изменена: 2018-06-22

Аннотация


Для повышения эффективности обнаружения мошеннических банковских транзакций предлагается структура системы анализа данных пользовательской среды с целью выявления мошеннических действий. Система сбора и анализа информации о пользовательской среде позволяет накапливать данные, размечать прецеденты в ручном и автоматическом режимах и создавать базу данных примеров для обучения классификаторов. Для применения инструментов интеллектуального анализа данных необходимо реализовать интерфейс сбора данных, хранения и доступа к информации. Для работы со значительным объемом накопленных данных требуется использование специальных инструментов (фреймворков и аппаратных платформ) для обработки больших данных. В статье представлен анализ существующих программных и аппаратных средств для распределенной обработки слабо структурированных данных банковских транзакций (фреймворки: Hadoop, Apache Spark). Разработаны структура и рекомендации по развертыванию программно-аппаратного стенда для тестирования алгоритмов обнаружения финансового мошенничества на основе методов интеллектуального анализа данных в составе распределенной системы обработки банковских.

Ключевые слова


обработка больших данных; обработка данных; банковские транзакции

Литература


1.            Teoh C.S., Mahmood A.K. National cyber security strategies for digital economy // International Conference on Research and Innovation in Information Systems, ICRIIS. 2017. P. 1–6.

2.                            Crabtree A. Enabling the new economic actor: Personal data regulation and the digital economy // Proceedings - 2016 IEEE International Conference on Cloud Engineering Workshops, IC2EW 2016. 2016. P. 124–129.

3.            H. H. Tung, C. C. Cheng, Y. Y. Chen, Y. F. Chen S.H.H. and A.P.C. Binary Classification and Data Analysis for Modeling Calendar Anomalies in Financial Markets // 2016 7th International Conference on Cloud Computing and Big Data (CCBD). Macau, 2016. P. 116–121.

4.                            Trelewicz J.Q. Big Data and Big Money: The Role of Data in the Financial Sector // IT Prof. 2017. Vol. 19, № 3. P. 8–10.

5.                            Luvizan S.S., Nascimento P.T., Yu A. Big Data for innovation: The case of credit evaluation using mobile data analyzed by innovation ecosystem lens // PICMET 2016 - Portland International Conference on Management of Engineering and Technology: Technology Management For Social Innovation, Proceedings. 2017. P. 925–936.

6.            M.U. Sapozhnikova, M.M. Gayanova, A.V. Nikonov A.M.V. Data mining algorithms of bank transaction as a part of antifraud system // Information technologies for intelligent decision making support. Ufa, 2017.

7.                            Lopez-Rojas E.A., Axelsson S. A review of computer simulation for fraud detection research in financial datasets // FTC 2016 - Proceedings of Future Technologies Conference. 2017. P. 932–935.

8.            Big ideas are coming from using big data - Raconteur [Электронный ресурс]. 2014. URL: https://www.raconteur.net/technology/big-ideas-are-coming-from-using-big-data (дата обращения: 20.11.2017).

9.            Steve Rosenbush. Visa Says Big Data Identifies Billions of Dollars in Fraud - CIO Journal [Электронный ресурс]. 2014. URL: https://blogs.wsj.com/cio/2013/03/11/visa-says-big-data-identifies-billions-of-dollars-in-fraud/ (дата обращения: 20.11.2017).

10.                         I.Piskunov. Anti-fraud systems and how it works [Электронный ресурс] 2017. URL: https://www.securitylab.ru/blog/personal/Informacionnaya_bezopasnost_v_detalyah/339929.php (дата обращения: 20.11.2017).

11.          M.U. Sapozhnikova, M.M. Gayanova, A.V. Nikonov A.M.V. Data mining technologies in the problem of designing the bank transaction monitoring system // Computer Science and Information Technologies. Baden-Baden, 2017.

12.                         M.U. Sapozhnikova, M.M. Gayanova, A.V. Nikonov, A.M. Vulfin D.V.K. Anti-fraud system on the basis of data mining technologies // International Symposium on Signal Processing and Information Technology. Bilbao, 2017.

13.          Abbad M., Abed J.M., Abbad M. The Development of E-Banking in Developing Countries in the Middle East. // J. Financ. Account. Manag. 2012. Vol. 3, № 2. P. 107–123.

14.                         Jarrett J.E. Internet Banking Development // J. Entrep. Organ. Manag. 2016. Vol. 5. P. 2–5.

15.          Global Mass Payments, AP Software, B2B Payments Tipalti [Электронный ресурс]. URL: https://tipalti.com/ (дата обращения: 20.11.2017).

16.          M. Fedotenko. Как защищают банки: разбираем устройство и принципы банковского антифрода - «Хакер» [Электронный ресурс]. 2017. URL: https://xakep.ru/2017/04/21/antifrod-1/ (дата обращения: 20.11.2017).

17.                         Cao Y., Li S., Wijmans E. ( Cross- ) Browser Fingerprinting via OS and Hardware Level Features // Proc. Netw. Distrib. Syst. Secur. Symp. 2017. № March.

18.          Big Data [Электронный ресурс]. URL: https://en.wikipedia.org/wiki/Big_data (accessed: 20.11.2017).

19.                         Apache Hadoop [Электронный ресурс]. URL: http://hadoop.apache.org/ (accessed: 30.03.2018).

20.          Apache Spark [Электронный ресурс]. URL: https://spark.apache.org/ (дата обращения: 30.03.2018).

21.          ClickHouse [Электронный ресурс]. URL: https://clickhouse.yandex/ (дата обращения: 30.03.2018).

22.          Elasticsearch [Электронный ресурс]. URL: https://www.elastic.co/products/elasticsearch (дата обращения: 30.03.2018).

23.          Splunk [Электронный ресурс]. URL: https://www.splunk.com/ (дата обращения: 30.03.2018).

24.          Apache Cassandra [Электронный ресурс]. URL: http://cassandra.apache.org/ (дата обращения: 30.03.2018).

25.          Spark-sklearn [Электронный ресурс]. URL: https://github.com/databricks/spark-sklearn (дата обращения: 30.03.2018).

26.          Sparkling Water [Электронный ресурс]. URL: https://www.h2o.ai/sparkling-water/ (дата обращения: 30.03.2018).

27.          TensorFlowOnSpark [Электронный ресурс]. URL:https://github.com/yahoo/TensorFlowOnSpark (дата обращения: 30.03.2018).

28.          Apache Zookeeper [Электронный ресурс]. URL: https://zookeeper.apache.org/ (дата обращения: 30.03.2018).

29.          Apache Hive [Электронный ресурс]. URL: https://hive.apache.org/ (дата обращения: 30.03.2018).

30.          Apache Sqoop [Электронный ресурс]. URL: http://sqoop.apache.org/ (дата обращения: 30.03.2018).

31.          Apache Flume [Электронный ресурс]. URL: https://flume.apache.org/ (дата обращения: 30.03.2018).

32.          Apache Oozie [Электронный ресурс]. URL: http://oozie.apache.org/ (дата обращения: 30.03.2018).

33.          Cloudera Hue [Электронный ресурс]. URL: https://github.com/cloudera/hue (дата обращения: 30.03.2018).

34.          Sentry [Электронный ресурс]. URL: https://sentry.io/welcome/ (дата обращения: 30.03.2018).

35.          GitLab [Электронный ресурс]. URL: https://about.gitlab.com/ (дата обращения: 30.03.2018).


Полный текст: PDF