Журнал «Continuum. Математика. Информатика. Образование»
Выпуск №1 (17) (2020)
УДК 004.89
ИНСТРУМЕНТАРИЙ И ОСОБЕННОСТИ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ В СИСТЕМАХ КРЕДИТНОГО СКОРИНГА
В работе проведено исследование эффективности применения алгоритмов машинного обучения для решения задачи выявления недобросовестных клиентов финансовой организации. На реальных данных о клиентах показаны особенности реализации алгоритмов градиентного бустинга и нейронных сетей и вычислены параметры их эффективности. Показана практическая возможность применения данных алгоритмов в системах кредитного скоринга.
Ключевые слова
кредитный скоринг; машинное обучение; градиентный бустинг; нейронные сети; credit scoring; machine learning; gradient boosting; neural networks
TOOLS AND PECULIARITIES OF SOLVING THE CLASSIFICATION PROBLEM IN CREDIT SCORING SYSTEMS
The paper examines the efficiency of applying machine learning algorithms to the problem of identifying the probability of default for a client of a financial organization. The authors use the real client data to demonstrate the peculiarities of implementing gradient boosting and neural networks algorithms and calculate their efficiency parameters. The paper also shows the practical possibility of using these algorithms in credit scoring systems.
Список литературы
-
Гришин А.А., Строев С.П. Исследование эффективности алгоритмов классификации, использующих деревья решений, для экономического прогнозирования на основе апостериорных данных // Вестник технологического университета. 2018. Т. 21. № 9. С. 180-187.
-
Гришин А.А., Строев С.П. Разработка модели поведенческого скоринга с использованием методов градиентного бустинга // Научно-технический вестник Поволжья. 2018. № 9. С. 93-98.
-
Bialas P. A multi-instance deep neural network classifier: application to Higgs boson CP measurement [Электронный ресурс] // arXiv: 1803.00838v2. URL: https://arxiv.org/pdf/1803.00838.pdf.
-
Bühlmann P., Hothorn Т. Boosting algorithms: Regularization, prediction and model fitting // Statistical Science. 2007. Т. 22. № 4. Pp. 477-505.
-
Brownlee J. XGBoost With Python: Gradient Boosted Tree With XGBoost and scikit-learn. Machine Learning Mastery, 2017. 115 p.
-
Dorogush A.V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support // Workshop on ML Systems at NIPS 2017. December 8, 2017.
-
Hossin M., Sulaiman M.N. A Review on Evaluation Metrics for Data Classification Evaluations: IJDKP // International Journal of Data Mining & Knowledge Management Process. 2015. Т. 5. № 2. Pp. 1-11.
-
Lipton Z.C. Thresholding Classifiers to Maximize F1 Score [Электронный ресурс] // arXiv: 1402.1892v2. URL: https://arxiv.org/pdf/1402.1892.pdf.