@ARTICLE{26543120_326626661_2019, author = {К. Л. Поляков and Л. В. Жукова}, keywords = {, микрофинансовые организации, дефолт, дерево классификации, логистическая регрессияслучайный лес}, title = {Опыт моделирования вероятности кредитного дефолта клиентов микрофинансовых организаций (на примере одной МФО)}, journal = {Экономический журнал ВШЭ}, year = {2019}, volume = {23}, number = {4}, pages = {497-523}, url = {https://ej.hse.ru/2019-23-4/326626661.html}, publisher = {}, abstract = {Микрофинансовые организации получили большое распространение в кризисные годы, выдавая микрокредиты (до 100000 рублей) под большие проценты практически без документов. Сегодня ЦБ РФ активно регулирует этот рынок, все больше и больше ужесточая требования, ограничивая ставки и пени на выданные кредиты. Это вызывает необходимость формирования новой стратегии оценки риска невозврата выданного кредита или займа, построенной на предотвращении просрочек со стороны клиентов. Для этого, во-первых, необходимо получать более информативные данные о клиентах, не осложняя взаимоотношения с ними. Во-вторых, необходимо иметь хорошее представление о возможностях тех или иных методов классификации при решении различных задач оценки потенциальных клиентов. Авторы данного исследования анализируют важность для качества классификации клиентов тех показателей, что уже традиционно собираются МФО, а также некоторых новых показателей, основанных на данных из социальных сетей. В данном случае важность показателей интерпретируется в контексте конкретных алгоритмов (методов) классификации.Для моделирования кредитного дефолта (просрочки более 30 дней) авторы используют несколько алгоритмов построения деревьев классификации - алгоритмы CART и С 4.5, логистическую регрессию и алгоритм Ran dom Forest (случайный лес). Моделирование осуществляется на основе выборки из анкет клиентов реальной МФО. Получены неоднозначные результаты. В зависимости от постановки задачи классификации клиентов преимуществом обладают различные алгоритмы дескриптивной аналитики ( CART, C4.5, Logit). В то же время, как и следовало ожидать, наилучшее качество прогнозов дает неинтерпретируемый прогностический алгоритм Random Forest. По результатам анализа было выявлено, что для классификации клиентов МФО во всех рассмотренных методах большой важностью обладает кредитная история заемщика, а также его возраст. Гендерный фактор не оказал влияния на результаты классификации. Также во всех случаях оказались неважны ми для классификации данные из социальных сетей.}, annote = {Микрофинансовые организации получили большое распространение в кризисные годы, выдавая микрокредиты (до 100000 рублей) под большие проценты практически без документов. Сегодня ЦБ РФ активно регулирует этот рынок, все больше и больше ужесточая требования, ограничивая ставки и пени на выданные кредиты. Это вызывает необходимость формирования новой стратегии оценки риска невозврата выданного кредита или займа, построенной на предотвращении просрочек со стороны клиентов. Для этого, во-первых, необходимо получать более информативные данные о клиентах, не осложняя взаимоотношения с ними. Во-вторых, необходимо иметь хорошее представление о возможностях тех или иных методов классификации при решении различных задач оценки потенциальных клиентов. Авторы данного исследования анализируют важность для качества классификации клиентов тех показателей, что уже традиционно собираются МФО, а также некоторых новых показателей, основанных на данных из социальных сетей. В данном случае важность показателей интерпретируется в контексте конкретных алгоритмов (методов) классификации.Для моделирования кредитного дефолта (просрочки более 30 дней) авторы используют несколько алгоритмов построения деревьев классификации - алгоритмы CART и С 4.5, логистическую регрессию и алгоритм Ran dom Forest (случайный лес). Моделирование осуществляется на основе выборки из анкет клиентов реальной МФО. Получены неоднозначные результаты. В зависимости от постановки задачи классификации клиентов преимуществом обладают различные алгоритмы дескриптивной аналитики ( CART, C4.5, Logit). В то же время, как и следовало ожидать, наилучшее качество прогнозов дает неинтерпретируемый прогностический алгоритм Random Forest. По результатам анализа было выявлено, что для классификации клиентов МФО во всех рассмотренных методах большой важностью обладает кредитная история заемщика, а также его возраст. Гендерный фактор не оказал влияния на результаты классификации. Также во всех случаях оказались неважны ми для классификации данные из социальных сетей.} }