Финтех без контролера не включать
МВФ разъяснил опасности машинного обучения для скоринга
Использование технологий машинного обучения для составления кредитных рейтингов может сократить сроки выдачи кредитов и повысить финансовую инклюзию в развивающихся странах, констатирует доклад Международного валютного фонда, излагающий особенности новых финансовых технологий для неспециалистов. Однако условием безопасности их применения в МВФ называют сохранение контроля за финансовыми решениями со стороны человека — иначе необъяснимые с точки зрения человеческой логики решения банковских программ могут привести к массовым отказам в финансировании вполне кредитоспособных заемщиков.
Одной из проблем развивающихся рынков и стран с низким доходом является дороговизна кредита и кредитных рейтингов, она способствует финансовой дискриминации, особенно некрупных заемщиков — малых и средних предприятий и домохозяйств. Автоматизация принятия кредитных решений на основе анализа больших данных способна существенно повысить эффективность процесса, отмечает рабочий доклад МВФ — пришествие финтеха в банковскую сферу способно ускорить выдачу кредитов и снизить их стоимость, увеличив охват. Работа МВФ ориентирована на экономистов и рекомендует им заняться изучением финтеха, в первую очередь — технологий машинного обучения (ML), при этом доклад подробно объясняет базовые принципы технологии для неспециалистов.
Традиционная методология оценки кредитоспособности заемщика основывается на пяти параметрах — способности к заимствованию, структуре капитала, обеспечении, характере займа и его условиях. Машинное обучение способно улучшить качество оценки сразу нескольких из них и скоринга в целом. При этом ML-модели способны выделять паттерны данных, которые не могут идентифицировать стандартные эконометрические модели. Но при использовании сложных алгоритмов такие паттерны не могут быть легко проверены аналитиками и, хотя и обеспечивают более эффективное использование данных, могут сгенерировать ошибочные результаты на базе недостаточно релевантной информации. Например, при быстрых структурных экономических изменениях, не успевающих полностью отразиться в наборе данных, слепое использование ML-моделей может привести к перевесу устаревшей информации и неверным оценкам кредитного риска заемщиков.
Как традиционная эконометрика, так и ML-технологии основываются на оценке моделей, объясняющих связи между показателями и выходными параметрами, которые должны облегчить процесс принятия решений. Однако классическая эконометрика стремится отыскать формальные связи между ними, а приоритетом ML-моделей является составление наиболее точного прогноза в рамках имеющейся выборки без попытки объяснения структуры причинно-следственных связей.
Главными преимуществами использования ML-моделей для скоринга в МВФ называют повышение для банков экономической целесообразности работы с малыми заемщиками. Кроме того, приход в финансовый сектор крупнейших технологических компаний с большим объемом пользовательских данных позволит им использовать для скоринга данные о бизнес-активности пользователей, накопленные в качестве побочного продукта от предоставления услуг электронной коммерции, платежей или телекоммуникаций,— и тем самым дополнительно повысить финансовую инклюзию. Кроме того, ML-модели способны структурировать неструктурированную информацию, что позволяет включить в процесс оценки более широкий поток данных, а также гораздо эффективнее людей оценивать нелинейные связи между драйверами рисков и выходными рисками — что решает проблему информационной асимметрии, когда банки завышают требования к заемщикам, опасаясь недостоверных данных с их стороны.
Однако аналитики МВФ предупреждают — удешевление процесса выдачи кредитов имеет и обратную сторону. Недостатком ML является возможность выдачи недостоверных оценок при «загрязнении» изначальных данных — что может повлечь за собой «машинную» дискриминацию вполне кредитоспособных заемщиков. Кроме того, ML-модели неспособны быстро учитывать структурные изменения (что особенно важно для динамично развивающихся экономик), а пользователи могут манипулировать данными — например, «накручивая» показатели активности в соцсетях. Использование же таких данных может угрожать правам самих потребителей — в случае дискриминации последних на основе необъяснимого в человеческой логике компьютерного решения. Таким образом, за машинным решением необходим точечный контроль со стороны аналитиков, подчеркивают в МВФ.