Темпы изменения казахстанской и мировой экономики вызывают необходимость регулярно усовершенствовать принципы и механизмы функционирования ее основных участников — государств, компаний, инфраструктурных организаций. Становится очевидной прямая зависимость эффективности работы каждого участника друг от друга, необходимость тесной интеграции управляющих систем и справедливых «правил игры». В этой связи растет актуальность разработки практических и научных решений в области менеджмента и финансов не только для бизнеса, но и для таких новых экономических образований, как государственно-частных партнерств, крупных полугосударственных корпораций и т.д. Целью настоящей статьи является постановка актуальных проблем финансового бизнеса, их систематизация и рассмотрение одного из вариантов их решения.
Система скоринга — это автоматизированный процесс оценки банком потенциального заемщика, позволяющий минимизировать временные затраты. Первые скоринговые системы появились на Западе, причем пришли из ботаники: в 1941 г. Дэвид Дюран [2] применил идею Фишера [1] о классификации растений на «плохие» и «хорошие» к типологизации кредитов. Скоринг опробовали во время Второй мировой войны, он весьма пригодился в связи с нехваткой аналитиков, но широкое использование возможностей скоринга на Западе началось только с распространением кредитных карточек.
В зависимости от типа используемых входных данных о потенциальном заёмщике выделяют следующие типы скоринга:
- Кредитный скоринг (скоринг по данным заявки, application scoring) — принятие решения о выдаче кредита новым клиентам по данным, указанным в заявке.
- Поведенческий скоринг (behavior scoring) — динамическая оценка состояния кредитоспособности существующего заёмщика, основанная на данных об истории транзакций по его счетам. По результатам оценки может определяться текущий лимит кредита для заёмщика; меры, принимаемые в случае задержки платежей; маркетинговые ходы, которые могут быть направлены на клиента.
Система скоринга может использоваться не только на стадии продажи кредитного продукта, но и при его проектировании, поскольку с её помощью можно определить, проанализировать кредитоспособность группы потенциальных заемщиков, под которую проектируется продукт и, выделив основные качества заемщиков, снижающие риск, направить основные маркетинговые усилия именно на таких заемщиков.
В настоящее время для кредитного скоринга используются методы статистики, исследования операций и искусственного интеллекта. Указанные методы могут применяться как по отдельности, так и в различных комбинациях. Обилие совершенно разных методов для решения одной и той же задачи объясняется чисто прагматическим подходом: использовать то, что работает, а не пытаться объяснить причину дефолтов или зависимость от макроэкономических показателей.
Для построения модели берётся выборка данных по существующим заёмщикам, обычно не менее нескольких тысяч записей. По каждому заёмщику необходимы анкетные данные и кредитная история за определённый период, как правило, от одного года до двух лет. Относительно каждой кредитной истории решается, является ли она «хорошей» или «плохой».
На качество модели сильно влияет выбор периода, за который рассматривается кредитная история. Считается, что вероятность дефолта как функция времени от прихода в кредитную организацию вначале сильно колеблется, и только после года начинает стабилизироваться, поэтому использование малого периода приведёт к недооцениванию вероятности дефолта. Напротив, использование периода более двух лет нежелательно в силу того, что за это время могут произойти определённые социально-экономические изменения, так что вновь приходящие клиенты будут слишком сильно отличаться по своим характеристикам от тех, на которых была построена модель.
Проблему кредитного скоринга можно рассматривать как задачу классификации: зная ответы на вопросы анкеты , определить, к какой группе относится заёмщик: для «хороших» клиентов и для плохих. При этом необходимо понимать, что абсолютно точная классификация принципиально невозможна хотя бы потому, что один и тот же набор ответов может быть дан как «хорошим», так и «плохим». Однако хотелось бы построить модель, которая производила бы правильную классификацию в максимально большем числе случаев.
В поведенческом скоринге можно выделить следующие основные модели: 1) методы, аналогичные кредитному скорингу; 2) статистические модели; 3) структурные модели.
Предполагаемый подход выделения основных состояний заёмщиков заключается в идентификации параметров смесей распределений, в частности, пуассоновских смесей [3, 4].
Предположим, что количество пропущенных платежей для каждого клиента является пуассоновским процессом с интенсивностью λi. Значение λi можно было бы использовать в качестве одной из составляющих, описывающих состояние клиента, если бы только можно было оценить её с достаточной достоверностью. Оценкой максимального правдоподобия является
Однако такая оценка имеет слишком низкую статистическую значимость. Например, если клиент не пропустил ни одного платежа за 12 месяцев, это ещё не означает, что у него λi=0. Если взять больший промежуток времени, то оценка становится более точной, но при этом нельзя забывать, что, во-первых, λi меняется со временем (это состояние заёмщика), а во-вторых, если конечной целью является построение марковской цепи и вычисление переходных вероятностей, то использовать большие промежутки времени для оценки λi не представляется возможным.
Пусть имеется портфель из N заёмщиков, тогда общим распределением числа неплатежей за единичный период времени является
Сделаем упрощающее предположение: заёмщиков можно разделить на n групп численностью n1,..., Nn, так что каждая группа имеет одинаковую интенсивность неплатежей λi. Тогда
где — доля группы i в общей численности клиентов.
Зафиксируем теперь достаточно большой период времени и вычислим эмпирическое распределение числа неплатежей за этот период. После этого вычислим оценку максимального правдоподобия, т.е. найдём число , частоты интенсивности неплатежей и смешивающее распределение . Тогда в качестве состояния заёмщика можно использовать номер i, отражающий его текущую интенсивность неплатежей.
Пусть по клиенту имеется информация о количестве неплатежей k за период времени T. Тогда по формуле Байеса получаем следующее апостериорное распределение состояния:
Когда доступны данные за очень короткий период, вероятности P(C = i | x(T) = k) близки к априорным вероятностям
Наоборот, при наличии данных за большой период времени ожидаемая интенсивность дефолтов приближается к одному из значений .
Для определения состояния конкретного заёмщика можно выбрать либо состояние с максимальной апостериорной вероятностью, либо взять в качестве ожидаемой интенсивности дефолта
Отметим, что если все , то λ > 0, даже если k = 0, то есть клиент исправно исполняет все платежи. Это позволяет учесть возможность неплатежа у клиента, который до сих пор не пропустил ни одного платежа. С другой стороны, λ → 0 при T → ∞, то есть с течением времени клиент, не пропускающий платежи, считается всё более и более надёжным.
Опишем теперь, как можно построить марковскую цепь, используя полученные результаты. Пусть , , — параметры модели, оцененные по данным на достаточно длинном промежутке времени. Зафиксируем теперь два последовательных промежутка времени, скажем, длиной в год (примем это за единичный отрезок времени). По каждому клиенту вычислим количество платежей, пропущенных в первом и втором периоде ( и соответственно). Определим состояния цепи как числа 1,..., и вычислим оценки переходных вероятностей
Очевидно, что тот же самый подход можно применить, если состояния в цепи имеют более сложный вид, включая в себя не только интенсивность неплатежей, но и другую информацию: состояние счёта, сумму непогашенного долга и т.п.
В заключение в качестве примера сочетания ряда приведённых методов в цельной системе скоринга можно предложить следующую составную модель.
-
По историческим данным о неплатежах клиентов определяются параметры , , пуассоновской смеси, описывающей интенсивность неплатежей.
-
Определяются переходные вероятности переключения с интенсивности неплатежей на λj.
-
Для каждого из существующих клиентов определяется распределение вероятностей по состояниям 1,…,, соответствующим различным интенсивностям неплатежей. Эти данные используются для построения байесовской сети классификации для кредитного скоринга новых клиентов.
-
Для каждого нового клиента с помощью построенной байесовской сети вычисляется распределение по состояниям . Для уточнения распределения может использоваться дополнительная информация, например, система априорного скоринга. Вычисленное распределение позволяет спрогнозировать вероятность дефолта и график погашения долга, поэтому может быть использовано для принятия решения о выдаче кредита или отказе.
-
По мере поступления информации о количестве неплатежей клиента по формуле Байеса уточняется его распределение по состояниям . При этом в качестве априорных вероятностей используются вероятности, выданные системой кредитного скоринга.
-
Используя матрицу переходных вероятностей, на уровне портфеля прогнозируют ожидаемые потери от дефолтов.