В тази публикация, нашият главен учен доц. д-р Александър Ефремов говори за приложението на изкуствени невронни мрежи в някои методологии за моделиране на кредитен риск. Входните данни в невронните мрежи могат да бъдат наличните характеристики на оценяваните хора като възраст, доход, семейно положение, данни от кредитно бюро и т.н. Изходните данни са вероятността кандидатите за кредит да го изплатят успешно, да предприемат определени действия и т.н.
Изкуствените невронни мрежи имат много приложения. Сред тях е оптимизация на кредитния риск и на маркетингови стратегии. Основната причина този математически подход да не получава достатъчно внимание е фактът, че невронните мрежи не могат да бъдат верифицирани с наличната информация от изследваната система. Такава верификация е необходима, доколкото нивото на несигурност в реалните данни е изключително високо (маркетинг и финанси), което може да доведе до алогични корелации между входните фактори и изходните данни. Пример за верификация на модела би могъл да бъде предварителна информация, че (при кредитния риск) факторът годишен доход е с положителна корелация към изходен резултат „вероятност за добър“, а влязла в сила присъда е негативно свързан с този резултат. Когато работим с линейни или логистични модели, традиционно използвани за оценка на кредитен риск е лесно да се оцени дали моделът запазва тези тенденции. Това, което трябва да се направи е да се провери положителният или отрицателен знак между входните и изходните данни (положителен за годишен доход и отрицателен за ефективна присъда). Когато се работи с невронни мрежи, подобно заключение, базирано на техните параметри не може да бъде направено. Причината е, че по принцип параметрите (теглата) в невронните мрежи нямат физическо измерение.
В някои страни, като САЩ, отхвърления кандидат за кредит би могъл да поиска от финансовата институция информация за 5-те причини, заради които получава отказ. Тази информация идва директно от линейния/логистичния модел, но ако се използват невронни мрежи – подобна информация не може да бъде извлечена.
Въпреки това, невронните мрежи са мощен инструмент, който може да бъде използван на различни етапи при разработката на математическия модел. Едно от основните преимущества на мрежите е, че те са удачни при силно нелинейни системи. Такъв е случая при оценката на кредитния риск и при оптимизацията на маркетингови стратегии, където изследваната система е отделен човек. Изкуствените невронни мрежи могат да бъдат използвани и за почистване на данни, създаване на модели за търсене, „бързи и мръсни“ модели, както и подкрепа на финалното моделиране.
Приложение при оценка на кредитен риск
Често използван подход при идентифициране на системата е разработката на „бърз и мръсен“ модел в етапа на предварителна подготовка на данните и тяхното изчистване. Идеята тук е да се използва модел, който да определи вероятността от липсващи данни или да попълни статистически коректни стойности, след като изчисти крайностите. На този етап от цялостния цикъл за идентификация на системата, анализаторът на данни не би искал да инвестира много време в изграждането на завършени модели, откъдето идва и името им – „бързи и мръсни“. Обичайно, няма стриктни изисквания представянето на тези модели да бъде логично или изходните данни да се вписват в предварителната информация.
Добре известно е, че поведението на хората е силно нелинейно, особено по отношение на някои фактори. По тази причина, невронните мрежи са особено подходящи за почистване и нормализиране на данните. Ако линеен или логистичен модел се използва и променливите са продължителни, някои нелинейни входящо-изходящи преобразувания трябва да бъдат приложени и след това, анализът трябва да бъде създаден така, че да избере най-подходящите преобразувания, които ще подобрят точността на модела. От друга страна, невронните мрежи не изискват такива действия, което спестява време. Имайки предвид и факта, че невронните мрежи могат да се справят с неизвестни нелинейности, се очаква те да предложат по-точни прогнози.
Другото приложение на невронните мрежи е, когато се сегментира популация. Има подпопулационни анализи, базирани на „бързи и мръсни“ модели. Тук целта е да се намери отговор на въпроса, доколко различни са сегментите преди да се изграждат моделите за съответните подпопулации. Основните два вида скоркарти в оценката на кредитния риск са свързани с кандидатстването за кредит (апликационна скоркарта) и как хората ще обслужват отпуснатия заем (поведенческа скоркарта). Първия модел обяснява само статичната част на индивидуалното поведение, доколкото данните не съдържат информация за динамиката. Те се използват за прогнозиране на рисковите нива при отделните кандидати за кредит. От друга страна, поведенческите модели представят динамиката при одобрени кандидати. Така става ясно, че „бързите и мръсни“ модели, базирани на невронни мрежи са подходящи при апликационните скоркарти, докато рекурентните невронни мрежи са по-добри за поведенческите скоркарти.
Невронните мрежи имат важни преимущества, сравнени с линейните и логистични модели, използвани в маркетинговата и финансовата индустрии. Основното им преимущество е способността да представят нелинейно поведение и както е добре известно, поведението на хората е силно нелинейно.
Невронните мрежи могат да бъдат използвани за моделиране на много и напълно различни аспекти от изследваната система, но процеса на тяхното обучение остава същия. Например, не е нужно прилагането на нелинейни преобразувания на входните и изходните данни в подготвителния етап. Това е изключително важно, доколкото идентификацията на системата се прилага без или с ограничена човешка намеса.
В наши дни има изобилие от данни за отделните потребители. От тази гледна точка, гореспоменатия потенциал на невронните мрежи, комбиниран с възможността за автоматизирано разработване на математически модели е предпоставка за успешното им използване в решаването на проблеми с големи данни.