Tonos ML y DS de la gestión del riesgo crediticio





Hola.



Somos el equipo de Advanced Analytics GlowByte y estamos lanzando una serie de artículos sobre modelado en la gestión del riesgo crediticio. El propósito del ciclo es hablar brevemente sobre el campo, ampliar el vocabulario de términos profesionales y proporcionar enlaces a artículos y libros útiles. En el artículo introductorio, mostraremos las características de la aplicación de ML y DS en el campo del riesgo crediticio, sin profundizar en el área temática.



A continuación, revelaremos los aspectos de la metodología de modelado, trabajando con los componentes del riesgo de crédito, así como los enfoques de calibración y validación, que tienen en cuenta las especificidades del funcionamiento de los modelos en un banco.



La base de las publicaciones es nuestra experiencia en proyectos de desarrollo e implementación de modelos analíticos en el sector bancario.



Y ahora debajo del gato.



¿Cuáles son los riesgos?



En términos simples, el riesgo crediticio es el riesgo de que los clientes violen las condiciones de pago de los fondos en virtud de acuerdos de préstamo.



Nos centraremos en tres retos que surgen en el marco de la gestión del riesgo de crédito.



  1. Modelado de calificaciones;
  2. Oferta de crédito;
  3. Cálculo del nivel de pérdidas esperadas.


¿Por qué exactamente en ellos?



  • Estas tareas siempre son relevantes para las instituciones financieras;
  • Pueden transferirse a otras industrias (telecomunicaciones, industria, seguros);
  • Tienen suficiente espacio para los métodos ML y DS.


Para la clasificación general de riesgos de las instituciones financieras y el contexto, consulte la revisión [1] .



Canalización (canalización) o esquema del proceso crediticio de todos



Esquemáticamente, el proceso de crédito se ve así:





La parte de este proceso desde la solicitud hasta la emisión se denomina transmisor de crédito. Hay simplificaciones en este esquema. Por ejemplo, consideramos el proceso dentro del marco de un producto crediticio, es decir los problemas de marketing (optimización de marketing, canibalización de productos, abandono de clientes, etc.) quedan fuera de los paréntesis. Los procesos de preselección, ajuste de calificación de expertos y aplicación de factores de detención por parte de los suscriptores están excluidos del pipeline. Los factores de parada significan restricciones, cuya naturaleza está, en primer lugar, en la estructura del producto que el banco ofrece al cliente. Un ejemplo es la entrada de un cliente en la lista de quebrados o la presencia de préstamos morosos en otros bancos.



Modelado de calificaciones 



La tarea del modelo de calificación (RM) es construir un modelo de calificación de clientes para la clasificación posterior. La calificación se lleva a cabo en relación con varios eventos negativos: deterioro de la calidad crediticia, quiebra, etc.



Dependiendo del contexto, esta tarea se puede clasificar de diferentes formas:



Por etapa del ciclo de vida del cliente:



  1. La puntuación de aplicación (aplicativa) se utiliza para nuevos clientes o clientes con un historial pequeño (o de larga data e irrelevante) dentro de una empresa financiera. En la construcción de dicho modelo de calificación, el perfil y perfil del cliente, los datos sobre su comportamiento de pago en otras instituciones financieras (disponibles en el Bureau of Credit Histories) y los datos sobre el ingreso de diferentes listas, por ejemplo, listas negativas del Banco Central para personas jurídicas, son importantes. La puntuación de la solicitud se utiliza para decidir si se otorga un préstamo a un solicitante.
  2. . — -. , .


:



  1. «» : ( ) , .
  2. «» : . , , , .


:



  1. «» . . .
  2. «» . ( ) . — Z-score [2].


:



  1. . .
  2. .


:



  1. Stand-alone — , . — . , .
  2. «Supply chain finance» — . , , , ( ) . , — , [3].


:



  1. : , , . — , ( , ).
  2. , .. . , .. .


Las peculiaridades de resolver este problema en la primera aproximación se pueden encontrar en [1] , [4] , [5] , [6]. Planeamos hablar sobre las características del diseño en el próximo artículo del ciclo, dedicado a la metodología de desarrollo.



Entre las tareas relacionadas, vale la pena mencionar la tarea de la oferta de crédito (ver más abajo) y la tarea de seleccionar un umbral de corte basado en una puntuación de puntaje - determinar el umbral de aprobación. El último problema no se trata en este artículo, pero contiene espacio para enfoques de AA de vanguardia. Por ejemplo, hay intentos de utilizar RL [7]



También debemos mencionar brevemente las tendencias actuales para aumentar la calidad de los modelos de modelado de calificación desarrollados:



  1. / (, - [8], . [9], )
  2. ( XGBoost );
  3. ( ) (text-mining);
  4. ( pipeline ---) , .. ModelOps [10].


El modelado de calificaciones se encuentra cada vez menos como una tarea independiente y cada vez más en conjunto con otras, siendo parte de una aplicación aplicada para resolver problemas más generales. Uno de ellos es la oferta de crédito. Vamos a eso.



Oferta de crédito o cómo hacer una oferta que no puede rechazar





El resultado del modelo de calificación (el valor absoluto de la estimación de la probabilidad de incumplimiento - PD) se puede utilizar para resolver el problema de la oferta de crédito. Por oferta de crédito entendemos, en primer lugar, la tarea de establecer un límite inicial para un cliente.



Por supuesto, el valor de PD por sí solo, el pronóstico de la probabilidad de incumplimiento, no es suficiente para determinar el límite óptimo. Debe comprender el rango aceptable de valores límite que son razonables para ofrecer a los clientes. Esto es necesario para que la cantidad refleje al menos indirectamente las necesidades del cliente y su capacidad para pagar la deuda.



Un punto de referencia en este caso puede ser, por ejemplo, el volumen de negocios de los fondos propios del cliente para productos no crediticios. 



¿Qué más necesitas saber? Para comprender mejor el problema, debe tener una idea de la estructura del costo del préstamo. Se representa esquemáticamente en el siguiente diagrama (visto en [11] ):





"Recurso": el valor del dinero a expensas del cual se realizan los préstamos (por ejemplo, la tasa de los depósitos, que atrae el dinero de los depositantes y proporciona la oferta monetaria requerida). "Margen" es el beneficio esperado de un préstamo. "Riesgo": deducción en caso de incumplimiento del préstamo. "Gastos": los costos de atracción y mantenimiento.



En este marco, el modelo de calificación se puede utilizar para determinar el tamaño y la estructura del bloque de riesgo. El "recurso" está determinado en gran medida por la tasa clave del Banco Central. Los “costos” y el “margen” son componentes del producto, a menudo indicados en el pasaporte del producto.



En otras palabras, el "riesgo" es solo uno de los componentes que afecta la rentabilidad final de una operación.



¿Y los demás? Parece que surge un problema de optimización. Intentemos formalizarlo. Cabe destacar que puede haber muchas opciones, y vale la pena confiar, en primer lugar, en la tarea empresarial y el contexto del proceso de desarrollo.



Comencemos con una opción simple y luego mostremos los puntos de desarrollo potenciales de la solución. La forma más sencilla es optimizar la rentabilidad de una operación.



Deje que el contrato de préstamo se emita por la cantidad L (límite). Este contrato tiene una probabilidad prevista de PD por incumplimiento. Como primera aproximación, asumimos que el cliente en el momento del incumplimiento tiene una deuda igual a L.



Entonces el problema de optimización se verá así:





Vemos que PD es fijo y la dependencia de L es lineal. Parecería que no hay nada que optimizar.



Sin embargo, en la vida real, la PD depende de L por las siguientes razones: cuanto mayor es el límite, más difícil es el servicio de la deuda y, en consecuencia, mayor es la probabilidad de incumplimiento. En este caso, nuestra tarea realmente se convierte en una de optimización. Sin embargo, aquí también hay un matiz. Hay clientes con diferentes ingresos en la muestra, por lo que los valores absolutos no serán suficientes. Es mejor construir dependencias no en el límite, sino en el nivel de carga de la deuda, es decir, parámetro :L()





Adiccion se puede reconstruir sobre datos históricos o piloto.  Además, las paradas de producto pueden afectar la tarea de optimización. Por ejemplo, en el pasaporte del producto, se pueden indicar los límites aceptables del nivel de riesgo (probabilidad de incumplimiento). Luego, la optimización se realiza solo hasta el límite especificado.PD(L)







Para complicar aún más, quién está interesado, luego debajo del gato:
, (, ) (-, EAD — Exposure at default — ) . , , ( EAD, , LGD – Loss Given Default).





EAD . LGD , (, ..) ( LGD ). 0.9-1.



, PD L. :





, (, ), , :





«» — , «» — . Marketing Optimization.



— . , , , ..



. -.



¿Qué más buscar en Google? Palabras clave límite basado en riesgo, enfoque basado en ganancias de gestión de límite de crédito.



Entonces el dinero se ofrece y se entrega a los clientes. Pero algunos de ellos están empezando a retrasarse. ¿Cómo manejar la situación? Cogemos un soldador. Recopilamos el airbag en forma de reserva de dinero. Le diremos cómo hacer esto ahora mismo.



Reservas y el papel de DS para su cálculo





Determinar la magnitud del riesgo es clave en las actividades del banco: dependiendo del apetito por el riesgo, el banco determina con qué clientes está listo para trabajar. Pero en cualquier caso, para minimizar las posibles pérdidas, se forma una reserva de efectivo en forma de efectivo o valores líquidos. En el peor de los casos, el banco pierde toda la cartera, pero esto es poco probable, por lo que no es muy eficiente tener una reserva completa. Se necesita algo de equilibrio.



Para hacer esto, debe determinar con precisión la cantidad de dinero que debe reservarse. Así surge la tarea de asegurar la adecuación del capital (capital requerido) para las pérdidas esperadas. (Pérdida esperada - EL). Los requisitos de adecuación de capital son determinados y monitoreados por el regulador (Banco Central).



Referencia histórica:
, . . .



, DS ML .



1974 , . 



Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).





, the Basel I Capital Accord RWA, . 

,  %
  0
50
  100
, 100 (-, ):





.. 4.



. : XGBoost , , .



Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.



Basel III . . . [6]. 



? , , RWA:



1. – . — 590-.

( [12]):
« , 590-, . , , ( ) . .»
.



, 5 , . , (, ), ( ) .



2. (, 483-) PD, LGD EAD.

:





, , , . , , , , data scientist’.



(Expected Loss – EL) (Unexpected Loss – UL).



Las pérdidas en rublos son producto de tres componentes:



  1. probabilidad de incumplimiento (PD - Probabilidad de incumplimiento)
  2. el monto de la deuda del pagador en el momento del incumplimiento (EAD - Exposure At Default),
  3. parte de esta cantidad, que quedará impaga (LGD - Loss Given Default).


En general, esta fórmula: 





Nos encontraremos más de una vez en una serie de artículos: este es un estribillo del problema de la reserva en el riesgo de crédito.



Después de este tipo de descomposición de EL (ECL), es posible simular (DS y ML, ¡hola!)) Cada uno de los valores mencionados PD (modelo de clasificación binaria), LGD (modelo de regresión), EAD (modelo de regresión), donde, dentro de los límites especificados por el controlador requisitos en las diferentes etapas del modelado (desarrollo, calibración y validación), es posible utilizar métodos estadísticos y algoritmos de aprendizaje automático. 



Para los que aman más:
EL UL (Value at Risk – VaR) – , ( 99%) .





PD, LGD, EAD , .



3. 9. . 

9 :



  • ( );
  • ( «Lifetime-» «Lt») PD, LGD, EAD, ; ECL — Expected Credit Losses;
  • ( ).


9 :





9 DS ML-.



?



  • 29.12.2012 N 192- « »
  • 6 2015 . № 483- « »
  • 15 2015 . N 3624- « »
  • 6 2015 . № 3752- « , »
  • [13].


Las regulaciones e instrucciones estaban relacionadas, los libros se leyeron, pero ¿dónde está DS? Como se prometió, DS está en los detalles de los componentes. Pero esa es una historia completamente diferente. Analizaremos con más detalle las características del modelado de los componentes de PD, LGD y EAD en el siguiente artículo del ciclo, y al final del artículo introductorio presentamos una tabla con opciones para aplicaciones de métodos estadísticos y algoritmos de aprendizaje automático al campo del modelado de riesgos en el contexto de cada tarea.



Modelado de calificaciones
Oferta de crédito Cálculo del nivel de

pérdidas esperadas
Problemas

resueltos

con

DS / ML
- Determinación del

algoritmo de

calificación;

- Determinación del umbral de

aprobación;

- Calibración.

- Desarrollo de un

optimizador;

- Desarrollo de modelos

utilizados para

seleccionar una

propuesta de préstamo .

- Modelado

de componentes PD, LGD, EAD;

- Calibración.

conclusiones



La conclusión principal después de escribir un artículo introductorio para nosotros (abv_gbc, alisaalisa, Artysav, eienkotowaru) es el siguiente: es extremadamente difícil describir brevemente incluso tres problemas que surgen en el cálculo del riesgo de crédito. ¿Por qué?



Se ha desarrollado una metodología detallada para estas tareas, que proporciona un buen alimento para el pensamiento ML y DS. Estas reflexiones desarrollan enfoques para abordar desafíos de mercado cada vez más complejos. Los instrumentos basados ​​en estos enfoques, a partir de los complementarios, se convierten gradualmente en los principales en la toma de decisiones. Todo esto en conjunto permite transferir las mejores prácticas e intuiciones del modelado de riesgos a otras industrias (telecomunicaciones, seguros, industria). ¿Cuáles? Te lo contamos en los próximos artículos del ciclo.



Lista de términos usados



  • Incumplimiento : incumplimiento de las obligaciones derivadas del contrato de préstamo. Por lo general, el incumplimiento se considera falta de pago según el contrato dentro de los 90 días.

  • PD - probabilidad de incumplimiento - probabilidad de incumplimiento.

  • EAD – exposure at default – . , , = + .

  • LGD – loss given default – EAD, .

  • EL – expected loss – .

  • EL – expected credit loss – .

  • – , .

  • - – .

  • SCF – supply chain finance – — - .

  • RWA – risk-weighted assets – , ; .

  • (IRB) – , , , .

  • 9 (IFRS9) – , , , .

  • VaR – , .





[1] Leo Martin, Suneel Sharma y Koilakuntla Maddulety. "Aprendizaje automático en la gestión de riesgos bancarios: una revisión de la literatura". Riesgos 7.1 (2019): 29.

[2] en.wikipedia.org/wiki/Altman_Z-score

[3] www.youtube.com/watch?v=rfCamyEURyw&list=PLLQmSdmAWzkKeiOC1b-nxpoACqgfTc0G5&index=7.

[4] Breeden "Una encuesta sobre aprendizaje automático en riesgo crediticio". (2020).

[5] Sorokin Alexander. "Creación de tarjetas de puntuación mediante un modelo de regresión logística". Revista en línea de ciencia de la ciencia 2 (21) (2014).

[6] Baesens Bart, Daniel Roesch, Harald Scheule. Análisis de riesgo crediticio: técnicas de medición, aplicaciones y ejemplos en SAS. John Wiley & Sons, 2016.

[7] github.com/MykolaHerasymovych/Optimizing-Acceptance-Threshold-in-Credit-Scoring-using-Reinforcement-Learning

[8] riskconference.ru/wp-content/uploads/2019/10/%D0%A1%D1%83%D1 % 80% D0% B6% D0% BA% D0% BE_% D0% 92% D0% A2% D0% 91.pdf

[9] Masyutin Alexey. "Calificación crediticia basada en datos de redes sociales". Informática empresarial 3 (33) (2015).

[10] habr.com/ru/company/vtb/blog/508012

[11] vc.ru/finance/83771-kak-formiruetsya-procentnaya-stavka-po-kreditam

[12] Farrakhov Igor. "NIIF 9: Provisiones para estimar pérdidas crediticias esperadas". Revisión bancaria. Aplicación "MEJORES PRÁCTICAS 2 (2018).

[13] Bellini Tiziano. Modelado y validación de riesgo crediticio de IFRS 9 y CECL: una guía práctica con ejemplos trabajados en R y SAS. Prensa académica, 2019.



All Articles