Bons livres / articles sur la notation du crédit

11

Je recherche des recommandations de livres sur la notation du crédit. Je suis intéressé par tous les aspects de ce problème, mais surtout par: 1) Les bonnes fonctionnalités. Comment les construire? Lesquels se sont révélés bons? 2) Réseaux de neurones. Leur application au problème de notation de crédit. 3) J'ai choisi des réseaux de neurones, mais je m'intéresse également à d'autres méthodes.

Nya
la source

Réponses:

6

Si vous êtes nouveau dans le monde de la notation, votre premier livre devrait être par naeem siddiqi sur la notation de crédit en utilisant SAS. Si vous n'avez pas suivi le cours, foncez. L'objectif principal de la classe est la compréhension globale de la notation et de la vente de mineur d'entreprise SAS pour des millions de dollars.

Si vous avez besoin de théorie, vous avez besoin d'une analyse de données catégorique et d'un cours d'exploration de données d'une université proche. Même après avoir suivi ces cours, vous aurez toujours besoin d'aide.

actuellement les techniques les plus utilisées sont

  1. régression logistique
  2. les réseaux de neurones
  3. prendre en charge les machines vectorielles et
  4. forêts aléatoires

le clustering, l'analyse discriminante, l'analyse factorielle, les principales composantes sont également indispensables.

La notation de crédit par Elizabeth Mays vous donnera également un bon aperçu.

J'ai également suivi un cours de modélisation du risque de crédit par l'institut SAS, ce qui m'a un peu aidé. C'est un processus d'apprentissage constant et ce n'est jamais fait.

Les bayésiens aiment aussi leurs méthodes.

Éditer

j'ai aussi oublié de mentionner. La régression logistique dans la technique la plus populaire et sera toujours celle que les banques continueront à utiliser. D'autres méthodes sont très difficiles à vendre aux cadres supérieurs, à moins que votre banque ne veuille moins se soucier de la compréhension de ces méthodes et que leur objectif reste la prise de risques et la création d'argent.

user16789
la source
Merci! Je vais clarifier: je participe à un concours en ligne, dont le but est de prédire la probabilité de défaillance d'un prêteur. Donc 1) je suis libre de choisir la méthode que j'aime. Le concours se termine dans 2 semaines, 2) Je n'ai pas beaucoup de temps pour faire un apprentissage complet. et 3) Les données fournies sont des réponses brutes des bureaux de crédit sur les crédits précédents, donc je suis vraiment intéressé à extraire des caractéristiques non évidentes de ces données.
Nya
Merci aussi pour votre réponse, je vais certainement jeter un œil à vos références.
Nya
1
Quelle est cette compétition? Puis-je savoir?
xiaodai
6

Je travaille dans le domaine de la notation de crédit. Même si j'aime explorer différentes approches, je trouve que la régression logistique est souvent assez bonne sinon la meilleure approche. Je n'ai pas passé en revue les articles les plus récents sur le sujet, mais de mémoire dans la plupart des articles, vous verrez que d'autres approches telles que le modèle des réseaux de neurones n'offrent généralement pas d'élévation significative en termes de pouvoir prédictif (mesuré par GINI et AR). De plus, ces modèles ont tendance à être beaucoup plus difficiles à comprendre pour un profane (souvent, la plupart des cadres supérieurs n'ont pas de formation en statistiques), et l'approche des tableaux de bord utilisant la régression logistique semble offrir les modèles les plus faciles à expliquer. Certes, la plupart des tableaux de bord ne prennent pas en compte les interactions,

Cela dit, il y a eu récemment un certain intérêt à construire des cartes de pointage en utilisant des techniques d'analyse de survie car cela présente quelques avantages par rapport à la régression logistique. À savoir, nous pouvons plus facilement intégrer des facteurs macroéconomiques dans le modèle, nous pouvons utiliser des données plus récentes dans la construction du modèle au lieu d'avoir à nous appuyer sur des données il y a au moins 12 mois (car l'indicateur binaire en logistique est généralement défini comme étant par défaut dans le 12 prochains mois). À cet égard, ma thèse pourrait offrir une autre perspective en ce qu'elle explore la construction de cartes de pointage de crédit à l'aide d'une analyse de survie. J'ai montré comment les tableaux de bord d'analyse de survie «ressemblent et se sentent» de la même manière que les tableaux de bord de régression logistique, ils peuvent donc être introduits sans trop de problèmes.

Dans ma thèse, j'ai également décrit l'algorithme ABBA qui est une nouvelle approche des variables de binning.

https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwikimedia%2 2Fwikipedia% 2Fcommons% 2F2% 2F2f% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & ei = 8D8MUorrJs2Trgf56YCwCQ & usg = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & sig2 = kcEvjUUcn_wT93igxpYYDA & BVM = bv.50768961, d.bmk

Mise à jour: je ne prétends pas si ma thèse est bonne. C'est juste une autre perspective d'un pratiquant sur le terrain.

xiaodai
la source
1
Cela ne semble pas centré sur la question. Votre suggestion concrète est "lire ma thèse". Je ne l'ai pas lu et je ne suis pas qualifié pour l'évaluer, mais il ne peut pas être considéré comme un livre, ni même comme un article publié.
Nick Cox
4
@Nick La question demande "d'autres méthodes", auxquelles cette réponse répond. Beaucoup de gens trouvent qu'un lien vers un texte téléchargeable est utile, peut-être même plus qu'une simple référence. À un signaleur anonyme: fournir un lien vers son propre travail n'est pas du spam. Nous accueillons ici des chercheurs et d'autres innovateurs et ne voudrions pas limiter leurs capacités à nous aider en exigeant qu'ils ne citent jamais leurs propres contributions!
whuber
3
Je prends le point de @ whuber. Je suis également tout à fait d'accord pour dire que citer son propre travail est en règle. xiaodai: Je supprimerais la mise à jour. L'intérêt de votre article est que votre thèse mérite d'être lue. Si vous ne le pensiez pas, vous ne publieriez pas. Il n'est pas nécessaire d'ajouter une note de méfiance ou de modestie.
Nick Cox
3
  • J'ai fait référence au Guide de notation du crédit dans R dans le passé de D. Sharma et c'est une bonne référence introductive sur les approches, y compris la régression logistique et les méthodes basées sur les arbres.
  • Le guide ci-dessus utilise les données de crédit allemandes qui ont un riche ensemble de fonctionnalités. Si vous recherchez l'ensemble de données, vous trouverez d'autres approches, analyses et comparaisons alternatives qui peuvent aider à éclairer la sélection d'entités et le choix du modèle pour votre ensemble de données
  • Les réseaux de neurones sont un bon choix pour un problème de classification binaire comme celui-ci. Dans le monde réel, un modèle de notation du crédit devrait également expliquer pourquoi une demande de prêt (par exemple) a été rejetée. Par conséquent, il est utile d'avoir un modèle dans lequel vous pouvez identifier les caractéristiques de vos antécédents de crédit qui entraînent une faible cote de crédit et provoquent le refus d'une demande. Les fonctionnalités des approches de régression et d'arborescence sont plus faciles à interpréter que les réseaux de neurones. Si vous évaluez purement sur l'ajustement, NN vaut la peine d'essayer
raninjan
la source