信用评分模型方法

关键部分
在信用评分的过程中,最关键的就是信用评分模型的构建。用来产生信用评分的模型不胜枚举,每一种模型均有其独特的规则。在此,我们主要介绍信用评分模型的构建方法。
基本原理
信用评分模型的基本原理是确定影响违约概率的因素,然后给予权重,计算其信用分数。信用评分模型的构建,目前最为有效的手段是数据挖掘。下面对数据挖掘的定义进行简单介绍,并重点描述利用数据挖掘技术构建信用评分模型的步骤和方法。
数据挖掘
数据挖掘定义众说不一,数据挖掘的关键可以被分成三个部分:数据、信息和商业决策,即数据挖掘就是一个从数据中汲取信息,并使用这些信息制订更好的商业决策的过程。
信用评分模型构建步骤
利用数据挖掘技术构建信用评分模型一般可以分为10个步骤,它们分别是:业务目的确定、数据源识别、数据收集、数据选择、数据质量审核、数据转换、数据挖掘、结果解释、应用建议和结果应用。这些可以形象地表示为(图一):
1) 商业目标确定: 明确数据挖掘的目的或目标是成功完成任何数据挖掘项目的关键。例如,确定项目的目的是构建个人住房贷款的信用评分模型。
2) 确认数据源识别: 在给定数据挖掘商业目标的情况下,下一个步骤是寻找可以解决和回答商业问题的数据。构建信用评分模型所需要的是关于客户的大量信息,应该尽量收集全面的信 息。所需要的数据可能是业务数据,可能是数据库/数据仓库中存储的数据,也可能是外部数据。如果没有所需的数据,那么数据收集就是下一个必需的步骤。
3) 数据收集: 如果银行内部不能满足构建模型所需的数据,就需要从外部收集,主要是从专门收集人口统计数据、消费者信用历史数据、地理变量、商业特征和人口普查数据的企业购买得到。
4) 数据筛选: 对收集的数据进行筛选,为挖掘准备数据。在实际项目中,由于受到计算处理能力和项目期限的限制,在挖掘项目中想用到所有数据是不可能实现的。因此数据筛选是必不可少的。数据筛选考虑的因素包括数据样本的大小和质量。
5) 数据质量检测: 一旦数据被筛选出来,成功的数据挖掘的下一步是数据质量检测和数据整合。目的就是提高筛选出来数据的质量。如果质量太低,就需要重新进行数据筛选。
6) 数据转换: 在选择并检测了挖掘需要的数据、格式或变量后,在许多情况下数据转换非常必要。数据挖掘项目中的特殊转换方法取决于数据挖掘类型和数据挖掘工具。一旦数据转换完成,即可开始挖掘工作。
7) 数据挖掘: 挖掘数据是所有数据挖掘项目中最核心的部分。在时间或其它相关条件(诸如软件等)允许的情况下,最好能够尝试多种不同的挖掘技巧。因为使用越多的数据挖掘 技巧,可能就会解决越多的商业问题。而且使用多种不同的挖掘技巧可以对挖掘结果的质量进行检测。例如:在构建信用评分模型时,分类可以通过三种方法来实 现:决策树,神经分类和逻辑回归,每一种方法都可能产生出不同的结果。如果多个不同方法生成的结果都相近或相同,那么挖掘结果是很稳定、可用度非常高的。 如果得到的结果不同,在使用结果制定决策前必须查证问题所在。
8) 结果解释: 数据挖掘之后,应该根据零售贷款业务情况、数据挖掘目标和商业目的来评估和解释挖掘的结果。
9) 应用建议:数据挖掘关键问题,是如何把分析结果即信用评分模型转化为商业利润。
10) 结果应用:通过数据挖掘技术构建的信用评分模型,有助于银行决策层了解整体风险分布情况,为风险管理提供基础。当然,其最直接的应用就是将信用评分模型反馈到银行的业务操作系统,指导零售信贷业务操作。
信用风险评分模型构建方法
数 据挖掘方法可以依据其功能被分成4组:预估模型、分类、链接分析和时间序列预测。每一项功能都可以被开发和修改成为适应不同业务的应用。比如: 分类模型可以被运用到建立信用风险评分模型、信用风险评级模型、流失模型、欺诈预测模型和破产模型等。为实现数据挖掘的每一项功能,有许多不同的方法或算 法可以使用。
本文所讨论的信用风险评分模型主要是属于分类模型,所以用到的方法主要有分类分析和分割分析。分类分析主要方法包括:决策树、神经网络、区别分析、逻辑回归、概率回归;分割分析主要方法包括:K-平均值、人口统计分割、神经网络分割。

滚动至顶部