美章网 资料文库 数据挖掘技术银行业务范文

数据挖掘技术银行业务范文

数据挖掘技术银行业务

一、数据挖掘概述

1、相关定义。数据仓库是支持管理决策过程的一个数据集合。这个数据集合是由企业内的历史详细数据和当前详细数据、操作数据和外部数据按照一定的主题标准归类,进行加工和集成而建立的,是为企业决策服务的。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

2、数据挖掘的流程

(1)数据取样。当进行数据挖掘时,首先要从企业大量数据中取出一个与要搜索的问题相关的样板数据子集,而不是动用全部企业数据。通过对数据样本的精选,不仅能减少数据处理量,节省系统资源,而且能通过对数据的筛选,使数据更加具有规律性。

(2)数据探索。数据探索就是通常所进行的对数据深入调查的过程,从样本数据集中找出规律和趋势,用聚类分析区分类别,最终要达到的目的就是搞清楚多因素相互影响的、十分复杂的关系,发现因素之间的相关性。

(3)数据调整。通过上述两个步骤的操作,对数据的状态和趋势有了进一步了解,这时要尽可能对问题解决的要求进一步明确化和量化。针对问题的需求,对数据进行增删,按照对整个数据挖掘过程的新认识组合或生成一个新的变量,以体现对状态的有效描述。

(4)模型化。在问题进一步明确,数据结构和内容进一步调整的基础上,就可以建立模型。这一步使数据挖掘的核心环节,可以运用神经网络、决策树、数理统计、时间序列分析等方法来建立模型。

(5)评价。从上述过程中将会得出一系列的分析结果、模式和模型,多数情况会得出对目标问题多侧面的描述,这时就要综合它们的规律性,提供合理的决策支持信息。评价的一种办法,是直接使用原先建立模型样本和样本数据来进行检验;另一种办法,是另找一批数据并对其进行检验,已知这些数据能反映客观实践的规律性;再一种办法,是在实际运行的环境中取出新鲜数据进行检验。

以上五个过程要反复进行,在反复过程中,不断地趋近事物的本质,不断地优化问题的解决方案。

3、数据挖掘功能。数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。

(1)自动预测趋势和行为。数据挖掘自动在大型数据库或数据仓库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户。

(2)关联分析。数据关联是数据库或数据仓库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。

(3)聚类。数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学,其要点是在划分对象时不仅考虑对象之间的距离,还要求划分出的对象之间具有某种内涵描述,从而避免了传统技术的某些片面性。

(4)概念描述。概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

(5)偏差检测。数据库或数据仓库中的数据常有一些异常记录,从数据库或数据仓库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。

二、我国银行业业务现状

目前我国银行业所做的各种信息系统,一般都是用于完成各种各样的柜面业务,如储蓄系统、会计系统、信用卡系统等。有些银行正在开发集各种柜面业务为一体的综合柜面业务系统,重在提高业务运行管理效率。只要对各家银行的系统进行分析观察,就会发现各系统的内容、模式及所提供的功能基本都是相同的,最多只是所选软硬件平台的不同,这样看来各家银行耗费巨资进行的都是重复的开发,没有把事务处理系统外包出去,从事务处理中摆脱出来,不注重或从没有查询和分析已有的各种客户信息资料,从中找出潜在有用的信息。各银行比较长的一段时间来,处在依靠扩大规模、抢占地盘来提高效益的规模效益阶段。经过盲目的机构设置、地盘抢占、人员投入之后,才发现实际产出的效益并没有达到期望的效果。目前国内金融机构日益增多,一些外资银行也已抢滩,竞争日趋激烈,扩大规模已不再是行之有效的经营手段。各大银行将不得不把注意力转向追求深度效益,在信息挖掘和再利用上做文章。银行必然从盲目的硬件投资转向有目的的软件投资;从注重交易的数量转向注重客户关系和客户价值,同重要客户保持长期关系,吸引、锁定特定客户群;从撒大网式的业务推广方式转向注重客户导向与客户信息分析,由分析工具和经验准确地选择单独的客户群,有目的的向不同客户销售不同的银行产品和服务,从而创造竞争优势。而这一切自然离不开信息与信息技术,离不开提供信息的大型数据库或数据仓库,离不开发挥信息潜能的数据挖掘技术。

三、数据挖掘技术在银行业务的应用

随着竞争的日益深入,美国银行中的“深度效益”观念必将融入我国银行的管理策略之中。所谓“深度效益”,从字面上来说是预期1美元能够带来10美元的回报。实质上是把客户细化为不同的个体,细化客户信息的组织和分析,由分析工具和经验选择特定的客户群来划定战场,跟踪每位消费者个体以及个性化的需求,在营销方面实施关系营销,由传统的注重交易转变为注重客户关系和客户价值,从而产生了“关系银行”这个概念。

美国BankOne银行对自己的客户进行调查发现,百分之二十的客户创造银行利润,其它百分之八十的客户并没有给银行创造利润。如果我国的银行对自己的客户进行调查,也会发现同样的结果,只是百分比不同而已。这需要我们把零散的、无序的、历史的、当前的各种数据集中起来建立数据仓库。可喜的是中国各银行已经完成了各种业务数据库的建立,完全可以在此基础上建立自己的大型数据库。一方面可以从所建立的数据仓库中挖掘出为银行创造利润的这部分客户,从复杂的客户信息中建立模型,对客户记录信息进行动态跟踪和监测,计算客户价值,锁定特定客户群,分析潜在客户群,制定不同市场需求、不同客户群的市场战略,根据客户的价值选定服务产品配置,从而与创造利润的优良客户建立长期关系。一方面又可以应用数据挖掘技术,分析隐含在数据库中的客户信息,通过描述客户以往的趋势来预测未来的趋势。这样,不仅可以达到降低成本、改善客户关系的目的,而且可以集中精力于重要的和潜在的客户,制定更好的市场战略,增强竞争优势。

建立数据仓库,进行数据挖掘是金融监管的需要,也是银行生存发展、提高竞争力的需要。为了提高投资的有效性,降低风险,就要广泛收集各方面信息,充分利用已有的各种数据,来争取更多的优良客户,支持决策的科学性、可靠性。我国银行要健康发展,就要不断地捕捉新的商业信息与商业机会,不断地改变竞争策略,迎合甚至导向市场需求,充分利用数据挖掘技术,预测用户的消费趋势和行为,发现以前未知的模式,指导银行销售,策划银行产品与服务。如使用过去有关信用卡促销的数据来寻找未来投资中回报最大的用户群体,有目的的邮寄宣传品;对零售银行数据的分析,可能找出表面上不相关而实际上却被一起购买的商品,从而引导客户消费。总之,中国银行要发展,就要不断地采用新技术,善于利用金融创新工具,寻找新的效益增长点,不能将思想禁锢在传统的单一思维模式上面。