美章网 精品范文 大数据时代的数据分析范文

大数据时代的数据分析范文

大数据时代的数据分析

大数据时代的数据分析范文第1篇

关键词:大数据时代 数据分析 理念 辨析

中图分类号:C8 文献标识码:A 文章编号:1674-098X(2017)01(c)-0136-02

近年来,对大数据的研究和应用已经受到我国各界人士的广泛关注,国家统计局已经把信息处理技术列为关键性的创新技术工程之一。随着我国大型计算机的迅速发展,处理大规模的复杂数据的能力逐渐提升,从这些大数据中提取有效信息的能力也逐步加强,毫无疑问,我国进入大数据时代的脚步将会进一步加快,人们将会感受到大数据时代下给其带来的生活、工作上的便利。

1 大数据和大数据时代简介

1.1 大数据

大数据是指远大于一般数据的巨量资料,需要人们通过全新的处理模式才能获取其中有价值的数据信息。“大数据”这一概念最早由维克托在《大数据时代》一书中引用得来,最开始对其定义为:不通过传统的随机分析方法直接对所有数据进行分析处理,主要有大量、高速、多样和价值4个特征。

大数据可以分为大数据技术、大数据工程、大数据科学和大数据应用等领域。目前受到最多应用的是大数据技术和大数据应用。人们通过收集数据,提取有效信息就可以为企业发展或者社会活动提供最有效的实施途径。因此,可以这样说,在大数据的王国里,最成功的企业就是那些善于运用机遇的公司。

1.2 大数据时代

大数据时代是建立在信息时代的基础上,通过互联网、物联网等渠道广泛搜集海量数据资源并对其进行存储、提取和展示。在大数据时代,几乎所有人都能够享受从任一数据中获得所需要的信息,大数据时代也具有社会性、广泛性、公开性和动态性4个特征。大数据时代的发展将会引领社会众多领域和行业的变革,对人类的生产、生活方式产生深远影响。

在大数据时代下,传统的数据分析思想已经不再适用,应该做出改变。首先,应该转变抽样思想,大数据时代下的样本即总体,已经不再依靠少量样本分析事物的相关规律;其次,要转变数据精确测量的思想,大数据时代要学会接受繁冗复杂的多样性数据;最后要转变探究事物的因果关系思想,转为研究事物的相关规律。以上思想的转变,均与统计学有关,因此,下面将分析大数据对统计学带来的具体影响。

2 大数据对统计学研究工作的影响

2.1 大稻莘岣涣送臣蒲У难芯慷韵

大数据影响的领域范围非常广泛,在大数据时代,不仅能够对以结构数据为度量单位的客观主体,还可以对不能用数据衡量关系的文本、图片、音像等非结构数据进行分析,大大扩展了传统统计学的研究范畴。

2.2 大数据影响统计学的工作进程

统计学是对所搜集的数据进行整理和归纳的方法论学科。大数据时代的资料十分丰富,分析数据已经不再需要抽取样本了,因为数据总体即是样本。此时,传统的统计学抽取样本分析的工作方法已经不再适用,而是被现代化通过传感器自动采集数据的方法所取代。

3 大数据时代下数据分析理念辨析

3.1 数据分析理念

传统的数据分析是指用统计学方法将收集的数据资料进行系列分析,以便最大化地开发数据中的功能,从中提取有价值的数据,再和未经处理的数据进行对比,发挥数据的作用。大数据时代下的数据分析,由于数据量非常大,数据本身的动态特性使人们要研究的数据难度加大,因此,大数据时代的数据分析一般利用统计学的理念,采用更广泛的方法统计和分析数据,以此摆脱对数据样本的依赖,也可以避免数据的流动性给分析结果带来的不确定性。大数据时代更加注重数据的增值分析工作,研究数据的未来走向,使其中有价值的数据可以增值,将有效数据有机整合,能够及时发现问题和解决问题。

3.2 数据分析的主要程序

3.2.1 数据整理

统计数据的整理主要分为4个步骤:审核统计资料、对资料进行分组、汇总和编制统计表格或图表、保管和公布。当统计对象为数据资料庞大、类型复杂、要求处理速度快的大数据时,这些步骤就显得繁冗了,尤其是图表的绘制是没办法实现的,因此,只需要对资料进行审核和存储。大数据的审核和存储不同于传统意义上的数据审核和保存,大数据时代利用先进的现代化工具进行数据的审核和保存。

3.2.2 数据的开发

传统数据的样本量较小,目的主要着眼于解决问题,数据的时效性较强,数据的使用价值会随时间流逝而降低。而大数据的流动性很强,随着时间的推移会越来越壮大,而且具有推陈出新、价值重塑的可能,因此,在大数据时代,数据是会不断增值的,开发大数据,是一项有重要意义的工作。

3.2.3 数据的应用

其中分别对教育、运输、消费品、电力、石油与天然气、医疗护理、消费金融等进行分析和预测。根据这些行业的特点,可以总结出大数据挖掘商业价值的基本方法为:客户群体细分,为每个群体量定特别的服务;模拟现实环境,发掘新的需求的同时提高投资的回报率;降低部门联系,提高整条管理链条和产业链条的效率;降低服务成本,发现隐藏线索产品和服务的创新。从图1中可以看出,大数据的应用群体十分广泛,能否对获取的数据及时、迅速处理,对该行业的发展具有重要意义。

4 结语

该文主要对大数据时代下数据分析理念进行了相关的分析和研究。首先对大数据及大数据时代的概念做了简要阐述,接着分析了大数据对统计学的两点影响,最后分析了大数据时代下的数据分析理念。总而言之,在现代社会,大数据的应用已经成为时代新的特征,能否从海量数据中提取有价值的信息做出相应的预测,对于企业或者个人的发展具有重要意义。

参考文献

大数据时代的数据分析范文第2篇

关键词:大数据时代;大数据;统计学;数据分析

引言:

目前阶段,在计算机处理技术不断发展的背景下,在对规模较大并且较为复杂的数据进行处理过程中,人们已经逐渐掌握了方法与技能,并且能够在大规模的数据中找出具有一定价值的信息,所以,大数据时代已经来临。在数据时代中,在人文社科与人类自然科学技术等方面都会有较大的发展,同时也会一定程度上改变人们的生活与工作方式。除此之外,大数据时代也同样为统计学提供了良好的发展机会,但也存在一定的挑战。

一、大数据时代的概念

大数据时代的提出者是麦肯锡,他认为数据已经逐渐进入到各个行业与各业务职能的领域中,并且逐渐成为了主要的生产因素[1]。因此,人们在对大规模数据进行挖掘与应用的过程,也就意味着新的生产率增长的来临。虽然“大数据”在众多行业被广泛应用,但是,特别是在信息与互联网的领域中应用突出。

二、怎样理解大数据

(一)大数据概念界定与构成

大数据,即由于日常产生的数据量快速增长,使得数据库无法利用相应的管理工具对其进行管理与收集,最终导致在进行搜索、分析、存取、共享数据时具有较大的困难。

大数据的构成包括四部分,并将其总结为4V,即Volume,Variety,Value,Velocity[2]。第一部分是价值密度低,将视频作为具体实例来说,实现连续并且不间断的监控,其中有价值的数据信息只有一两秒。第二部分是数据体量极大,已经从TB实现了PB的跃升。第三部分是数据类型众多,主要包括视频、图片、网络日志以及地理信息等。第四部分是处理的速度超快,可以用一秒定律来解释。

(二)海量数据带来哪些挑战

第一,数据存储。由于大数据的数据规模是PB级别,所以,存储的系统也需要进行等级的拓展,并且可以通过磁盘柜或者是增加模块实现容量的增加。然而,目前阶段,数据的增长速度惊人,所以系统资源的消耗也不断增加,导致系统的运行效率有所下降[3]。因为对海量数据始终停留在分布式的存储阶段,所以,对于爆炸式的数据增长,原有的存储方案已经无法满足现有的数据变化需求。

第二,处理技术。由于海量数据的分布性与数据量与以往存在较大的差异,所以,原有的数据管理技术已经处于落后状态。

第三,数据安全。在互联网规模逐渐扩大的情况下,数据的应用已经出现指数级别的增长,所以,对于数据安全的保护与监控来说具有一定的难度。

(三)大数据相关应用与实践

第一,体育赛事应用。以2014年的世界杯为例,在充分发挥记者与编辑敏锐度的基础上,腾讯也利用对大数据的分析以及云计算等方式来为为其提供移动与社交的数据。与此同时,腾讯与IBM进行合作,并通过文化、赛事与球迷三方面来对世界杯球迷的关注重点进行信息的挖掘,进而实现新栏目的创作,并且在短时间内赢得了广大球迷的认可与关注。

第二,产品推荐应用。产品推荐的应用比较广泛,可以对客户信息、交易历史、购买过程等数据进行全面的分析,并进行有价值信息的挖掘。同时,针对同一产品的不同客户访问信息也可以进行挖掘。最终,通过对客户行为的分析,来确定消费者的共,这样就可以更好的为客户推荐产品。

除此之外,在产品推荐中,可以在对客户社交行为进行信息挖掘与分析的基础上来进行社区的营销。对客户微信微博以及社区活动中的偏好数据进行分析,并为其提供符合客户兴趣爱好的产品。

图一

三、如何分析大数据

(一)如何挖掘数据中价值

以匹配广告为具体事例进行分析,主要有两种数据。第一种是广告库,其中包括广告库以及广告的客户信息[4]。但是这种数据信息比较适合在传统数据库中应用。第二种是用户在观看广告后的行为。可以把以上两种数据进行有效的结合,并通过相应的算法来体现价值。在实践应用过程中,可以充分体会到第二种信息的重要作用。可以为用户提供其所需的信息,并通过群体智能以及群体行为对之前用户使用的效果进行分析,最终通过具体的反馈机制,将最优质的信息提供给用户,还可以进行搜索或者是查询信息。

(二)如何做处理与分析

第一,更新抽样调查的工作理念。由于大数据时代的数据样本是以往资料综合,所以,可以对相关事务的数据信息进行分析,进一步对总体进行了解,还可以更好的了解局部。同时需要解决以下问题:抽样框架不稳定,调查目的设定不合理、样本量受限[5]。第二,积极改变对于数据精确度的标准。在大数据时代的背景下,数据的来源比较广泛,并且对数据进行处理的技术也有所提高,所以,可以允许数据存在不准确的情况。大数据时代需要吸收多种数据,但并需要一味的要求数据精准。第三,合理转变数据关系的分析重点。由于大数据时代的数据规模比较大,而且结构也十分复杂,变量的关系也比较繁杂。所以,在对数据进行分析的过程中,不应该对因果关系进行仔细的分析,而重要的是对事物相关的关系进行分析。需要转换思路,对事物关系的形式与目的进行详细的分析。

四、 大数据对统计学科和统计研究工作的影响

(一) 拓展统计学研究领域

因为大数据时代的到来,所以会对各个领域产生一定的影响,同样给统计学带来影响。在统计学中,其主要的研究对象就是其所要认识的客体,是客观存在事物自身的数量特征与关系。其中,统计学研究对象最主要的特点就是数量性。然而,在传统的统计学当中,数据主要是试验与调查的数值。在大数据时代中,统计研究的对象不仅包括以结构数据度量的数量,此外,还可以包括一些无法用数量关系进行衡量的半结构与非结构数据,其中可以包括动画、图片、声音、文本等等[6]。所以,可以说,在大数据时代背景下,统计学的研究对象领域有所扩大。

(二) 对统计计算规范产生影响

在传统的统计学当中,一般是使用方差、平均数以及相对数等数据计算规范来真实反映事物量特征的,同时还可以反映事物量的关系与界限,能够通过数据计算规范来计算出具体的数值。但是,半结构与非结构的数据是无法通过传统数据计算规范进行计算的[7]。所以,在大数据时代的背景下,传统的数据计算规范也同样遇到了难题。

(三) 对统计研究工作的过程产生影响

1. 数据整理和分析

第一,数据审核。原有的数据审核主要的目的就是对数据准确性和完整性进行严格的检查。但是,在大数据的时代中,对数据的审核就必须要确保数据处理的速度以及预测的准确程度,同时还需要对数处理的规模进行准确的确定,也就是数据量级别的确定。除此之外,因为大数据自身具有不稳定性,并且十分混乱。但是,即使是这样,大数据也能够挖掘出信息内部存在的隐蔽关系以及有价值的知识。所以,大数据所反映的研究对象存在准确与不准确两种,但是,任何一种的数据都具有一定的价值,通常情况下是不需要进行替换或者是删除的[8]。

第二,数据存储。在以往的数据存储中,审核、汇总以及编制的图表等资料是重点资料,并且需要进行保存起来的。然而,大数据保存最主要的目的就是对存储的成本进行有效的控制,同时需要根据相应的法规计划来确定数据存储的规模。

2. 数据积累、开发与应用

第一,数据积累。传统统计工作主要是根据所制定的研究目的来对数据进行汇总与分类,并进行保存,这样可以更好的为后期数据的分析与查询提供有利的条件。但是,在大数据的积累中,具有价值的信息需要对大数据进行处理后才可以发现。不容置疑,大数据具有一定的复杂性,所以,在积累的过程中,不可以进行简单的处理。因为大数据的规模大,结构也比较复杂,无法实现简单的分类,而且,在对大数据进行简单整理时非常容易使其混乱,对其真实性产生影响,可能会丢失具有价值的信息。

第二,数据开发。大数据时代下的数据流动性极强,所以,其自身的价值有再生性。因此,大数据时代的数据不会贬值,反而会增值。为了能够对所研究的对象进行更深入的了解,就需要对其整合。

第三,数据应用。对数据的传统应用主要是为了对现象进行解释与预测。但是,在大数据时代,数据应用的核心就是在相关关系前提下的预测。

结语

综上所述,现阶段我国社会正处于大数据时代,并且对于社会未来的发展具有重要的意义。文章对大数据时代的概念与定义以及构成进行了阐述与分析,同时,对大数据的实际应用与实践进行了探讨。针对大数据价值的挖掘与分析处理进行了研究,最后列举了大数据对统计学科以及统计研究工作的影响,进而对今后大数据的数据分析工作提供了有价值的理论依据,并积极的推动了大数据时代的发展,进一步促进了社会的进步。(作者单位:中国人民大学)

参考文献:

[1]朱建平,章贵军,刘晓葳等.大数据时代下数据分析理念的辨析[J].统计研究,2014,31(2):10-19.

[2]张学敏.大数据时代的数据分析[J].电子世界,2014(16):5-5,6.

[3]李祥歌,王奇奇,郭轶博等.基于大数据时代的数据挖掘及分析[J].电子制作,2015(3):81-81.

[4]刘江娜.大数据时代:为什么数据分析能让你的企业脱颖而出[J].环球市场信息导报,2014(36):92-93.

[5]郭华庚,向礼花.大数据时代网络信息归档的元数据分析[J].贵州师范学院学报,2015,31(3):24-28.

[6]高书国.大数据时代的数据困惑――教育研究的数据困境[J].教育科学研究,2015(1):24-30.

大数据时代的数据分析范文第3篇

关键词:大数据;数据分析;数据挖掘;体系建设

引言

进入21世纪以来,随着高新科技的迅猛发展和经济全球化发展的趋势,我国国民经济迅速增长,各行业、领域的发展也颇为迅猛,人们生活水平与日俱增,在物质生活得到极大满足的前提下,更加追求精神层面以及视觉上的享受,这就涉及到数据信息方面的内容。在经济全球化、科技一体化、文化多元化的时代,数据信息的作用和地位是不可小觑的,处理和归类数据信息是达到信息传递的基础条件,是发展各学科科技交融的前提。

然而,世界上的一切事物都包含着两个方面,这两个方面既相互对立,又相互统一。矛盾即对立统一。矛盾具有斗争性和同一性两种基本属性,我们必须用一分为二的观点、全面的观点看问题。同时要积极创造条件,促进矛盾双方的相互转变。数据信息在带给人们生产生活极大便利的同时,还会被诸多社会数据信息所困扰。为了使广大人民群众的日常生活更加便捷,需要其客观、正确地使用、处理数据信息,完善和健全数据分析技术和数据挖掘手段,通过各种切实可行的数据分析方法科学合理地分析大数据时代下的数据,做好数据挖掘技术工作。

1 实施数据分析的方法

在经济社会快速发展的背景下,我国在科学信息技术领域取得长足进步。科技信息的发展在极大程度上促进了各行各业的繁荣发展和长久进步,使其发展更加全面化、科学化、专业化,切实提升了我国经济的迅猛发展,从而形成了一个最佳的良性循环,我国也由此进入了大数据时代。对于大数据时代而言,数据分析环节是必不可少的组成部分,只有科学准确地对信息量极大的数据进行处理、筛选,才能使其更好地服务于社会,服务于广大人民群众。正确处理数据进行分析过程是大数据时代下数据分析的至关重要的环节。众所周知,大数据具有明显的优势,在信息处理的过程中,需要对大容量数据、分析速率,以及多格式的数据三大问题进行详细的分析和掌握。

1.1 Hadoop HDFS

HDFS,即分布式文件系统,主要由客户端模块、元数据管理模块、数据存储服务模块等模块组成,其优势是储存容量较大的文件,通常情况下被用于商业化硬件的群体中。相比于低端的硬件群体,商业化的硬件群体发生问题的几率较低,在储存大容量数据方面备受欢迎和推崇。Hadoop,即是分布式计算,是一个用于运行应用程序在大型集群的廉价硬件设备上的框架,为应用程序的透明化的提供了一组具有稳定性以及可靠性的接口和数据运动,可以不用在价格较高、可信度较高的硬件上应用。一般情况下,面对出现问题概率较高的群体,分布式文件系统是处理问题的首选,它采用继续运用的手法进行处理,而且还不会使用户产生明显的运用间断问题,这是分布式计算的优势所在,而且还在一定程度上减少了机器设备的维修和维护费用,特别是针对于机器设备量庞大的用户来说,不仅降低了运行成本,而且还有效提高了经济效益。

1.2 Hadoop的优点与不足

随着移动通信系统发展速度的不断加快,信息安全是人们关注的重点问题。因此,为了切实有效地解决信息数据安全问题,就需要对大量的数据进行数据分析,不断优化数据信息,使数据信息更加准确,安全。在进行数据信息的过程中,Hadoop是最常用的解决问题的软件构架之一,它可以对众多数据实行分布型模式解决,在处理的过程中,主要依据一条具有可信性、有效性、可伸缩性的途径进行数据信息处理,这是Hadoop特有的优势。但是世界上一切事物都处在永不停息地变化发展之中,都有其产生、发展和灭亡的历史,发展的实质是事物的前进和上升,是新事物的产生和旧事物的灭亡,因此,要用科学发展的眼光看待问题。Hadoop同其他数据信息处理软件一样,也具有一定的缺点和不足。主要表现在以下几个方面。

首先,就现阶段而言,在企业内部和外部的信息维护以及保护效用方面还存在一定的不足和匮乏,在处理这种数据信息的过程中,需要相关工作人员以手动的方式设置数据,这是Hadoop所具有的明显缺陷。因为在数据设置的过程中,相关数据信息的准确性完全是依靠工作人员而实现的,而这种方式的在无形中会浪费大量的时间,并且在设置的过程中出现失误的几率也会大大增加。一旦在数据信息处理过程中的某一环节出现失误,就会导致整个数据信息处理过程失效,浪费了大量的人力、物力,以及财力。

其次,Hadoop需求社会具备投资构建的且专用的计算集群,在构建的过程中,会出现很多难题,比如形成单个储存、计算数据信息和储存,或者中央处理器应用的难题。不仅如此,即使将这种储存形式应用于其他项目的上,也会出现兼容性难的问题。

2 实施数据挖掘的方法

随着科学技术的不断发展以及我国社会经济体系的不断完善,数据信息处理逐渐成为相关部门和人们重视的内容,并且越来越受到社会各界的广泛关注和重视,并使数据信息分析和挖掘成为热点话题。在现阶段的大数据时代下,实施数据挖掘项目的方法有很多,且不同的方法适用的挖掘方向不同。基于此,在实际进行数据挖掘的过程中,需要根据数据挖掘项目的具体情况选择相应的数据挖掘方法。数据挖掘方法有分类法、回归分析法、Web数据挖掘法,以及关系规则法等等。文章主要介绍了分类法、回归分析法、Web数据挖掘法对数据挖掘过程进行分析。

2.1 分类法

随着通信行业快速发展,基站建设加快,网络覆盖多元化,数据信息对人们的生产生活影响越来越显著。计算机技术等应用与发展在很大程度上促进了经济的进步,提高了人们的生活水平,推动了人类文明的历史进程。在此背景下,数据分析与挖掘成为保障信息安全的基础和前提。为了使得数据挖掘过程更好地进行,需要不断探索科学合理的方法进行分析,以此确保大数据时代的数据挖掘进程更具准确性和可靠性。分类法是数据挖掘中常使用的方法之一,主要用于在数据规模较大的数据库中寻找特质相同的数据,并将大量的数据依照不同的划分形式区分种类。对数据库中的数据进行分类的主要目的是将数据项目放置在特定的、规定的类型中,这样做可以在极大程度上为用户减轻工作量,使其工作内容更加清晰,便于后续时间的内容查找。另外,数据挖掘的分类还可以为用户提高经济效益。

2.2 回归分析法

除了分类法之外,回顾分析法也是数据挖掘经常采用的方法。不同于分类法中对相同特质的数据进行分类,回归分析法主要是对数据库中具有独特性质的数据进行展现,并通过利用函数关系来展现数据之间的联系和区别,进而分析相关数据信息特质的依赖程度。就目前而言,回归分析法通常被用于数据序列的预计和测量,以及探索数据之间存在的联系。特别是在市场营销方面,实施回归分析法可以在营销的每一个环节中都有所体现,能够很好地进行数据信息的挖掘,进而为市场营销的可行性奠定数据基础。

2.3 Web数据挖掘法

通讯网络极度发达的现今时代,大大地丰富了人们的日常生活,使人们的生活更具科技性和便捷性,这是通过大规模的数据信息传输和处理而实现的。为了将庞大的数据信息有目的性地进行分析和挖掘,就需要通过合适的数据挖掘方法进行处理。Web数据挖掘法主要是针对网络式数据的综合性科技,到目前为止,在全球范围内较为常用的Web数据挖掘算法的种类主要有三种,且这三种算法涉及的用户都较为笼统,并没有明显的界限可以对用户进行明确、严谨的划分。随着高新科技的迅猛发展,也给Web数据挖掘法带来了一定的挑战和困难,尤其是在用户分类层面、网站公布内容的有效层面,以及用户停留页面时间长短的层面。因此,在大力推广和宣传Web技术的大数据时代,数据分析技术人员要不断完善Web数据挖掘法的内容,不断创新数据挖掘方法,以期更好地利用Web数据挖掘法服务于社会,服务于人们。

3 大数据分析挖掘体系建设的原则

随着改革开放进程的加快,我国社会经济得到明显提升,人们物质生活和精神文化生活大大满足,特别是二十一世纪以来,科学信息技术的发展,更是提升了人们的生活水平,改善了生活质量,计算机、手机等先进的通讯设备比比皆是,传统的生产关系式和生活方式已经落伍,并逐渐被淘汰,新的产业生态和生产方式喷薄而出,人们开始进入了大数据时代。因此,为了更好地收集、分析、利用数据信息,并从庞大的数据信息中精准、合理地选择正确的数据信息,进而更加迅速地为有需要的人们传递信息,就需要建设大数据分析与挖掘体系,并在建设过程中始终遵循以下几个原则。

3.1 平台建设与探索实践相互促进

经济全球化在对全球经济发展产生巨大推力的同时,还使得全球技术竞争更加激烈。为了实现大数据分析挖掘体系良好建设的目的,需要满足平台建设与探索实践相互促进,根据体系建设实际逐渐摸索分析数据挖掘的完整流程,不断积累经验,积极引进人才,打造一支具有专业数据分析与挖掘水准的队伍,在实际的体系建设过程中吸取失败经验,并适当借鉴发达国家的先进数据平台建设经验,取其精华,促进平台建设,以此构建并不断完善数据分析挖掘体系。

3.2 技术创新与价值创造深度结合

从宏观意义上讲,创新是民族进步的灵魂,是国家兴旺发达的不竭动力。而对于数据分析挖掘体系建设而言,创新同样具有重要意义和作用。创新是大数据的灵魂,在建设大数据分析挖掘体系过程中,要将技术创新与价值创造深度结合,并将价值创造作为目标,辅以技术创新手段,只有这样,才能达到大数据分析挖掘体系建设社会效益与经济效益的双重目的。

3.3 人才培养与能力提升良性循环

意识对物质具有反作用,正确反映客观事物及其发展规律的意识,能够指导人们有效地开展实践活动,促进客观事物的发展。歪曲反映客观事物及其发展规律的意识,则会把人的活动引向歧途,阻碍客观事物的发展。由此可以看出意识正确与否对于大数据分析挖掘体系平台建设的重要意义。基于此,要培养具有大数据技术能力和创新能力的数据分析人才,并定期组织教育学习培训,不断提高他们的数据分析能力,不断进行交流和沟通,培养数据分析意识,提高数据挖掘能力,实现科学的数据挖掘流程与高效的数据挖掘执行,从而提升数据分析挖掘体系平台建设的良性循环。

4 结束语

通过文章的综合论述可知,在经济全球化趋势迅速普及的同时,科学技术不断创新与完善,人们的生活水平和品质都有了质的提升,先进的计算机软件等设备迅速得到应用和推广。人们实现信息传递的过程是通过对大规模的数据信息进行处理和计算形成的,而信息传输和处理等过程均离不开数据信息的分析与挖掘。可以说,我国由此进入了大数据时代。然而,就我国目前数据信息处理技术来看,相关数据技术还处于发展阶段,与发达国家的先进数据分析技术还存在一定的差距和不足。所以,相关数据分析人员要根据我国的基本国情和标准需求对数据分析技术进行完善,提高思想意识,不断提出切实可行的方案进行数据分析技术的创新,加大建设大数据分析挖掘体系的建设,搭建可供进行数据信息处理、划分的平台,为大数据时代的数据分析和挖掘提供更加科学、专业的技术,从而为提高我国的科技信息能力提供基本的保障和前提。

参考文献

[1]唐东波.基于神经网络集成的电信客户流失预测建模及应用[J].大众商务,2010(06).

[2]刘蓉,陈晓红.基于数据挖掘的移动通信客户消费行为分析[J].计算机应用与软件,2006(02).

[3]魏娟,梁静国.基于数据挖掘技术的企业客户关系管理(CRM)[J].商业研究,2005(07).

[4]田苗苗.数据挖掘之决策树方法概述[J].长春大学学报,2004(06).

[5]王晓佳,杨善林,陈志强.大数据时代下的情报分析与挖掘技术研究――电信客户流失情况分析[J].情报学报,2013.

[6]刘京臣.大数据时代的古典文学研究――以数据分析、数据挖掘与图像检索为中心[J].文学遗产,2015.

大数据时代的数据分析范文第4篇

关键词:大数据时代;信息处理技术

前言

在“大数据”的背景时代下,信息处理方面不断的创造了奇迹,这也会对未来计算机技术发展提供了有利的条件,在面对新时代的来临,需要不断的发展自身才能够跟上时代的步伐,信息处理技术也应该用于挑战面临的机遇,为大力发展计算机技术做好前期准备。

1.信息处理技术的概念

在企业的管理数据处理中,信息处理技术占据了重要地位。通过信息处理技术,使信息数据的输送、获取和检测、处理等技术有机结合在一起。信息处理技术将计算机技术、通信技术、网络技术、传感技术、微电子技术等科学技术融合在一起,在现代社会中用途很广泛。在现代化办公中,使用信息处理技术之后,不仅能够提高办公效率,还能有效利用高科技的办公设备,实现“人机结合”。信息处理技术的出现改变了传统的办公模式,对于办公模式的影响是极大的。

2.大数据时代的新机遇

2.1云计算受到热捧

在大数据时代中,云计算得以广泛普及,随着云服务的到来,这种趋势是很明显的。云计算整合了传递过来的数据,它拟定云平台,互通电子数据。借助于云平台即可上传信息、下载必要信息。在新的环境之下,云计算拓展了常规的范畴,提升服务性能,助推了更长久的自身进展。依循自主创新,云计算提升了日常流程的性能,增添了创新性。

2.2物联网的诞生

当今社会中的物联网将新路径的信息传递、计算机新技术、通信必备的新颖体系有机结合在一起。这是一项新型的产业,将信息处理应用于成熟的网络体系之中。物联网的外延有很多,比如地铁磁卡、医疗卡、电子钱包等。现在,传统的红包逐渐被电子红包取代了,人与人之间的沟通更加密切,这些都是物联网的优势所在。

2.3新颖的数据挖掘

在数据挖掘的过程中,人们收集大量的数据,分析数据并探寻数据的内在规律。从整体上来看,数据挖掘包括初始预备阶段、探求潜在规律、表达这三个阶段。数据挖掘添加了决策流程内的更多便利。遇有海量数据,同时缺失信息,即可求助于这样的数据挖掘。这是因为,很多企业配有的数据库仅仅可以录入数值、查验并且统计。但是,一般情况下,在搜集得出的数值之中,找到必备的提炼信息的难度是很大的,更不用说发现查找规律。在这种情形之下,就很难明晰深层的某一规律,无法表达规律。如果可以准确地分辨出信息之中的侧重点,那么就可以得到潜藏着的必备信息,这样更有利于企业做出正确的决策。

2.4方便企业拟定正确的决定

通过物联网,大规模的数据分析充分展开。通过解析流程,方便各个阶段的决定的拟定。举例而言,针对企业中的目标群体,分析员工习性、爱好兴趣。通过专门的解析,从而做出准确的决策。

3.大数据时代常见的信息处理技术

3.1信息收集、加工和传播技术

在信息处理的过程中,第一个步骤就是信息的收集。仅仅只有当信息被收集之后,才可进行大量数据进行存储、计算以及传播。在对目标数据源监控之后,把数据采集存放到结构化的数据库之中,以便信息服务系统提供输入,接下来是信息加工。信息加工的目的是对信息进行分类和加工处理。最后,信息进行传播,在信息传播的过程中,信息被收集和处理,并通过社会传播,最后提升了信息的价值。

3.2信息存储技术

信息存储技术是在需要调用相关数据时,可以直接调出使用的一种技术。该技术借助网络和介质实现数据的收集和存储。在大数据时代,数据的特征是容量大、变化迅速。只有在信息存储技术可以快捷的、长时间的、稳定地对相关数据进行存储的情况下,才可节省大量的人力、物力和财力。

3.3信息安全技g

大数据时代信息系统的特征是互联性较高。大数据时代的信息安全技术不再是对孤立的数据信息的处理,而是在基于信息系统整体进行的。信息安全技术为计算机网络带来了重要的发展机遇。与此同时,他也给计算机网络带来了巨大的威胁。所以,怎样提升信息安全?本人认为,可从下面三个角度出发来考虑。第一:打造更加可靠的信息安全体系。在这个过程中,要提高相关人员的技术水平。第二:增强大数据安全技术的研发力度。在大数据时代,以往的信息安全技术可能不再适应现代信息安全的情况。所以,应当加快大数据安全技术的研发,增加人力和物力、财力的投入。第三:对于重点信息加强监测。在大数据时代的大量的信息中,系统数据泄露随时可能发生。因此,有必要重视数据的安全性,加强重要数据信息的监测。毋庸置疑,大数据时代的信息技术的创造价值极大。在信息技术发展的未来,世界将会迎来越来越多的改变。

大数据时代的数据分析范文第5篇

关键词:大数据;时代特征;研发大数据;分析平台;具体策略

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)27-0003-02

正是互联网技术的应用,为整个社会发展转型奠定了重要基础。尤其是在大数据应用日益成熟的今天,完善构建大数据分析平台,结合大数据分析的具体功能属性和应用价值,从而实现企业经营发展与大数据应用的体系性融入。当然,想要用好大数据平台,就必须了解大数据平台有哪些应用特征,同时也要了解其具体应用要求和内涵,从而适应大数据时代特征,为企业发展提供科学决策。

1 大数据时代特征分析

大数据时代的到来,标志着人类对计算机互联网技术的应用实现了实质性进步,与以往时代所不同的是,大数据时代具有自身特征,其主要表现为:首先,其整体数据量极大,与以往信息时代不同的是,大数据应用的前提就是收集庞大的数据信息,因此,其存储数据的计算量远超过了当前的计量,其基本上使用的都是P/E/Z做计量单位,起码存储在1000T以上,甚至高达10亿T。

其次,其特征主要表现为种类繁多、内容多样。尤其是整个大数据体系中不仅包含了各个行业的信息,同时其收集形式也极为多样,从文字、图片到音频、视频等等,基本上囊括了整个时代的各个信息链条和内涵。正是数据信息的多样化和多元化决定了我们可以通过使用大数据实现对整个数据资源的体系化认知,同时这也从根本上提升了我们对数据的处理和应用能力,使得整个数据分析更有参考价值和意义。

此外,随着当前大数据应用不断成熟,如今数据价值密度相对较低,尤其是在物联网广泛应用影响下,信息感知应用极为广泛。虽然当前大数据时代,整个数据量大,但是有价值的数据较少,其整体价值密度不大,因此如何才能有效完善数据筛选,优化其价值应用,就是当前利用大数据平台过程中所不可忽视的内容。

最后,我们应该认识到大数据时代的重要特征还表现为数据处理深度快,且对数据处理有较高的时效性要求。正是高速的数据处理速度和处理时间要求,决定了当前大数据开发应用不同于传统数据筛选应用。但是我们应该辩证看待大数据平台的优缺点,尤其是当前我们所具备的技术和设施已经无法满足海量信息数据的处理,可以说正是快速发展的时代要求决定了我们必须优化信息数据利用方式,构建完善的数据应用平台和机制。

2 当前大数据分析平台应用内涵及具体状况分析

想要对大数据分析平台应用要求进行体系化认知,就必须清楚大数据分析的定义内涵、应用过程中存在的问题和不足以及其具体的解决对策。只有对其形成体系化了解,才能从根本上服务大数据分析平台建设、应用。

2.1 大数据分析的定义

结合大数据结构复杂,数据更新速度快、价值密度低、整体数据量大等一系列特点,当前我们在应用大数据时,存在较大难度,而全面应用大数据的关键就是实施大数据分析,通过完善大数据分析的具体定义认知,从而构建合理的大数据分析平台。实际上,大数据分析指的是在数据密集的环境下,通过使用科学分析的方法,对数据应用进行重新思考,并完善构建全新数据分析应用模式。大数据分析认为其分析应用过程并非技术上的应用,而是一种具体的使用策略,其核心内涵指的是通过使用一种相对以往更有效分析方式来管理、获取海量数据的方式,并且在这一过程中获取有价值的信息。结合当前大数据应用实际状况,我们可以认为,大数据分析指的是:依据数据生成理论,通过构建大数据分析模型,从而结合集成化大数据分析平台,使用云计算技术完善分析数据资源,并且最终探究出大数据模式背后规律的过程。

2.2 大数据分析方法阐述

目前大数据分析的重要内容是可视化分析,通过集成交互可视化和自动化分析,从而提升大数据分析方法的应用效果。从大数据分析系统架构层面看,整个大数据分析具有9层架构体系,尤其是其中的复杂结构处理技术、平台应用标准规范和虚拟化接入技术以及其知识服务交易模型和大数据知识服务质量评价体系等共同组成了大数据分析服务的关键技术应用机制。在传统数据分析过程中,其更多针对的是原始数据进行抽样、过滤,并结合数据样本分析,从而探究其中存在的具体规律和特点。因此,其中最重要的特点在于通过使用复杂算法能够从体系化的数据中寻找到更多有价值的数据信息。在当前计算水平和存储能力大大提升过程中,大数据分析所面临的对象是整个动态变化的数据群体,而不是客观不变的数据样本,因此其大数据分析的应用重点从高效解决收集到的信息入手,只有提升数据运算的准确性,才能够没满足大数据分析的应用要求。

2.3 大数据分析过程中存在的问题阐述

正是因为当前大数据时代的迅猛发展,整个大数据分析过程中存在着一系列问题和不足,其大大制约了大数据分析的应用效果,其问题集中反映为:首先,想要实现精准的大数据分析,需要解决其大数据存储问题,与以往相比,大数据时代,其整体数据存储远远超过了传统数据时代,而想要实现其数据分析目的,就必须完善数据存储。而目前在大数据时代,整个数据存储并不是静态的,而是动态发展的,因此只有探索完善适应大数据存储的具体机制,才能实现其最终目的。其次,大数据质量不高,分析利用难度大。因此,需要探究增强数据可用性的方法。此外,大数据分析的核心在与数据建模。但是当前由于建模水平较差,暂时很难结合大数据时代特征,完善建模应用。最后,缺乏专业的大数据分析工具。在传统数据分析过程中,经常使用SPSS等软件进行数据分析,但是在大数据时代,缺乏能够完善有效的数据分析工具。因此,结合大数据时代特征,构建大数据分析平台,对于整个大数据时代应用发展来说,极为必要。

3 构建研发大数据分析平台的具体策略

在大数据分析过程中,最需要探究的就是其分析方法。分析方法的好坏直接关系到大数据分析应用的具体结果是否合理有效,同时也关系到其数据分析结果是否切实有用。而不同类型的大数据则需要截然不同的分析方法。而在构建大数据分析平台过程中,需要从以下方面入手:

首先,要结合大数据分析应用的具体要求,完善数据存储技术。当前增速惊人的大数据决定了我们想要实现大数据分析目的,就必须探索完善的数据存储方式。通过应用云存储技术,能够确保其存储容量以及数据整体的可用性和安全性等等,从而解决大数据分析平台的数据存储问题。而通过提升大数据分析存储技术,必然也能够有效提升其具体应用技术。同时优化数据存储,能够有效提升大数据的应用效果,实现大数据分析的良好效果。

其次,大数据分析是大数据应用的核心,而实施大数据分析模式则需要针对当前类型多样、迅速增长的信息数据进行分析,并且通过合理分析,从庞大的数据体系中寻找到有价值的信息内涵,进而为整个决策活动提供相关依据的模式。在大数据分析过程中,数据库、知识库和模拟库是整个数据分析模型构建的主要要素,通过在构建现有知识库和数据库模型基础上,进行数据分析,其得到相应结果,一方面优化模型构造,另一方面也实现对数据的具体应用。通过优化数据模型应用,能够有效提升大数据分析能力和应用实效。

最后,大数据分析系统作为当前数据平台应用的核心,其主要应用功能在于为数据挖掘应用提供完善基础,同时使用分布式存储法和并行计算体系,通过使用多重分布计算,从而实现对各类信息资源进行有效计算和分析,通过提供关联、分类、预算等一系列方法,结合各种数据挖掘分析机制的应用,从而实现整个大数据平台价值效用的体系化发挥。

4 结语

在当前互联网技术对各行各业发展的具体影响推动下,通过使用大数据技术,能够为各行业发展奠定重要基础,尤其是大数据分析的科学性,能够为企业发展提供重要决策依据。而对各企业来说,寻找大数据应用与企业自身经营的结合点,则能够从根本上提升大数据应用效率。而想要构建符合实际经营需要的大数据分析平台,就必须从大数据时代特征分析入手,通过具体了解和体系化融入,从而实现大数据分析平台的具体研发。而构建大数据分析平台将从根本上发挥大数据技术优势。

参考文献:

[1] 马新莉.面向服务的大数据分析平台解决方案[J].科技创业,2013(10):72-74.

[2] 韩晶晶.大数据时代下数据分析理念的辨析[J].管理信息,2014(5):33-35.

大数据时代的数据分析范文第6篇

随着现代科技和信息技术的发展,尤其是我国4G通行证的发放,网络大时代数据已经来临,随之而来的便是网络时代大数据的机遇与挑战。本文将以网络时代大数据的来临作为切入点,浅要分析了网络时代大数据的机遇与挑战,为大数据在高速发展网络时的应用抛砖引玉,希望能为广大业内人士提供一些浅薄的建议。

【关键词】网络时代 大数据 机遇 挑战

1 网络时代大数据的来临

网络的高速发展使得信息化在社会经济以及民众生活方面的渗透不断加快。根据相关资料分析显示,从上世纪90年代到2014年的今天,全世界网民每月使用的网络数据流量从1MB增长到了10GB。这也就意味着在二十年左右的时间内,全世界的网络数据使用量翻了12800多倍。随着网络的不断发展,加之网民数量的增长,全球网络数据也将年年递增。而网络时代下,网络速度更快、覆盖面更广、费用更便宜、利用率也就更高。数据越多,数据规模也就越大,数据处理的难度也就更高。

大数据中含有了相当重要而且具有价值的数据,也包含了网民在网络上发生的大量数据,记录了网络中网民的思想、行为等。这是网络时代大数据来临的产物,也是大数据最为明显的特征。网络时代大数据如果能够有效组织和利用,人类将在网络时代下通过大数据的利用进一步促进社会各项发展。但是,网络时代大数据的来临给大数据带来了机遇的同时也带来了一些挑战。

2 网络时代大数据的机遇分析

2.1 分析结果更加精确

在网络时代背景下,人们对于网络的利用也更加便捷,而且网络时代背景下网络活动的价格更低廉,人们在网络中进行活动的范围更广,可以利用网络进行的事物处理也更多,这样必然会产生更多的数据。换句话来说,数据一旦增加,相关行业进行统计分析的过程中所获取的结果将更为精确。随着网络时代的到来,网络数据的发生量将年年递增,这也就意味着相关行业在进行数据分析的时候将拥有更多的数据作为支撑,分析结果也就更加精确。比如现在购物网站中的淘宝、京东、当当网都会进行顾客分析。网络大数据下网站就可以根据顾客的浏览量和商品点击率等大量相关数据分析出顾客的需求,进而在产品营销过程中能够达到良好的推销效果。

2.2 大数据发展更加多样化

在网络时代的背景之下,大数据能够应用的方面也更广,人们通过高速发展和覆盖面更广的网络在生活方面将会发生翻天覆地的变化。例如现如今大部分车辆都安装了智能车载系统,而网络时代大数据将赋予车载智能系统更多更好的功能,让车辆的行使更加安全和便捷,人们对于车辆情况的监控也更加便捷 。

2.3 大数据的分析速度更快

网络时代背景下,大数据的各项运用以及其分析结果的精确主要依赖于分析速度更快,这也是网络时代赋予大数据的另一个机遇。通常来说,大数据的的处理往往是通过网络把储存节点与主机连接起来,进而进行数据的交换和处理、分析。而速度更快、覆盖更广、带宽更高的网络为大数据的分析提供了有力的保障,分析过程中可以同时处理相当大量的数据。故而,网络时代大数据的数据分析和处理速度更快。

3 网络时代大数据的挑战分析

3.1 数据安全方面的挑战

网络时代背景下,大数据的各种安全隐患更大,数据本身以及用户个人数据的安全将面临着新的挑战。面临网络和带宽的增加,尤其是大量网络对话和网络交易活动的增加,这种大数据洪流中的数据安全威胁更为严重。一旦有不法人士将用户的大量数据进行分析和处理,很容易了解到用户的一些隐私问题,更为严重的将导致个人机密或者商业机密的泄露。所以,面临这样的安全挑战,首先要通过权限控制和物力隔离相互结合的方法对数据进行隔离,防止非法访问盗取用户数据中含有的隐私。其次,用户一定要对自己的数据信息进行加密,无论是数据储存还是数据传输都应当进行加密。最后,一定要对用户硬盘进行有效的防护,防止非法用户访问磁盘中的用户数据。

3.2 数据处理方面的挑战

从大数据中提取含有信息和价值的过程是相当复杂的,需要不断进行真伪的鉴定。这种情况下,数据处理人员往往都需要加强业务理解能力,构建数据理解、准备、模型建立、数据处理部署以及数据评估等步骤。研制出准确有效的数据处理方法,把握住真正有价值和可利用的数据。

3.3 数据储存方面的挑战

大数据的储存在网络时代背景也面临着新的挑战。在网络时代背景之下,每个网民每天的使用的网络数据高达10GB,数据使用量的增长也需要更高的储存技术。尽管现阶段的压缩技术以及储存技术都在不断适应网络时代大数据,但是其技术的发展与网络时代背景下数据的增长量是不符的。尤其在数据备份的过程中,由于数据储存的分散性,备份数据也是相当困难。故而,面对数据储存方面的挑战,必须要研究出低能耗和高密度的储存设备。而在数据备份的技术上也应当样子出高强兼容性的数据备份系统才能有效进行数据备份。

3.4 人才的挑战

网络时代大数据无论是储存技术方面的挑战、数据处理方面的挑战还是数据安全方面的挑战,究其本质来看都需要专业人才进行解决。这就形成了网络时代大数据面临的人才挑战。就目前网络信息技术的发展来估计,网络时代大数据将为全球提供近440万的IT工作岗位以及上千万的非IT工作岗位。全球最大占领咨询公司――麦肯锡咨询公司的预测在未来五年以内,美国亟需近50万的大数据分析人才,而人才缺口竟高达近20万。尤其是兼具大数据应用和大数据分析技术的管理人员人才缺口更是高达150万。

4 结语

网络时代大数据已经来临,它给人们生活以及社会中各行各业带来的变化将是前所未有的。但是其自身遭遇的机遇和挑战也是史无前例的。只有充分认识到网络时代大数据来临之后遭遇的机遇和挑战,并用于面对挑战和机遇,才能充分利用其大数据并发挥作用。

参考文献

[1]张允壮,刘戟锋.大数据时代信息安全的机遇与挑战:以公开信息情报为例[J].国防科技,2013(02).

[2]何非,何克清.大数据及其科学问题与方法的探讨[J].武汉大学学报(理学版),2014(01).

[3]张永欣,吴锦栋,张瑶.大数据时代背景下大连面临的机遇与挑战[J].辽宁经济,2013(12).

大数据时代的数据分析范文第7篇

关键词:大数据时代;云会计;系统构建;建模

引言

云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代正式到来[1]。对于企业来说,大数据因其数据量大、处理速度快、类型多样、蕴藏着巨大的商业价值等优势成为企业新型的战略资产和企业核心竞争力的重要基础,为企业科学合理的经营决策提供有效支撑。在当今数据日新月异的时代,企业已经不满足于随机分析和抽样分析这样的捷径,而是需要来自各个渠道种类繁多的大数据规模,这一需求的诞生使得“云会计”应运而生。在大数据时代对数据进行研究已经不是新鲜话题,也有不少学者对云会计从不同角度进行探讨,但鲜有文章对大数据下的云会计进行分析,本文将以此为主题进行论述。

一、大数据时代云会计的概念与特点

“云会计”一词最早由程平等于2011年提出,定义为构建于互联网上,并向企业提供会计核算、会计管理和会计决策服务的虚拟会计信息系统。在会计领域,云会计作为新兴的基于云计算技术和理念的会计信息化模式,可实现企业信息系统的有效集成,提高企业的管理能力和竞争优势[2]。

大数据时代的企业对云会计的侧重点是企业的管理会计和财务决策,根据这一侧重点企业将会计信息化的建设和服务外包,企业为自己享受的服务付费。因此大数据时代的云会计涉及到云服务供应商和企业用户两个方面。云服务供应商不仅为企业提供与会计相关的信息系统,如会计核算服务、管理信息系统、企业决策系统等业务服务系统,而且为企业用户提供相关的软硬件基础设施和云会计服务平台,如云会计的数据库服务、会计信息化开发应用平台、集成管理系统、服务器、网络存储等。对于企业来说,云会计是由供应商基于互联网提供的,以会计信息系统为核心的综合系统服务,且企业只需为其享受的服务付费[3]。

二、大数据时代云会计应用的体系结构

大数据时代的云会计系统的基本结构没有发生大的改变,主要是根据大数据时代数据庞杂且非结构性强等特定,增加了几个模块。主要由内部云、外部云、大数据模块和知识辅助模块构成[4],具体如下图所示:

图1 大数据时代云会计体系结构

在图1中,企业通过统一访问门户Portal访问云会计平台(内部云、外部云),利用云计算中的Paas(平台及服务)为云平台提供技术支撑。内部云平台是企业会计信息系统的核心板块,为企业提供财务业务处理和内部控制相关的信息系统[5]。大数据时代的云会计平台增加了外部云,外部云由交易所、会计师事务所、银行、工商、财政等信息系统构成,该模块的增加是为企业提供与其价值链相关的上下游企业以及相关社会部门之间的协同合作。企业的会计信息系统可通过云会计平台实现内部云与外部云的对接,更好的实现业务一体化协同。

大数据时代的云会计还增加了两个特殊的重要模块――大数据模块和知识辅助模块。企业内部云产生的财务数据以及外部云产生的与价值链相关的数据存储到企业的大数据库中,由于存在数据来源复杂,数据结构各异且数据格式不一致等特点,必须通过大数据处理技术对数据进行抽取、存储、处理、分析,最后提炼为知识,形成企业的生产力,这些过程有企业大数据模块和知识辅助模块完成。

三、大数据时代下的云模型

大数据时代的云会计信息数量巨大且来源庞杂,非结构性强,含有很多不确定性和模糊性。为了将海量数据中的有用成分形成知识,将云会计中大量不确定性核算中定性分析转化为定量分析,本文引进云模型。

云模型最早由李德毅院士提出,云由云滴组成,云滴在论域上的分布称为云模型。本文研究云模型中的一种形式――正态云模型。定义正态云需要通过云的三个数字特征:期望Ex,熵En和超熵He。期望值Ex是云滴在论域空间分布的期望,是云中心对应的x的值;熵En代表定性概念的可度量粒度,是对不确定性的度量;超熵He 是熵的熵,是对熵的不确定性度量。

正态云的生成算法既可以用软件的方式实现,又可以固化成硬件实现,称为云发生器(Cloud Generator)。本文通过一维正态云发生器生成云模型。

正向云发生器(Forward Cloud Generator)是从定性概念到其定量表示的映射,它根据云的数字特征(Ex,En,He)产生云滴,每个云滴都是该定性概念的一次具体数字实现。对于定性概念A,产生一个期望值为Ex,方差为En的随机数Xi,即Xi~N(Ex,En’2),产生一个均值为En,方差为He的正态随机数En’,即En’~(En,He’2)。

计算数据的样本均值,由均值得到期望Ex=1n∑ni=1Xi

计算一阶样本绝对中心矩,得出样本方差和熵En=π2×1n∑ni=1|Xi-X―|

根据正态函数的性质,有yi=Ic(x)= e-(x-Ex)22En′2

令(xi,yi)为一个云滴,它是该云表示的语言值在数量上的一次具体实现,其中xi为定性概念在论域中这一次对应的数值,yi为属于这个语言值的程度的量度;对论域中大量的定性概念进行定量度量,直到产生满足要求数目的云滴数,形成云模型:f(x)=∞-∞12πHe|y|exp[-(x-Ex)22y2-(y-En)22He2]dy

四、结语

大数据时代的云会计具有资源高度共享、成本低、灵活性高等优势,但同时也面临着企业用户信任度不高、安全不能完全保证、可扩展性和个性化需求难以满足等挑战。本文给出了大数据时代云会计的定义和特点,分析了大数据环境下云会计的系统构建,并解释了云会计中各个模块的作用。鉴于大数据时代数据的随机性和模糊性问题显著,本文重点构建了大数据时代的云模型,用定量分析方法为企业提供更全面、高效的会计信息系统服务。考虑到数据的安全性问题,很多企业还不能信任将经济数据存放在云端,这是未来云会计发展重点需要突破的问题,需要进一步提高云会计的可信性,逐步消除企业对云会计的担忧,使企业的会计信息化水平得到提升。(作者单位:广东财经大学)

参考文献:

[1] 孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展, 2013,01:146 -169.

[2] 程平,徐云云.大数据时代基于云会计的AIS构建研究[J].会计之友, 2014, 36:119 -121.

[3] 程平,何雪峰.“云会计”在中小企业会计信息化中的应用[J].重庆理工大学学报(社会科学),2011,01:55-60.

[4] 《中国总会计师》编辑部.会计+云计算=“云会计”[J].中国总会计师,2012(7):26―28

[5] 刘东,孟德凤.“云会计”在企业会计信息化中的应用与建设[J].商业经济,2014,20:89-90.

[7] 程平,徐云云.大数据时代基于云会计的AIS构建研究[J].会计之友,2014,36:119-121.

[8] 谭婕.基于大数据背景的云会计特征分析和实践应用研究[J].现代经济信息,2015,01:209.

大数据时代的数据分析范文第8篇

【关键词】大数据时代;城市规划;响应;以人为本

信息与通讯技术的发展引领了大数据时代的到来,大数据的概念可以简化为各种规模巨大并且无法利用手工的形式对其分析、解读、处理的大批量信息资料。大数据的运用势必会对传统城市规划方案的拟定与推行产生一定的影响,此时新的思维方式与方法应用到城市规划进程中,这是对大数据时代的响应。如何使大数据时代的实效性充分的发挥出来,这已经是城市规划工作者普遍关注的问题,本文将对其进行深入的分析与探讨[1]。

1.大数据时代在城市规划中发展的模式

1.1特征

大数据时代下各种技术能够对数据信息进行高效的处理进而使城市空间规划更具科学性,GPS等追踪定位技术的应用使规划者对城市的空间结构有更加全面、清晰的了解;大数据时代最大的特征是“大体积、大容量”,包含了城市发展的现实状况与特点,能够采集处理超大量的数据信息;

1.2发展形式

大数据时代的到来,使城市规划者积极地站在城市微观的视域下,对居民的日常生活活动进行整体的分析,从而落实城市空间规划与布局的工作任务[2]。在大数据时代背景中,城市规划者将目光放在全球定位系统、手机数据、网络日志以及公交刷卡数据等方面上,在其协助下建设出的城市规划模型更具直观性与科学性,此时的规划工作在对城市空间调整与分布时所提及到的行为方式更具规范性、合理性。

2.大数据时代中城市规划编制的响应

2.1实时化响应

在传统的城市规划工作中,先进计算设备与处理技术的缺乏降低了工作效率,且数据信息获取的周期通常是以年为单位。大数据时代的到来,使原有的城市规划状况逐渐向实时化转型,而实时化体现在数据资料收集方面的同时,也是城市规划响应的表现形式,换句话说,实时化响应是建立在大数据时代、城市规划基础之上的。此时多样化的信息通讯技术、处理技术自身的优势充分地发挥出来:这些技术提高了城市规划对数据收集、处理、分析的精准度与快捷性;使数据收集工作能够实现实时、有序的目标,并与城市规划进程同步运行。在数据库技术、计算机等现代化技术的协同配合下,城市规划者建立了高完整度的数据库,使得各类数据资料得到有序安放与保管;而对于那些近期收集到的新数据信息,相关设备对其进行筛选以后可以被直接输送到与之相匹配的数据库中储存,有助于城市规划者在最短的时间内采集到具有时效性的数据资料,以此提高城市规划模型的直观性与可靠性;

2.2多源时空数据的收集

在过去,城市规划者所获数据信息一般都是在问卷调查、统计年鉴或者是文献资料中提取出来的,数据样本容量小且不具典型性,难以在规划中体现实际参考价值。而在大数据时代导向下各种高端技术顺利的引用与应用,常见的有3S技术、云处理技术、数据挖掘技术等,这些技术的合理应用,拓宽了城市规划中数据资料来源的渠道,另外地形复杂区域时空间数据的搜集工作也不再是难题。而数据挖掘技术自身的性能又是特殊化的,能够将汇总的数据信息进行全面而深入的分析,剔除无实用价值的部分,为打造城市规划区域全景注入动力。例如,在对城市园林建设进行规划布局时,过去需要大量的人力资源去完成数据信息的采集工作,继而对其进行计算分析,而基于园林建设面积大数据处理技术的应用,海量的数据能够在极短的时间里被获取与准确的分析,这就为园林建设的科学规划布局提供了参考价值。此时的数据信息发挥了指导作用,使城市园林建设规划布局更具合理性。总之,多源时空数据参与到城市规划进程中,使城市规划、布局等工作彰显出全面性、合理性等特征。

3.大数据时代城市规划实施评价的响应

3.1静态向动态的有效转型

城市规划之所以能够从“静态、蓝图式”顺利的转型为“动态、过程式”,主要得力于相关技术的应用。在高端技术的辅助下,即使时空大数据多样化、数据信息繁杂化,但是当它们出现于城市规划方案拟定的工作中时,也不会对规划的精细度造成任何的干扰,并且还能够及时地发觉规划进程中数据信息存在遗漏、缺失等相关问题,为城市规划方案的及时调整与改进提供了辅助动力。大数据时代中城市规划在方方面面都能体现动态化的风貌,此时城市规划方案与体系的制定不再是“一次性”的,编写、规划、检验、改编、实行等环节始终处于循序运转的模式中,从而使得城市规划进程中所涉及到的各个子系统之间能够实现弹性互动的目标;

3.2以人为本的规划原则的落实与应用

在大数据时代背景中,城市规划不再以“空间为本”,而是积极地向以“以人为本”的方向转型,这主要是由于大批量数据信息的发源者为群众个体、数据更显多源化。此时大数据技术的应用,使每个居民所提供的数据得到全面而深入的分析,那么我们可以推断城市规划工作是卓有成效的。例如城市规划者参照该城市人口分布的疏密情况、土地资源使用状况等可视化信息,对公交刷卡数据、手机充值数据等基本信息的系统化进行分析,并在此基础上落实对城市规划方案的评价工作,明确城市在未来几年的发展趋势。容积率指标的应用,能够协助城市规划者快捷的完成对城市人口密集度、社会功能混合度审核与改进的工作内容,最终完成对设计效果考评的任务。

4.结束语

其实,大数据时代下,城市规划在众多方面都积极对其做出响应,提升了多维转变的可能性,例如“人工化”到“智能化”的转变、“分散化”到“协同化”的转变、“粗放化”到“精细化”的转变等。在大数据时代背景下,城市规划进程始终要坚持“以人为本”的规划原则,积极关注城市居民个体生活的品质,在先进技术的辅助下,早日落实城市规划信息化建设的伟大目标[3],为推进我国现代化城市发展的脚步提供动力支持,同时使我国社会主义市场经济健康、平、高效地发展与运行。

参考文献:

[1]席广亮,甄峰.过程还是结果?――大数据支撑下的城市规划创新探讨[J].现代城市研究,2015.

大数据时代的数据分析范文第9篇

关键词:大数据;电网;营销管理

0引言

社会经济的整体发展,现代化的科技手段已经运用到方方面面,尤其是互联网的兴起,使得原来很多耗时耗力的工作都变得更加简单便利,通过应用到各行各业中进而影响到人民的生活水平。具体到电力行业中,在电网运营不断满足客户的需求过程中,产生了大量的客户使用数据,通过运用现代科技手段分析庞大的数据体量,可以为不同的客户提供更为精准的服务,满足不同客户的需求,并且通过了解客户的消费习惯进而对客户属性进行分析,为后期的其他营销活动进行铺垫和数据支撑。因此,基于大数据的电网营销管理分析是具有重要研究意义的课题。

1什么是“大数据分析”

“大数据分析”是基于现代科技发展而产生的一种分析技术,其主要是依靠于现代的科技手段,尤其是一些网络技术,通过对基础数据的整理分类,通过不同的计算机算法,可以将不同有类似特征的数据分列开来,最终在海量的数据中得到想要的数据分析。大数据分析技术被广泛应用于各种互联网行业,包括一些app、团购网站、搜索引擎等,通过对客户的日常网络浏览情况进行统计分析,掌握客户的偏好和实时的需求,进而能够更有针对性的为客户提供服务。大数据分析在互联网行业的广泛运用也引起其他行业的注意,纷纷引进其技术以期望可以在本行业中得到应用,最终为更好的掌握客户资源特性而努力,毕竟客户需求才能形成市场,才是供给企业存在的必要。

2“大数据分析”的算法

2.1神经网络

神经网络是可以针对电网营销数据进行加工训练,且是一个自我组织、自我适应的学习过程,可以学习到最具特征性的样本和数据区别能力,也正因为如此,神经网络的分析算法可以更好地获取有参考价值的海量的基本信息。神经网络是基于其自身的分布式的存储路径,并发的处理信息原理,其具有强大的计算能力和容错能力,能够通过练习掌握科学地调整不一样的神经网络参数的权值,进而更好的优化网络,并且适应外界的变化,抵抗不相干因素的干扰,最终适应使用者的需求来调节神经网络的分析能力,为使用者提供更好的服务。

2.2K近邻算法

此种算法是通过采用统计分析的方法,适用于各种分类问题中。具体是指:根据一个已经限定好的训练集,针对准备被分类的数据样本,通过在训练集中寻找与相关样本最为邻近的K个样本数据,准备被分类的样本的类别可以将之判断为K个样本多数所属于的类别之中。通过此种统计分析的方法可以有效地将各种大数据中的分类问题解决,通过计算将具有一定共同特征的数据摘列出来形成使用者寻找的目标客群。

3大数据分析在电网营销管理中的应用

3.1合理用电的数据分析

随着工业文明时代给世界带来的翻天覆地的变化,各种工厂、生产企业、居民生活中的耗电量都是巨大的。而考虑到未来的可持续发展道路,节能减排是人们必须时刻警惕的问题,尤其是在电力方面。因此,可以通过大数据分析技术,通过按照行业、机械设备、时间、区域等因素对海量的用电数据进行分析,找出电力的浪费现象以及可以改进的地方,精确地挖掘各种设备的反映情况,最终为电力的优化使用提供数据支撑,为未来可持续发展道路的推进奠定基础。

3.2未来行情预测

从目前社会发展情况来看,各家庭中都有很多跟电有关的电器,用电量巨大,并且会跟随不同的季节、不同区域的客户需求不同而产生明显的不同,电力企业可以运用大数据分析技术积极探索不同时间点不同区域的用电情况,并且可以通过增长情况来预测未来的变化趋势,进而为自己的电力供应方面提供数据支撑,在事情发生之前提供服务,保障居民生活的正常运行。

3.3运行保障,服务营销

由于电力企业在日常的运行之中要提供一个区域的电力供应,并且在长年累月的使用中常常会发生一些事故。电力企业可以通过历史上各区域用电情况以及运行故障发生情况来进行数据分析,进而在各区域出现类似情况的时期下,加强对该区域的电网排查工作,保障该区域的电力供应情况,并且总结出不同区域电网的承载能力,为后期持久性的服务营销打下基础。

3.4企业营销决策的分析

目前很多电力企业都已经做了自己的门户网站,便利客户的缴费等需求。电力需求客户可以通过便捷的互联网操作来进行电费的查询、缴费等工作,而电力企业可以基于门户网站,运用自己的大数据分析技术,定向地进行电力方面的营销活动,倡导自己企业的理念。并且可以成立一个专家分析系统,对于客户的各种行为进行系统化地分析,最终帮助企业在营销方面的决策更加准确,为企业的长久高效运行提供支撑,最终促进其可以健康的发展。

4结论

总而言之,经济地迅速增长给社会带来翻天覆地的变化,客户需求成为了各行各业都开始重视的问题,大数据分析技术的诞生,可以通过诸多历史行为对客户的需求产生系统化、多维度的分析,真正地用数据说话,为企业的营销决策带来数据支撑,尤其是在电力行业,客户的需求结构是现代电网运营企业不断追求的目标。因此,对于大数据在电网营销管理中的应用,对于企业来说具有重大的发展价值,值得持续地研究和探讨。

参考文献:

[1]李文靖.大数据之下的电网营销管理分析[J].信息技术,2016(01):13-14.

[2]刘凯.论信息技术在电网运用中的应用[J].技术管理,2015(20):29-30.

大数据时代的数据分析范文第10篇

关键词:大数据;电网;营销管理

0引言

社会经济的整体发展,现代化的科技手段已经运用到方方面面,尤其是互联网的兴起,使得原来很多耗时耗力的工作都变得更加简单便利,通过应用到各行各业中进而影响到人民的生活水平。具体到电力行业中,在电网运营不断满足客户的需求过程中,产生了大量的客户使用数据,通过运用现代科技手段分析庞大的数据体量,可以为不同的客户提供更为精准的服务,满足不同客户的需求,并且通过了解客户的消费习惯进而对客户属性进行分析,为后期的其他营销活动进行铺垫和数据支撑。因此,基于大数据的电网营销管理分析是具有重要研究意义的课题。

1什么是“大数据分析”

“大数据分析”是基于现代科技发展而产生的一种分析技术,其主要是依靠于现代的科技手段,尤其是一些网络技术,通过对基础数据的整理分类,通过不同的计算机算法,可以将不同有类似特征的数据分列开来,最终在海量的数据中得到想要的数据分析。大数据分析技术被广泛应用于各种互联网行业,包括一些app、团购网站、搜索引擎等,通过对客户的日常网络浏览情况进行统计分析,掌握客户的偏好和实时的需求,进而能够更有针对性的为客户提供服务。大数据分析在互联网行业的广泛运用也引起其他行业的注意,纷纷引进其技术以期望可以在本行业中得到应用,最终为更好的掌握客户资源特性而努力,毕竟客户需求才能形成市场,才是供给企业存在的必要。

2“大数据分析”的算法

2.1神经网络

神经网络是可以针对电网营销数据进行加工训练,且是一个自我组织、自我适应的学习过程,可以学习到最具特征性的样本和数据区别能力,也正因为如此,神经网络的分析算法可以更好地获取有参考价值的海量的基本信息。神经网络是基于其自身的分布式的存储路径,并发的处理信息原理,其具有强大的计算能力和容错能力,能够通过练习掌握科学地调整不一样的神经网络参数的权值,进而更好的优化网络,并且适应外界的变化,抵抗不相干因素的干扰,最终适应使用者的需求来调节神经网络的分析能力,为使用者提供更好的服务。

2.2K近邻算法

此种算法是通过采用统计分析的方法,适用于各种分类问题中。具体是指:根据一个已经限定好的训练集,针对准备被分类的数据样本,通过在训练集中寻找与相关样本最为邻近的K个样本数据,准备被分类的样本的类别可以将之判断为K个样本多数所属于的类别之中。通过此种统计分析的方法可以有效地将各种大数据中的分类问题解决,通过计算将具有一定共同特征的数据摘列出来形成使用者寻找的目标客群。

3大数据分析在电网营销管理中的应用

3.1合理用电的数据分析

随着工业文明时代给世界带来的翻天覆地的变化,各种工厂、生产企业、居民生活中的耗电量都是巨大的。而考虑到未来的可持续发展道路,节能减排是人们必须时刻警惕的问题,尤其是在电力方面。因此,可以通过大数据分析技术,通过按照行业、机械设备、时间、区域等因素对海量的用电数据进行分析,找出电力的浪费现象以及可以改进的地方,精确地挖掘各种设备的反映情况,最终为电力的优化使用提供数据支撑,为未来可持续发展道路的推进奠定基础。

3.2未来行情预测

从目前社会发展情况来看,各家庭中都有很多跟电有关的电器,用电量巨大,并且会跟随不同的季节、不同区域的客户需求不同而产生明显的不同,电力企业可以运用大数据分析技术积极探索不同时间点不同区域的用电情况,并且可以通过增长情况来预测未来的变化趋势,进而为自己的电力供应方面提供数据支撑,在事情发生之前提供服务,保障居民生活的正常运行。

3.3运行保障,服务营销

由于电力企业在日常的运行之中要提供一个区域的电力供应,并且在长年累月的使用中常常会发生一些事故。电力企业可以通过历史上各区域用电情况以及运行故障发生情况来进行数据分析,进而在各区域出现类似情况的时期下,加强对该区域的电网排查工作,保障该区域的电力供应情况,并且总结出不同区域电网的承载能力,为后期持久性的服务营销打下基础。

3.4企业营销决策的分析

目前很多电力企业都已经做了自己的门户网站,便利客户的缴费等需求。电力需求客户可以通过便捷的互联网操作来进行电费的查询、缴费等工作,而电力企业可以基于门户网站,运用自己的大数据分析技术,定向地进行电力方面的营销活动,倡导自己企业的理念。并且可以成立一个专家分析系统,对于客户的各种行为进行系统化地分析,最终帮助企业在营销方面的决策更加准确,为企业的长久高效运行提供支撑,最终促进其可以健康的发展。

大数据时代的数据分析范文第11篇

关键词:大数据;软件工程;软件服务工程;第四范式

自上个世纪90年代初,信息高速公路在美国提出以来,历经近30年的发展演进,信息技术发展突飞猛进,信息化领域的新技术、新词语层出不穷,诸如IT技术、互联网技术、大数据技术、区块链技术、人工智能等。并且对人们的生产、生活方式产生了深刻的影响,认为现在进入了大数据时代、万物互联时代、智能化时代等。笔者认为,一直以来,其中除了硬件的发展,还有两个关键因素同样值得关注,一是数据,其是基础和目的;二是软件,其是方法和工具。唯如此,才能实现在软件生命周期即设计、开发、运行、优化,实现与大数据生命周期即获取、清洗、集成、分析、呈现等的互动。[1]换言之,现在来说,就是大数据和软件工程,二者助推了信息技术的发展,同时也是信息化的产物,在大数据时代背景下,研究软件工程技术的应用,对于经济社会的发展有着十分重要的意义。

1大数据和软件工程简述

1.1大数据简述

沃尔玛的“啤酒与尿布”是众所周知的大数据经典案例,大数据已经是当今信息社会炙手可热、耳熟能详的词汇,而且已形成共识,即人类已经进入大数据时代。上个世纪80年代初,《第三次浪潮》一书风行全世界。该书作者美国社会思想家阿尔文托夫勒就在文中将人类社会发展划分为三次浪潮,即以“农业文明”为主导的第一次浪潮,以“工业文明”为主导的第二次浪潮,以“信息化”为主导第三次浪潮。[2]其中首次提出了“大数据”(BigData)一词,并且,以“第三次浪潮的华彩乐章”这样的用词对其进行热情的讴歌。[3]全球著名咨询公司麦肯锡于2011年5月发布了《大数据:创新、竞争和生产力的下一个前沿》报告,公认此报告宣告了大数据时代的到来。由于大数据概念的提出源于不断的发展实践,其本身并没有严格、权威的定义。通常认为,大数据的大即大数据集的规模一般应达到10TB左右,现在已经达到了PB级的数据量。维基百科称“大数据”是这样一个术语,即其是用以描述用传统的数据处理应用软件无法完好处理的庞大的或者复杂的数据集。但“大数据”这一概念并不仅仅指数据规模的庞大,还包括对这些数据对象的处理以及应用活动。IBM提出大数据通常具有“5V”特征:Volume(数据体量大)、Variety(数据类别多样)、Velocity(处理速度快)、Veracity(数据真实性高)、Volume(数据价值高)。[4]大数据技术分类并分平行关系,而是呈纵向、层级状结构,详见图1所示。

1.2软件工程简述

软件工程本身并没有严格、权威的定义。并且,也是直到20世纪60年代初才出现了“软件”一词,于此之前,更多的是程序的概念,后来人们认识到与程序相关的文档也有着相当重要的作用,才有了“软件”一词的出现。软件发展至今天,已经远远不是程序个体或者程序员合作的方式能够完成的,即使能够完成,也会是效率低下、程序运行可靠性差,或者说根本就无法完成。于是,在1968年召开的大西洋公约学术会议上提出了软件工程的概念,简单理解,就是以工程的方法来进行软件系统设计、开发、运行、维护、优化等技术的总和,进一步言之,就是用“计算机科学、数学管理科学等原理,以工程化方法制作软件的工程”,属于一门交叉学科。[5]通常认为其包含有四个要素:(1)软件工程目标;(2)软件工程范型;(3)软件工程过程;(4)软件工程原则。

2大数据与软件工程的结合方式

宏观上讲,软件工程是比大数据更为宽泛的概念,大数据的技术与应用被软件工程所涵摄。如图1所示意,虽然大数据的各项技术与应用属于垂直领域,而软件工程牵涉的是横向领域,更加关注软件产品及软件系统工程上的实现及其管理。但是,大数据无论是其产品还是其系统的完成与落地,都离不开软件工程方法论的支持。换言之,软件工程的方法与技术贯穿于大数据的开发与应用,大数据也只是在软件工程发展过程中出现的概念。软件工程开发具有综合性,其应用渗透于各个学科和领域,大数据的技术与应用当然是软件工程所关注和研究的对象,或者说大数据技术的每一环节都离不开软件工程的支持。大数据应用的基础是要依赖数据链条的完整性,采用相应的算法于海量的数据中进行规律分析,算法要依据相应的实际环境进行相应的升级,遵循开发的基本原理,充分调整数据分布,从而在研究过程中将大数据技术与软件工程方法结合起来。并在开放的环境中通过网络与通信技术实现数据的共享,在此过程中,软件技术和水平亦能得到进一步的提高。在二者相互作用渗透的过程,软件效率得到提高,软件效益得以提升,从而实现客户需求的最大化。在软件开发过程中,还需要有必备的硬件和软件的支撑,来支持相应的数据流,随着数据流的增长,对于硬件和软件就会有更高的要求。工程技术人员在对数据流进行分析研究的同时,专家学者还会对在线服务进行研究。但是,数据流是重点,包括对数据流的使用方法的研究,对支撑数据流的软件和硬件的研究。另外,从软件工程开发角度看,无论是在服务端还是在用户端,软件的运行当然会产生大量的数据流,都将产生大量的数据信息,这些数据流对于软硬件的使用寿命有着决定性的影响。因此,在软件工程的开发中,对于海量数据产生的环境下,更有必要做好数据流的管理,要高度重视数据流的分析研究,并且对于原始数据进行深入的研究也应该引起重视,以期延长软件的使用周期。[6]

3大数据时代的软件服务工程

软件服务工程即所谓的面向服务的软件工程,强调的是其相对于传统软件工程的扩展。近些年来得到了很快的发展,已经成为当今时代的主流社会需求之一,服务功能已经是软件开发的基本原则。另一方面,也可以将其直观理解为“软件(Software)+服务(Service)+工程(Engineering)”三个方面的交叉融合,或者软件工程与服务工程两者的融合等。其内涵可以理解为研究面向服务的软件工程原则、软件工程方法以及软件工程技术,同时利用相应的软件服务设施和平台,开发较高水平的软件服务系统。[7]软件开发者根据需求变化,在社会实际实用中,以面向服务作为主要建设目标。在开发的初期就要首先搭建好软件的框架,充分利用编程语言、构思好编程思路,确保开发软件能够提供可靠的服务应用,保障软件运行时的稳定与可靠。在实际的服务过程中,要求开发者运用分布式应用程序,以虚拟操作的方式提供用户相应的服务。在应用中,融合大数据技术,能够实现对数据进行编程,达到软件互操作的效果,并提高对数据的主动协调。软件工程开发工程师可以对数据信息共享,实现各种学习交流,对软件进行协同开发,并结合用户的反馈,对软件系统进行优化处理,提高软件的性价比。近年来,开源软件是较为成功的软件习作模式,但是,其采用常规的研究方法,应用价值还不是很高。与开源软件相比,群体软件工程属于一种分布式软件开发模型,能够依靠网络进行任务分配,并能实现创造性的查询,通过众包形式的开发,解决开发过程中的难题。并且,在整个开发过程中,众包开发可以贯穿其全过程。所谓众包,一如其字面含义,是一种分布式的生产开发模式和问题解决方案。通过该种方式,开源软件和商业软件均可通过网络进行任务和责任分配。[8]随着我国计算机科学技术的不断发展进步,软件工程技术也取得了长足发展,软件服务工程也支持得到拓展和延伸。在大数据时代背景下,我们应当加快大数据技术和软件工程技术的融合与创新,提升对海量网络数据进行编程处理的能力,提高软件的安全和效能,增强其稳定性和可操作性,进一步整合软件工程系统的集成度。

4数据密集型科研第四范式

图灵奖获得者、关系数据库研究专家詹姆士格雷(JamesGray)曾经从科学哲学的层面将人类科学研究模式总结划分为最初的实验科学阶段,之后的理论科学阶段,到通过模拟的方法进行的计算科学三个阶段,相对应地称之为科学研究的第一范式、第二范式、第三范式。但是伴随着模拟连同实验所产生的海量的数据,需要由软件处理这些由各种仪器或者模拟实验产生的海量数据,并将处理得到的信息和知识存储于计算机中。之后,科研人员只需要对这些存储于计算机中的少量数据进行分析研究,不再是直接通过仪器或者模拟进行研究。因而基于数据密集型科学研究独特的技术以及其显著的不同于以往研究的特点,詹姆士格雷在2007于其科研报告中提出了将这种数据密集型的科学研究模式从计算机科学类型中单独区分出来的思想,随之产生了一种被称之为第四范式的新的科研模式。该报告整理后题名“吉姆格雷论e-Science:一种科研模式的变革”,成为微软于2009发布的年首次全面对数据密集型数据进行描述的论文集《e-Science:科学研究的第四种范式》的开篇文章。[9]当前,相当多的计算机领域的专家学者对数据密集型科研第四范式予以了关注,并进行了相应的研究,探索出了相应的方式方法,第四范式的研究被认为是大数据时代背景下软件工程技术研发的关键。信息化的发展与渗透,导致一切的事物都在随之发生着变化。包括实验、理论分析和计算科学均在数据泛滥的影响下与之前大不相同,软件工程技术既要适应科研第四范式,又在其中扮演着更加重要的作用。传统范式下的目的与探索之间不能够很好地衔接,数据信息的应用效率难以保障,难以满足项目管理目标的实现。数据密集型科研第四范式下的技术以及理论相关内容,与大数据技术特别是其中的存储技术有着紧密的关联性,其待探索的空间和应用价值相当广阔,其数据信息研发急需相应的理论支撑,该范式下的软件工程技术应用模块,亦能够对其他范式下的数据信息进行分析,对于更好地实现数据的存储与处理,提升处理效率,有着重要的研究价值。在第四范式模式下,对集成密集型数据的软件服务价值进行评估是首要的,需要摒弃以往的数据统计方法,构建新的针对大数据进行信息统计和分析的方法,这对软件工程技术的发展起着重要的作用。在软件工程技术的研究中,应当更新传统理念,重视其对大数据的处理和分析能力,使软件产业呈现全新的面貌,从而亦能促进其对大数据的数据分析能力。在第四范式的基础上,亦能够更好地支持第三范式,甚至于第一范式。该范式研究在我国软件工程开发中还处于初级阶段,软件工程开发人员需在强化已有数据模型研究基础上,加速由第三范式向第四范式的转变,尽快实现其应用层面的服务价值。

大数据时代的数据分析范文第12篇

政府的责任是为大数据的应用提供良好的外部环境,而政府最重要的应对态度是重视和宽容

人民论坛:

大数据时代正在急剧改变话语权版图,那么政府应怎样做政治传播工作?

沈阳:

这是个比较宏观的问题。首先,舆情分析是政治传播的基础,大数据时代的到来为我们分析政治舆情提供了便利条件。过去数据的不足,制约了我们对相关舆情的准确分析。而微博上数据提供者的多样性,数据的海量、及时、动态、开放,有利于我们完善分析的效度和深度。

其次,在互联网时代的初期,我们的舆情研究都是比较简单粗放的。现在数据的海量爆发,可以使我们对特定的政治焦点人物、议题和追随者,展开更为精确的分析。另外,政府也可以更好地分析挖掘海量数据中的有效信息,为公众提供更好的公共服务。比如现在有的地方的公安部门已经把110报警平台与微博上该地范围内警情联系起来,通过及时发现微博中的相关信息,为公民提供更好的治安服务。

当然,以上我们讲的都是政府在应对海量数据爆发时的一些技巧性的东西。更为根本的是,政府平时只要做好了基本功,就能以不变应万变,毕竟政府并不是推动大数据应用的主力,在这样一个新兴的领域,富有创新精神的企业才是大数据应用的主力军。政府的责任是为大数据的应用提供良好的外部环境,而政府最重要的应对态度是重视和宽容,并不是直接上赛场要去做什么。

应当说大数据的应用刚刚兴起,真正的新兴事物,很难预料其准确的发展方向,能够准确预测的事物往往是已经逐渐成熟的应用。但是“万变不离其宗”,政府的一些基本应对之策还是我们一直强调的那些原则,要顺应技术发展潮流,提供宽松的产业发展环境。还是以微博为例,在前不久发生的芦山地震中,众人拾柴火焰高,微博上提供的海量数据极大地便利了救援信息的传播。通过微博进行定位,获取救援也成为灾难事件中新媒体良性运用的方式。此外,本次救援中媒体微博和企业微博的积极影响不可磨灭,救助提示信息不断转发,爱心接力一棒接一棒。而且从技术上看,用微博发布信息,这对拨打电话困难的灾区尤为关键。微博中的专业人士在本次事件中着力针对地方政府和媒体进行了监督。微博成为沟通国内外信息的主要渠道,地震当前,海外人士主要通过微博了解中国灾情,同时外国媒体和网友也通过微博传递正能量。上述事实都说明,正是微博为社会方方面面的力量提供了发声渠道,这些声音最终汇聚成很多有用的数据,而这些微博提供的大量数据,是政府花费多少精力也难以做到的。

在政府应对海量信息爆发方面,我们还要避免两个倾向。首先是,政治传播绝不仅仅是应对紧急舆情,许多重大的恶性网络舆情事件,并不是政府在应对技巧上的失误导致的,而是由于平时我们很多工作没有做好,很多应该引起重视的舆情被忽视,最终小事不断积累,演变成恶性舆情事件。所以我们不仅仅要掌握更多的所谓政治传播技巧,而是要充分认识到常识的作用,这个常识就是“功夫在平时”。对于官员来说,不能仅仅把微博当做一个作秀宣传的舞台,而应该把微博看作是一个开展工作、官民沟通的极佳平台,不能有网友骂就避之不及。

政府必须意识到,微博是坚持群众路线的新天地。这里汇聚了中国最广泛的民意,融入微博已经成为政府及政务人员了解民众,让民众了解自己的必要方式。微博问政,重在“问”字,这才凸显政府的态度。无论什么形式和载体的问政,暴露出来的仍然是官民关系的老问题。官民互信是双方互动的基础。微博平台是一个草根聚集的平台,“说官话、打官腔”的官样文章已经不适应于这一平台的交流。官员微博发言必须摈弃陈旧的话语体系,学会个性化、人性化表达。政府在网络中的劣势来自现实中的强势,所以政府应该在线下更多地和网友互动,对话而不是对决才是解决问题的方法。

当然,对于网友,我们还是要强调自律性,多提建设性意见,少渲染负面情绪。唯恐天下不乱,这种心态也值得批判。多样化获取不同来源的信息,也是更加接近真相的有效途径。此外确实还要意识到,网络信息披露的速度是远高于线下的调查速度的,我们需要监督政府使用正确的方法推进自身的改革,每一点进步都是值得鼓励的。

另外一个需要避免的倾向是,认为政治传播仅仅是宣传部门应该做的事情。这个认识在目前的互联网时代是极其片面的,更不可能成功应对未来的大数据时代。甚至应当说,应对大数据时代,宣传部门只是其中的很小一部分,更多的工作需要很多政府部门协同来做。仅仅要求由宣传部门来应对处理大数据时代爆发的海量信息是不可想象的。

目前已经出现很多专业数据挖掘和分析机构,利用微博平台收集海量数据

人民论坛:

普通读者对微博很熟悉,但不是很了解社交媒体与大数据的关系,您能为读者简单介绍一下微博等社交媒体与大数据的关系吗?

沈阳:

大数据时代来临的一个重要条件,是数据的海量增长,而微博等社交性媒体上的大量信息,是大数据的重要来源。微博的内容很简单、字数不长,因此微博使用者可以很简单地发布信息。而且随着智能终端的普及,人们可以随时随地发微博,这就为数据的大量爆发创造了条件。与大量公众发布的海量信息相比,专业媒体发布的信息量反倒成沧海一粟了。

目前微博需要用户注册才可以使用,而这一注册名称可以同样用于数以千万计的网站和第三方应用之中,这就为研究不同人群的行为提供了条件。另外,不同用户之间的互动形成了特定的社会网络,这使得我们可以对复杂的社交数据进行梳理,并从中发现一些规律性的东西。这样看起来很凌乱的用户网络行为,经过分析,反而会提炼出很有价值的数据。目前已经出现很多专业数据挖掘和分析机构,利用微博平台收集海量数据,对微博用户的言论和兴趣爱好进行分析,从微博“大数据”中挖掘价值。

人民论坛:

社交媒体中的大量数据是如何影响我们这个社会的?

沈阳:

大数据时代的数据分析范文第13篇

【关键词】分析系统;大数据;时代;运用

一、大数据时代背景

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,并成为至关重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来”。进入2014年,“big data”一词越来越多地被提及,时代寡头用它来描述和定义信息爆炸产生的海量数据,命名与之相关的技术发展与创新。数据正在迅速膨胀并变大,它决定着一个企业、一个行业、一个领域甚至一个国家的发展和未来,虽然很多个体和部门并没有意识到数据爆炸性增长所带来挑战和机遇,但随着时间的推移,人们将越来越清晰的认识到海量数据的重要性,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。

二、经验审计之弊端

本课题以具有大数据特征的人民银行国库核算业务为切入点,分别从审计抽样、线索发现、问题定性等多方面、深层次加以分析,显现经验审计之特点。为保证分析数据的科学性、连续性和逻辑性,课题组抽取了人民银行某地市中心支行2008至2013年期间,甲、乙、丙3名审计人员对国库核算业务审计资料,对比如下:甲审计员分别于2008年、2009年、2011年和2012年参加了对4家县支行国库核算业务审计,其中审计资料调阅重合度98.7%,线索追溯重合度95.4%,问题定性重合度98.4%,而审计方案覆盖率只有63.2%。乙审计员于2009年、2010年和2012年参加了对3家县支行国库核算业务审计,资料调阅重合度96.8%,线索追溯重合度95.3%,问题定性重合度97.9%,审计方案覆盖率为67.1%。丙审计员于2008年、2012年和2013年参加了对3家县支行国库核算业务审计,资料调阅重合度94.5%,线索追溯重合度96.4%,问题定性重合度97.2%,审计方案覆盖率为72.3%。

三、分析审计系统的优势

随着人民银行业务信息化进程的不断加快和数据大集中趋势的愈加明显,经验审计已无法满足基于风险控制的管理要求。为顺应内部审计工作发展,推动内审转型成果的有效运用,人行宝鸡中支积极探索应用计算机辅助审计系统(分析审计系统)开展大数据环境下的审计工作。2014年,宝鸡中支通过辅助审计系统对国库核算业务数据进行非现场查阅,重点运行“重要空白凭证领用情况”、“重要空白凭证跳号使用”、“预算执行情况分析”、“退库原因分析”、“支付方式退库原因明细查询”、“查复不及时”、“通过暂收款重拨”、“福利企业增值税退税”、“财政专户分析”、“大额贷记退汇支付业务”、“大额实拨资金业务分析”、“国库内部往来”、“会计主管授权日志分析”、“集中支付支出情况分析”等32个固化审计模型,完成了对3家县支行国库核算业务的全面覆盖,筛选提取重点关注数据1098条,现场审计核实风险隐患16类,共计37条,并实现了对审计方案的全面覆盖。

计算机辅助审计系统的有效运用一改传统盲目、经验的审计抽样方式,实现了审计范围的全面排查,最大限度的在海量数据中发现国库业务存在的薄弱环节,使审计工作方向明确、有备而来,审计疑点准确锁定、精确打击,大大节约了现场检查资源,降低了审计成本,提高了审计质量,改善了审计效果。

四、成果展示

2014年8月,宝鸡中支成立审计组进驻辖区某县支行,利用计算机辅助审计系统开展对县级国库核算系统专项审计,取得较好效果。

1.全面数据分析,筛选疑点线索

审前准备阶段,审计人员利用辅助审计系统非现场抽调了支行2013年至审计日的国库核算数据,根据数据分析组件对数据进行加工、筛选和比对。重点筛查了“重要空白凭证领用情况”、“重要空白凭证跳号使用”、“预算执行情况分析”、“退库原因分析”、“支付方式退库原因明细查询”、“查复不及时”等固化审计模型,初步筛选出需现场确认的可疑记录711条,按照风险类别整理导出文件32个。

2.强化疑点核实,核对凭证记录

现场审计阶段,针对审前提取的疑点信息,审计组有的放矢,调取疑点信息发生日及相邻日期的传票及账簿凭证,现场核对、深入挖掘、揭示风险。经核实后确认支行国库核算存在“福利企业退税监督不严”、“财政专户拨款审核不严”、“国库直接支付预算支出科目审核不严”、“预算单位国库集中支付覆盖率较低”、“对账制度执行不到位”等重要风险13个,涉及业务风险10类,迅速实现了对疑点问题的精确定性,起到了精确锁定,凸显风险,抓手明确,改善管理的审计目的。

大数据时代的数据分析范文第14篇

    传统方式下,孤立分析数据,单纯依靠经验发现问题,片面反映个别问题的技术方法已经无法适应企业审计发展的要求。企业审计需要全面采集与企业财务活动相关的数据,既包括财务数据,也包括业务数据和管理数据,既包括企业内部的数据,也包括主管部门、研究机构等的外部数据,既有财务数据、业务数据结构化的数据,也有会议纪要、政策法规等非结构化的数据;企业审计需要整体把握一个企业的整体情况,能够更科学、全面地评价一个企业,企业审计需要更准确的确定审计重点,能够在数据分析的基础上科学确定审计重点;企业审计需要更善于把握数据的规律和趋势,在发现企业现阶段存在问题的同时,更要能够揭示企业未来发展存在的风险和隐患。传统审计方式下缺乏采集管理、科学分析海量电子数据的技术,也就无法满足企业审计发展的新要求。

    面对大数据时代的来临,面对“大数据”所带来的新技术、新思维的变革,企业内部审计需要应时而变来适应商业模式、思维模式及数据处理模式的变化,从而影响了审计方式、审计抽样方法、审计评价模式、审计重点等。而内部审计人员不仅要能了解数据的变化以及数据处理技术的变革,更要能处理数据、分析数据、驾驭数据,要能够充分、及时地从大量复杂的数据中,辨认出对内部审计的意义与价值,并进而协助内部审计人员做出最佳的决策。“大数据”对企业内部审计的影响主要表现在以下几个方面:

    (一)审计方式由传统审计的事后审计、周期审计向连续审计转变。随着大数据技术的快速发展,审计方法和模式也在与时俱进。传统审计中,审计人员只是在完成财务报告或经过特定的周期或离职等情况的时候才进行审计,而且审计中并不是检查所有的信息,只是抽样分析。这种有限的检查对复杂的商业系统来说很难起到监督作用,而且传统审计的测试程序主要采用常规的方法关注被审计单位活动,包括数据、授权和执行等。企业如仍然采用这种审计方式,对于确认迅速发展的商务活动的真实价值或合法性显得过于迟缓;另外,从内部控制的角度来讲,我国目前的内部审计实务多是针对财务、会计事项,对经营活动、内部控制、管理事项的监督、评价极为有限,审计活动理念也多为“监督导向”型,而非“服务导向”型,公司部门间的不同流程缺乏衔接都使审计工作难以为经济活动提供全面的监控和服务。随着企业经济业务日趋复杂,信息技术迅速发展,企业电子商务和信息化建设逐渐成熟,越来越多的人意识到连续审计的重要性,而大数据技术及大数据基础使连续审计成为可能。连续审计可以降低传统审计过程中的浪费和时滞问题,降低审计错误和风险,促进企业发展。连续审计是信息技术与审计学科较好交叉融合的产物,是信息化条件下审计科学发展的必然,尤其对内部风险控制“实时性”要求极高的特定行业,如银行、证券、保险等金融和债务契约等行业中,实施连续审计监督迫在眉睫。某财产保险公司内部审计部门,已经在新开发的审计系统中固化了连续审计模块,该模块可以实现在线的风险预警,并安排专人进行日常数据式连续审计,将发现的风险数据、超预警值指标及问题登记为疑点,并建立审计底稿,按照重要程度进行远程审计、核实或下发给现场审计人员进行现场核实。该模块经过一段时间的使用,收到了很好的效果。

    (二)审计抽样开始系统化、模块化、智能化,并开始具有预测功能,而样本最终将扩展至数据全体。目前,常规审计工作已广泛采用随机抽查法,其意义用较小的投入来获得审计结论,提高审计效率;但利用抽查法所得出的审计结论存在着发生重大错误的可能性,其可能性的大小就意味着审计风险的大小。然而,数据量的爆炸式增长使审计人员意识到现行的抽样审计方法只是凭借审计人员的主观判断和实际经验对财务报表中的重大事项进行审查,而忽视了大量的业务活动,无法发现和揭示企业内部发生的、对财务报表真实性有重大影响的舞弊行为和技术性错误,难以对企业财务报表及经营管理做出准确的判断和评价。但是,庞大的企业规模和繁多的业务活动,致使审计工作难以回到详细审计方式,只能在抽样审计方法本身寻求改进。审计抽样开始向以下几个方向发展:一是审计抽样系统化。通过抽样系统增加审计抽样的实用性和效率性,为审计人员从大量的审计数据中抽取有用信息,为审计的预测分析提供依据,这样的抽样采用人工方式在海量数据的情况下是无法进行的;二是审计抽样模块化。通过模块化设计,审计抽样系统将得到最大的灵活性,以便抽样时采用各种模型组合便抽样更有效率;三是审计抽样的智能化。审计抽样系统将积极吸收审计、统计、计算机、人工智能等方面的最新研究成果,抽样模型及时得到更新,抽样经验在知识库中得到积累,审计抽样系统开始“学习”、“推理”,不断朝着智能化方向发展。将海量的数据经分析、预测等“加工”后,以知识的形式呈现给审计人员,为审计人员发现审计问题提供深度支持;四是审计抽样系统开始具有预测功能。随着大数据技术的发展,计算机的运算能力和处理速度不断提高。审计抽样系统会强大到处理复杂的运算,并利用大数据技术改进后的审计抽样算法来对这些审计数据进行分析并进行数据挖掘,找出特征数据,缩小抽取样本的数量,降低审计成本、提高审计效率;利用关联规则,预测被审计单位经营风险的高低,帮助审计人员确定审计重点,提高审计效率。通过审计信息系统所提供的庞大数据库可以实现对被审计单位的信息进行数据挖掘和综合分析,对被审计单位的财务及经营状况进行预测分析,为被审计单位提供决策依据。目前,某财产保险公司的审计系统,应用了大数据技术进行风险数据的提取,并应用PPS抽样、随机抽样、系统抽样、模型抽样、组合抽样等进一步提高审计效率。而在抽样模型中应用了汽修厂与驾驶员、报案人、定损员、收款人等的关联程度模型,伤者、驾驶员、报案人、联系人、领款人等的出险频繁度模型,人伤重复出险伤者、标的车多次与同一三者车碰撞出险等高风险模型,承保、理赔、财务系统非同一档案中上传相同照片等以“大数据”技术为基础的模型,收到良好的效果。

    然而,在不久的将来,伴随着以真实性、服务性为基础的各项企业内部审计的深化,随着数据信息化的深入以用大数据技术发展应用的深入,企业内部审计逐渐开始能够从大量的、杂乱无章的海量数据中发现潜在的有用的信息,能够从这些大量的数据中发现被审计单位运作的基本规律及特征;预测出被审计单位发展的趋势,从宏观上把握被审计单位科学地发展。审计也不仅仅局限于抽样审计,而是对企业所有财务、业务等经营数据的数字式连续审计。

    (三)促进审计成果的转化与应用。目前,内部审计成果应用主要是针对屡查屡犯的问题重点进行检查、督促整改,部分企业已经将审计成果应用闭环管理的手段对整改过程进行管理以达到良好的审计成果运用效果。大数据技术的出现,促进了审计成果的进一步应用。一是促进对以往审计中获取的大量信息资料和相关情况资料的汇总、归纳,从中找出财务、业务和经营管理等方面的内在规律、共性问题和发展趋向,通过汇总归纳宏观性和综合性较强的审计信息,以及运用审计成果,为各级领导提供数据证明、关联分析和决策建议,从而促进完善制度、机制、决策和执行,促进企业管理水平更上一层楼;二是促进问题的全面发现,即应用大数据技术可以将同一问题归入不同的类型使用,从不同的角度、不同的层面整合提炼以满足不同层次的需求。同时,通过对带有共性、普遍性、倾向性的问题进行挖掘,提炼出问题与数据中的关联性,可以将所有问题通过IT手段检查出来;三是应用大数据技术进行连续式审计有利于问题的整改监督;四是将审计成果进行知识化留存,通过大数据技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势、对问题进行预警等;五是将审计人员与审计成果、被审计单位与审计问题进行关联,并进行信息化备案,在进行下次检查时,可以根据审计方案中的重点,有侧重地选取有相应检查经验的审计人员组成审计组,并按审计目标抽取相应被审计单位进行重点审计检查等。

    总之,大数据并非被过度渲染的产业题材,大数据对企业内部审计的影响,既是应对企业数据集中模式、数据爆炸式增长趋势而进行的实时处理超量数据的技术升级,又是将方方面面的数据进行电子化、信息化,并将信息规则化、知识化,最终使各种应用网络化、智能化的过程;大数据更是一次从分散到集成、从共享到协同、从封闭到开放、从离线孤立到持久在线云服务、从专享到普适的挑战。

    主要参考文献:

    [1]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代中译本.浙江人民出版社,2013.

    [2]Bill Franks.驾驭大数据中译本.人民邮电出版社,2013.

    [3]陈丹萍.数据挖掘模式下的审计风险决策研究[M].中国社会出版社,2007.

    [4]陈福军.计算机辅助审计应用教程[M].清华大学出版社,2011.

    [5]《企业审计制度方法和技术建设》课题组.信息化环境下企业审计的技术方法[M].中国时代经济出版社,2011.

    [6]中国会计学会.企业内部控制自我评价与审计[M].大连出版社,2010.

    [7]陈倩雯.深圳审计研究成果论文选编:2010~2011[M].中国时代经济出版社,2012.

    [8]浙江省注册会计师协会.国际高级审计业务文集[M].中国财政经济出版社,2010.

    [9]上海国家会计学院.内部控制与内部审计[M].经济科学出版社,2012.

大数据时代的数据分析范文第15篇

传统方式下,孤立分析数据,单纯依靠经验发现问题,片面反映个别问题的技术方法已经无法适应企业审计发展的要求。企业审计需要全面采集与企业财务活动相关的数据,既包括财务数据,也包括业务数据和管理数据,既包括企业内部的数据,也包括主管部门、研究机构等的外部数据,既有财务数据、业务数据结构化的数据,也有会议纪要、政策法规等非结构化的数据;企业审计需要整体把握一个企业的整体情况,能够更科学、全面地评价一个企业,企业审计需要更准确的确定审计重点,能够在数据分析的基础上科学确定审计重点;企业审计需要更善于把握数据的规律和趋势,在发现企业现阶段存在问题的同时,更要能够揭示企业未来发展存在的风险和隐患。传统审计方式下缺乏采集管理、科学分析海量电子数据的技术,也就无法满足企业审计发展的新要求。

面对大数据时代的来临,面对“大数据”所带来的新技术、新思维的变革,企业内部审计需要应时而变来适应商业模式、思维模式及数据处理模式的变化,从而影响了审计方式、审计抽样方法、审计评价模式、审计重点等。而内部审计人员不仅要能了解数据的变化以及数据处理技术的变革,更要能处理数据、分析数据、驾驭数据,要能够充分、及时地从大量复杂的数据中,辨认出对内部审计的意义与价值,并进而协助内部审计人员做出最佳的决策。“大数据”对企业内部审计的影响主要表现在以下几个方面:

(一)审计方式由传统审计的事后审计、周期审计向连续审计转变。随着大数据技术的快速发展,审计方法和模式也在与时俱进。传统审计中,审计人员只是在完成财务报告或经过特定的周期或离职等情况的时候才进行审计,而且审计中并不是检查所有的信息,只是抽样分析。这种有限的检查对复杂的商业系统来说很难起到监督作用,而且传统审计的测试程序主要采用常规的方法关注被审计单位活动,包括数据、授权和执行等。企业如仍然采用这种审计方式,对于确认迅速发展的商务活动的真实价值或合法性显得过于迟缓;另外,从内部控制的角度来讲,我国目前的内部审计实务多是针对财务、会计事项,对经营活动、内部控制、管理事项的监督、评价极为有限,审计活动理念也多为“监督导向”型,而非“服务导向”型,公司部门间的不同流程缺乏衔接都使审计工作难以为经济活动提供全面的监控和服务。随着企业经济业务日趋复杂,信息技术迅速发展,企业电子商务和信息化建设逐渐成熟,越来越多的人意识到连续审计的重要性,而大数据技术及大数据基础使连续审计成为可能。连续审计可以降低传统审计过程中的浪费和时滞问题,降低审计错误和风险,促进企业发展。连续审计是信息技术与审计学科较好交叉融合的产物,是信息化条件下审计科学发展的必然,尤其对内部风险控制“实时性”要求极高的特定行业,如银行、证券、保险等金融和债务契约等行业中,实施连续审计监督迫在眉睫。某财产保险公司内部审计部门,已经在新开发的审计系统中固化了连续审计模块,该模块可以实现在线的风险预警,并安排专人进行日常数据式连续审计,将发现的风险数据、超预警值指标及问题登记为疑点,并建立审计底稿,按照重要程度进行远程审计、核实或下发给现场审计人员进行现场核实。该模块经过一段时间的使用,收到了很好的效果。

(二)审计抽样开始系统化、模块化、智能化,并开始具有预测功能,而样本最终将扩展至数据全体。目前,常规审计工作已广泛采用随机抽查法,其意义用较小的投入来获得审计结论,提高审计效率;但利用抽查法所得出的审计结论存在着发生重大错误的可能性,其可能性的大小就意味着审计风险的大小。然而,数据量的爆炸式增长使审计人员意识到现行的抽样审计方法只是凭借审计人员的主观判断和实际经验对财务报表中的重大事项进行审查,而忽视了大量的业务活动,无法发现和揭示企业内部发生的、对财务报表真实性有重大影响的舞弊行为和技术性错误,难以对企业财务报表及经营管理做出准确的判断和评价。但是,庞大的企业规模和繁多的业务活动,致使审计工作难以回到详细审计方式,只能在抽样审计方法本身寻求改进。审计抽样开始向以下几个方向发展:一是审计抽样系统化。通过抽样系统增加审计抽样的实用性和效率性,为审计人员从大量的审计数据中抽取有用信息,为审计的预测分析提供依据,这样的抽样采用人工方式在海量数据的情况下是无法进行的;二是审计抽样模块化。通过模块化设计,审计抽样系统将得到最大的灵活性,以便抽样时采用各种模型组合便抽样更有效率;三是审计抽样的智能化。审计抽样系统将积极吸收审计、统计、计算机、 人工智能等方面的最新研究成果,抽样模型及时得到更新,抽样经验在知识库中得到积累,审计抽样系统开始“学习”、“推理”,不断朝着智能化方向发展。将海量的数据经分析、预测等“加工”后,以知识的形式呈现给审计人员,为审计人员发现审计问题提供深度支持;四是审计抽样系统开始具有预测功能。随着大数据技术的发展,计算机的运算能力和处理速度不断提高。审计抽样系统会强大到处理复杂的运算,并利用大数据技术改进后的审计抽样算法来对这些审计数据进行分析并进行数据挖掘,找出特征数据,缩小抽取样本的数量,降低审计成本、提高审计效率;利用关联规则,预测被审计单位经营风险的高低,帮助审计人员确定审计重点,提高审计效率。通过审计信息系统所提供的庞大数据库可以实现对被审计单位的信息进行数据挖掘和综合分析,对被审计单位的财务及经营状况进行预测分析,为被审计单位提供决策依据。目前,某财产保险公司的审计系统,应用了大数据技术进行风险数据的提取,并应用PPS抽样、随机抽样、系统抽样、模型抽样、组合抽样等进一步提高审计效率。而在抽样模型中应用了汽修厂与驾驶员、报案人、定损员、收款人等的关联程度模型,伤者、驾驶员、报案人、联系人、领款人等的出险频繁度模型,人伤重复出险伤者、标的车多次与同一三者车碰撞出险等高风险模型,承保、理赔、财务系统非同一档案中上传相同照片等以“大数据”技术为基础的模型,收到良好的效果。

然而,在不久的将来,伴随着以真实性、服务性为基础的各项企业内部审计的深化,随着数据信息化的深入以用大数据技术发展应用的深入,企业内部审计逐渐开始能够从大量的、杂乱无章的海量数据中发现潜在的有用的信息,能够从这些大量的数据中发现被审计单位运作的基本规律及特征;预测出被审计单位发展的趋势,从宏观上把握被审计单位科学地发展。审计也不仅仅局限于抽样审计,而是对企业所有财务、业务等经营数据的数字式连续审计。

(三)促进审计成果的转化与应用。目前,内部审计成果应用主要是针对屡查屡犯的问题重点进行检查、督促整改,部分企业已经将审计成果应用闭环管理的手段对整改过程进行管理以达到良好的审计成果运用效果。大数据技术的出现,促进了审计成果的进一步应用。一是促进对以往审计中获取的大量信息资料和相关情况资料的汇总、归纳,从中找出财务、业务和经营管理等方面的内在规律、共性问题和发展趋向,通过汇总归纳宏观性和综合性较强的审计信息,以及运用审计成果,为各级领导提供数据证明、关联分析和决策建议,从而促进完善制度、机制、决策和执行,促进企业管理水平更上一层楼;二是促进问题的全面发现,即应用大数据技术可以将同一问题归入不同的类型使用,从不同的角度、不同的层面整合提炼以满足不同层次的需求。同时,通过对带有共性、普遍性、倾向性的问题进行挖掘,提炼出问题与数据中的关联性,可以将所有问题通过IT手段检查出来;三是应用大数据技术进行连续式审计有利于问题的整改监督;四是将审计成果进行知识化留存,通过大数据技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势、对问题进行预警等;五是将审计人员与审计成果、被审计单位与审计问题进行关联,并进行信息化备案,在进行下次检查时,可以根据审计方案中的重点,有侧重地选取有相应检查经验的审计人员组成审计组,并按审计目标抽取相应被审计单位进行重点审计检查等。

总之,大数据并非被过度渲染的产业题材,大数据对企业内部审计的影响,既是应对企业数据集中模式、数据爆炸式增长趋势而进行的实时处理超量数据的技术升级,又是将方方面面的数据进行电子化、信息化,并将信息规则化、知识化,最终使各种应用网络化、智能化的过程;大数据更是一次从分散到集成、从共享到协同、从封闭到开放、从离线孤立到持久在线云服务、从专享到普适的挑战。

主要参考文献:

[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代中译本.浙江人民出版社,2013.

[2]Bill Franks.驾驭大数据中译本.人民邮电出版社,2013.

[3]陈丹萍.数据挖掘模式下的审计风险决策研究[M].中国社会出版社,2007.

[4]陈福军.计算机辅助审计应用教程[M].清华大学出版社,2011.

[5]《企业审计制度方法和技术建设》课题组.信息化环境下企业审计的技术方法[M].中国时代经济出版社,2011.

[6]中国会计学会.企业内部控制自我评价与审计[M].大连出版社,2010.

[7]陈倩雯.深圳审计研究成果论文选编:2010~2011[M].中国时代经济出版社,2012.

[8]浙江省注册会计师协会.国际高级审计业务文集[M].中国财政经济出版社,2010.

[9]上海国家会计学院.内部控制与内部审计[M].经济科学出版社,2012.

友情链接