第一篇:大数据环境下的企业信用法律监管制度
大数据环境下的企业信用法律监管制度
作者:天天论文网 日期:2016-2-3 9:16:21 点击:0 摘 要:大数据环境下,企业信用呈现体态虚拟化与数字化、影响因素广平化与纵深化的新特点,而企业信用监管的法律、制度不健全,相关保障措施欠缺。应建立以企业信用基本法为基础的企业信用监管法律体系,并以中央为主导、地方为特色完善企业信用分类监管制度,提升大数据技术处理能力与企业信用监管水平,注重企业信用法律监管中权益保护的均衡性,做好企业信用法律监管的保障工作。
关键词:大数据;企业信用;法律;监管
计算机技术的发展和云计算技术的兴起使得大数据在社会经济生活中的应用不断加强与深化。大数据是一个相对比较抽象的概念,单是从字面来看就表示了数据之多之大,但其最主要的内含在于数据的全面性和不可穷尽性。截至目前,学界尚未对大数据形成统一的概念。一般认为,大数据是指数量巨大、类型众多、结构复杂、有一定联系的各种数据所构成的数据集合。[1]大数据的主要功能在于可以不断提升数据的使用价值,实现数据的快速流转和多样化的数据处理模式。大数据为企业的经营决策提供了更为全面详尽的数据支持,为企业的信用信誉建设搭建了新的平台和快速构建通道。
大数据技术的不断发展势必会对企业信用监管体系产生极大的挑战与冲击,同时亦会为其发展革新带来新的机遇,如何更好地迎接挑战,把握机遇就显得尤为重要。
一、大数据环境下企业信用新特点(一)信用体态虚拟化与数字化企业信用体系是包括企业信用信息的征集、确立、开发、建设在内的一项复杂的系统工程。大数据背景下,企业各方面信息的收集处理都以数字化进行。企业信用构建的过程中会涉及到政府、社会、其他企业及公民个人,大数据的应用可以将这一系列的内容进行虚拟化的量化处理。各信息源的流入及输出都在虚拟化的大数据环境下完成,不同的数据之间在数字化的虚拟空间里相互影响彼此作用,从而对企业信用的现实构建起着极为重要的作用。大数据通过对数据进行直接处理的流处理模式和对数据先储存后处理的批处理模式,对数据进行分析并利用恰当的方式将结果输送给终端用户。[2]企业信用状况以在政府、信用机构等方面的信用数据方式记录存在且这些数据都是以电子产品为载体虚拟化存在着的。
传统的企业信用监管业务是在有限范围内对企业的实体信用数据进行分析、处理,并以此为基础对企业信用行为进行规制,大数据在使得企业信用虚拟化的同时也为相关法律监管提供了全新视角。
大数据使得企业信用数据来源呈现出多样化、多层次的特点。大数据是信用数据规模几何性的扩增,其中包括企业为职工缴纳各项保险提供各种福利的数据以及企业从事社会公益活动,落实社会责任的数据。大数据可以收纳企业的法人信息、交易习惯、信用记录、纠纷投诉等一系列与信用相关的数据。这些数据看似分散且单位价值低,但通过运用大数据技术对数据进行交叉处理,提取分析后就会变成直接反映企业信用状况的直观表征。对信用数据的收集,传统上往往以企业主体的财务、人事等静态数据为基础,其信息收集的层次较为单一。而大数据环境下,对企业信用信息的涵盖是包括多个层次的,除了对传统的静态信息进行收集处理,还重视对交易习惯、行为特征等动态数据的规整运用,从而对企业信用体系的构建及信用状况的分析把握得更为准确稳定。
(二)信用影响因素的广平化与纵深化传统数据模式下,企业信用状况影响因素主要源于企业内部和企业外部两个方面:一方面源于企业自身的经营管理情况,包括企业内部财务会计处理、产品质量、社会责任的履行等对企业信用的影响;另一方面则源于企业外部的政府、金融机构、社会组织等对企业信用的监管、评级与记录。通过对企业内外部信用行为及评价进行定性化处理,形成有关部门对企业信用进行法律监管的基础和依据。在大数据环境下,企业信用的影响因素在传统基础上向着更广范围更深层次发展,影响企业信用的某一细小方面和小微数据通过不断地发散推广并进行数据的提炼处理而使得原有数据价值和作用被无限放大,形成规模集聚效应。
大数据环境下的企业信用是一种“数字化信用”①。具体而言,数字化信用基于数学算法,取得参与者的认可,将所有的参与者联系起来,其信用由全体参与者构成。[3]这时任何一个社会个体都可能成为企业信用的全体参与者之一,企业存在的基础是为社会提供商品或服务,在全球化环境下企业的产品可能会被延伸至世界的任何一个角落,该产品的受用者会对企业的产品做出自己的评价。当然,并非所有的评价都会进入数字化的处理程序,只有在借助计算机互联网技术将评价进行广平化分享传递的情况下才会形成企业信用数据的大数据源并构成企业的“数字化信用”的组成部分。
企业信用的影响因素在大数据作用下呈现出明显的广平化与纵深化的特点,对企业信用的法律监管亦应重视该特点,在监管的过程中注重对信用数据收集的广面覆盖与重点把握。
二、大数据环境下企业信用法律监管面临的新挑战(一)企业信用监管的法律、制度不健全1.相关法律规制不健全在法律方面,对企业信用的调控主要通过合同法、商标法、专利法、民法通则、反不正当竞争法等有关法律法规予以调整,刑法方面也有关于诚信的法律规定以及对违反诚信的刑罚制裁。通过一系列法律法规的规制对不诚信行为予以惩处,使企业的违法成本高于失信所获得的收益,从而以功利主义的角度对企业信用进行法律监管。但这些立法的目的都是为了规范一定的社会秩序和调整一定的社会行为,在司法实践中,对于企业守信行为的法律适用往往呈现出一种针对同一行为适用不同法律的混乱现象,不利于对企业信用进行针对性的监管。尤其是对大数据环境下企业信用全员参与的“信用数字化”方面的法律规范尚不全面,不能完全适应企业信用虚拟化和影响因素广平化、纵深化的新特点。另外,法律本身就具有滞后性,再加上现代科学技术发展的快速性,使得现存的一些实体法难以正确合理地适用于大数据环境下的企业信用监管。但现代法治的基本理念是不允许当事人通过法律行为而规避实体法的适用,即使不合理的法律也只能透过立法程序而予以改进。[4]这就要求进一步完善大数据环境下企业信用监管的法律制度建设,使得监管行为符合实体法的要求。
2.制度分类不完善在企业信用监管制度方面,有关分类监管制度也尚不成熟。各管理部门都出台了有关信用监管的文件,以期实现对信用的分类监管。早在2003年,国家工商总局和国家税务总局就分别出台了《国家工商行政管理总局关于对企业实行信用分类监管的意见》和《纳税信用等级评定管理试行办法》,同时,央行及劳动保障部门也开始进行征信活动以及企业信用等级评定。而由于部门间信息化建设、技术水平差异等原因,会出现数据共享滞后、信息融合度不高等问题。[5]虽然有关企业信用监管制度的文件早在十多年前就已出台,且随着时间的发展不断修改更新完善,但这些都与大数据下企业信用监管的实践差距较大。现有监管制度缺乏大数据环境下个人信用与企业信用之间的融合。很长一段时间以来,企业因为经营问题、管理问题以及不可抗因素导致企业资不抵债,此情形下,企业所有者携款潜逃的事时有发生,企业主个人的诸如作风问题、责任意识等因素对企业成败具有较大的影响。可以说,在企业的生产经营过程中,企业主的个人信用与企业整体信用是密不可分的。同时,作为企业产品使用者的用户能否对企业产品做出客观真实的评价,消费个人的信用行为也是与企业总体的信用息息相关的。然而,目前企业主的个人信用数据和消费者个人的信用数据与企业的信用数据是脱轨的,而且企业信用数据更新相对比较滞后,这都不利于有效的企业信用监管防范机制的建立。
(二)大数据环境下企业信用法律监管的相关保障措施欠缺1.企业信用法律监管技术和水平急需提高大数据给企业信用建设提供了新的发展渠道,与此同时也对企业信用的法律监管技术和水平提出了新的要求。当前,我国的信用监管水平不足以适应大数据环境下对企业信用进行有效规制的需要,大数据技术发展的迅猛性和不确定性也给有关监管部门提出了技术性的难题,除了监管法律制度不能适应大数据环境下企业信用监管新规律外,监管人员的知识和技术尤其是应对大数据的技术和能力还比较欠缺。在市场经济条件下,由于企业的趋利性,一些企业为了谋取非法利益会利用大数据下技术及法律监管漏洞扰乱市场监管秩序。尤其是在全球化下,人口流动量极大,市场经济交易具有极大的不确定性,经贸行为更多是发生在陌生人之间。“一般来说,处于陌生环境的个人对他人以及周围环境都无法产生一种切身的责任感和道义感,这就使他或她更易于从事一些在家乡或熟悉的环境中所不为的行为”。[6]在陌生交易环境下人们自律性极大降低的同时,再加上大数据技术所提供的虚拟性、隐匿性,个人及企业的信用行为监管更需要通过相应的技术手段予以加强。
2.监管过程中的信息安全与隐私保护意识需要加强大数据环境下信息量快速增加,信息规模急速膨胀。由于数据量大,在对各种数据进行集中处理的过程中容易发生数据遗漏,同时也容易出现数据的泄漏。大数据环境下,对企业信用的法律监管更是包涵了传统信用监管与大数据的双重特性,在监管的过程中如何保证数据的安全性、完整性以确保监管准确高效的进行是监管工作者应该重视的。同时,为了监管而收集的企业各种数据不可避免地会涉及到企业商业秘密及其他数据相关者的个人隐私。传统模式下,更多的监管是通过实体的定性化规制实现的,这是不能满足于大数据下信用监管的数字化特点需要的。适应大数据新时代的要求,强化对信息、隐私安全的保护意识才能顺利推进对企业信用的有效监管。
三、构建全方位、立体化的法律监管(一)建立以企业信用基本法为基础的企业信用监管法律体系大数据环境下,企业信用监管呈现出新的特点,需要更为细致完备的法律去对监管的各个环节进行规制,从而实现新环境下监管工作有法可依的状态。完善的法律监管模式应在包括消费信用、工商信用以及信贷等有关信用交易体系内形成全方位的、严密的监管法律。信用交易可以极大地便捷市场交易行为及夸大市场交易规模,有效地适应全球化贸易的需要。良性高效运行的信用交易必须形成于国家信用管理制度之上,而要形成健全的国家信用监管体系就必须健全信用监管的法律,完善立法。
在很大程度上,企业主个人的信用行为会影响企业信用,所以,立法应该将企业主的个人行为纳入企业信用监管体系内,对其进行并列监管并以个人信用行为为限对企业信用违法行为承担连带责任。
大数据环境下,国家最高权力机关更应加快制定规范企业主体信用行为,调整各个信用主体间权利义务关系的信用基本法。通过立法对相关主体的权利义务予以明确,为信用数据的收集、处理以及各主体信用行为的奖惩评判提供法律依据,在信用数据的来源、存储、使用的过程中实现全方位、立体化的监管。同时,应当在结合本国实际的前提下积极借鉴欧美等信用法制发达国家的有关立法经验,制定出可行性强、有效性高的本国信用监管法律。企业信用的相关者众多且各相关者所提供的有关该企业信用的数据是对企业进行信用监管的重要数据依据。信用表现为对民事主体经济信赖的社会评价,信用的客观表现是一种评价,这种评价是社会公众的评价,而不是当事人的自我经济评价;这种评价是对特定主体经济信赖的客观评价,它可能是但不一定是肯定性的社会评价。[7]在企业信用监管立法过程中要坚决贯彻诚实信用原则,诚实信用被奉为民法的基本原则,有“君临法域”的效力。
我国《民法通则》《合同法》中都明确规定了诚实信用原则是市场经济主体进行交易订立合同的基本原则,这就可以明确该原则同时也应成为建立企业信用基本法的基本原则。
(二)以中央为主导、地方为特色完善企业信用分类监管制度在完善企业信用监管法律的基础上,要在日常监管工作中实现对主体信用监管的法制化、常态化,就必须在中央政府的主导下形成全国性的、部门性的及地方性的可执行性强的企业信用监管制度,以彰显企业信用法律监管的实效。如将企业投招标等生产经营行为与企业信用记录结合,对信用数据记录不良的企业市场行为进行必要的限制;将企业失信数据进行累加并明确对失信企业的整改措施等。各地在中央的统一部署下应结合本地域特点完善地方信用监管机制,可根据本地的经济发展水平制定出地方性的企业信用激励机制,对信用良好、诚信度高的企业在制度允许的范围内予以税收优惠、财政补贴等倾斜;同时,应积极建立企业信用不良记录黑名单制度,对信用不良企业予以惩处并曝光,在全社会范围内营造守信获益、失信受损的氛围,以进一步激励企业乃至个人珍视信用,诚实守信。
对 企业信用分类监管制度进行完善,首先要充分利用大数据的优势,完善企业主体信用数据信息。当前,金融机构对个人信用信息的构建是比较完善的,在对企业信用信息的完善过程中可利用金融机构所具有的个人信用信息,对企业主、企业负责人、法定代表人、股东等与企业信用密切相关的个人信息进行收集融合。其次,在信用监管的过程中应对监管等级进行分类细化。对企业信用等级可采取平级制方法,分别设立A、B、C不同的信用等级,对企业信用进行量化管理,激发企业自主地进行诚信建设。
四、做好大数据环境下企业信用法律监管的保障工作(一)提升大数据技术处理能力与企业信用监管水平大数据环境下,要实现海量数据的有效整合,挖掘数据信息提升信息价值,就必须进行多种技术的协同。数据挖掘与收集、处理及分析是大数据下企业信用数据处理的主要过程,对数据进行挖掘、存储、使用时必然会涉及引擎搜索技术、云计算处理技术以及数据库技术等一系列的高新技术。所以,在大数据环境下要对企业信用进行高效监管,必须增强学习意识和技术观念,提高自身技能,才能对不法企业运用大数据技术扰乱信用监管秩序的行为进行有效监管,实现有的放矢,堵住不法企业钻技术漏洞的空子。同时,监管过程中还应提升根据现有数据对企业未来信用行为的预测能力,实现对企业信用动态的准确把握,防范于未然,将不法行为扼杀于萌芽状态,引导企业向着健康的方向发展。__在贸易全球化背景下,针对交易过程中一次性博弈现状和大数据下交易行为虚拟性、隐匿性的特点,应建立个人及企业信用跟踪机制,完善信用体系建设,实现信用数据信息的跨行业、跨区域乃至跨国界的共享。交易过程中主体双方信用信息的透明共享可以有效震慑一次性交易中的不诚信心理,有效防止欺诈行为的发生,同时也可为监管部门在信用监管工作中实行区别监管、重点监督提供有效依据。
(二)注重大数据环境下企业信用法律监管中权益保护的均衡性首先,要实现监管与发展之间的均衡。大数据环境下,由于信息影响的广平化与纵深化特点,对企业信用的监管有可能会影响到企业生产经营活动中的冒险意识和创新积极性。若对企业信用监管过度可能会影响企业创造力的激发,不利于市场经济条件下企业竞争力的迸发。对企业信用进行监管,要重视对大数据环境下信用数据隐匿性的运用,在虚拟化中对企业进行监管督促,实现监管于无形,不影响企业实体经济的发展。
其次,要实现信息归集与主体权益保护的均衡。大数据下要实现对企业信用的有效监管,就必须要全方位地对企业信息进行收集,在这一过程中对企业主体商业秘密和有关个人隐私的涉及是不可避免的。有关商业秘密和个人隐私是受法律保护的重要权益,在对企业信用监管过程中要重视数据收集处理与使用的程序及实体的合法性,规范信用监管行为。在赋予监管者权力的同时,要明确监管义务和违法行使权利力的法律责任,实现权力与义务、职权与职责的统一。另一方面,要保障被征信主体的合法权利并制定有效的法律救济措施,使其能在被监管的同时对监管行为进行监督,确保其合法权益的维护。
最后,要实现信用信息共享与信息安全保护之间的均衡。信息共享是实现大数据下对企业信用进行高效监管的基础,信息共享过程中的信息公开是各主体获取他主体信息数据的主要途径。计算机技术和数据挖掘技术的不断发展为不同主体间进行信息共享提供了便利方式,但数据开放性和技术安全性问题也为信息安全问题埋下隐患。有大数据环境下,如果对信息共享问题不加以法律监管及限制,企业及个人零散于各信息机构、电信或中介等部门的信息数据极易经由不法渠道被分享,并为不法分子所利用,进而从事推销甚至诈骗等一系列违法行为。大数据环境下,经汇总处理的信息数据甚至涉及到信息主体的各种隐私信息及法律保护的涉密信息,将非共享信息纳入共享平台可能会严重影响信息主体的实体社会经济活动,这也正是以互联网为依托的“人肉搜索”的可怕性之所在。
总之,在大数据环境下,企业信用信息安全保护面临着制度滞后与技术更新快速两大难题。信息共享下,企业信息安全保护需要在革新制度的同时改进技术保障措施,要明确可共享与不可共享信息的界线及可共享的范围,保证监管过程中的信息流向,技术上要不断研究并及时更新信息共享安全系统,对信息在收集、处理、使用、销毁的流程中进行全面的安全防护,防止信息外泄。充分利用大数据的优点,谨慎把握控制其可能带来的不利影响,在构建企业信用共享平台、对企业信用进行法律监管的过程中完善相关的法律法规,同时,对企业信息安全进行保护,提升大数据环境下企业信用法律监管的成效。
参考文献: [1]涂子沛.大数据革命历史现实与未来[M].北京:中信出版社,2014:85-86.[2]章红,郝嵘,关伟.大数据时代征信业发展思考与建议[J].福建金融,2014(2):36-39.[3]陈娟娟,侯娟.互联网金融背景下“数字化信用”与“传统信用”的交锋———第三方支付平台安全问题的新视角[J].海南金融,2014(7):24-28.[4]江平,周小明.论中国的信托立法[J].中国法学,1994(6):53-59.[5]童军辉.强化信用监管推进商事制度改革———兼论基于“大数据”背景的企业诚信制度构建[J].中国工商管理研究,2015(3):58-60.[6]苏力.法治及其本土资源[M].修订版.北京:中国政法大学出版社,2004:118.[7]吴汉东.论信用权[J].法学,2001(1):41-48.__
第二篇:大数据环境下初中信息技术教学浅议
大数据环境下初中信息技术教学浅议
【摘 要】作为社会最前沿的技术,信息技术在时代进步过程中不断发展。培养学生对信息技术的兴趣和意识,让学生掌握处理信息的基本技能,是初中信息技术课的主要目标。那么教学实践中如何践行这一目标呢?笔者通过本文简谈之。
【关键词】初中;信息技术;教育教学
信息技术由于具有较强的实用性和实践性,已经被纳入到中学素质教育中,并以培养学生计算机知识应用能力为主要目标。随着大数据时代的到来,中学信息技术教学既获得了机遇又需面对挑战,而怎样在机遇和挑战中提升教学有效性、改善教学现状,成为每个中学信息技术教师需要思考的问题。那么如何实施信息技术的教学呢?
一、注重培养学生的信息素养
在信息化社会的今天,信息素养已成为科学素养的重要构成部分。迅速地筛选和获取信息、准确地鉴别信息、创造性地加工和处理信息,将是所有社会成员应具备的、如同“读、写、算”一样重要的,终生有用的基础能力之一。对于21世纪的学生来讲,我们应努力培养他们基本的“信息素养”。
1.获取信息的能力。能够根据自己的学习要求,主动地、有目的地去发现信息,并能通过各种媒体,如互联网、书籍、报纸、电视等,或者自己亲自调查、参观等,收集到所需要的信息。
2.分析信息的能力。能够将丰富的获取到的信息进行筛选鉴别自己所需要的信息,判断它的可信度,然后对认为真实有用的信息进行分类。
3.加工信息的能力。将不同渠道获取的同一类信息进行综合,结合自己原有的知识,重新整理组织、存储,并能够简洁明了地传递给他人。
4.利用信息的能力。利用所掌握的信息,使用信息技术或其他手段,分析、解决生活和学习中的各种实际问题。
我们要充分利用学校教学的优势,通过各种形式的教育,使学生将上述信息的获取、分析、加工、利用等能力,内化为自身的思维习惯和行为方式。而在所有形式的教育中,创设一个在实际生活学习中使用信息技术解决问题的学习环境,是培养学生“信息素养”的关键。
二、注重学习兴趣的培养
教育家苏姆林斯基曾说过:“学习兴趣是学习活动的重要动力。”学习兴趣是学生基于自己的学习需要而表现出来的一种认识倾向,它在学生的学习中具有重要的作用。开始学习信息技术课时学生往往怀着好奇、兴奋的心理,但随着学习内容的深入,有的内容需要机械重复地训练,有的内容枯燥无味难度大,这样学生的学习热情就会慢慢降下来。根据建构意义新的学习理论,教师应由知识的传授者、灌输者转变为学生主动建构意义的帮助者、促进者,要充分激发学生的学习兴趣,帮助他们形成正确的学习动机。因此,教师要采取灵活多样的教学方式,激发学生的学习兴趣和主动探索的愿望。
三、培养学生的创新意识和创新能力
当今世界正在进入知识经济时代,知识的不断创新,高科技的迅速产业化,使得经济持续增长。而在这一时代,起核心作用的是知识创新,它是技术创新的基础,是技术进步和经济增长的革命性力量。因此二十一世纪需要的是有创新意识、具有创新精神和创新能力的人才。这就要求教育者,在教育过程中注重开发学生的创造潜力,鼓励启发学生主动思考,善于思考,学会独立思考,突出创新意识的培?B,强调创新能力的提高。
培养学生的创新意识和创新能力,首先要为学生创造尽可能多的环境和机会,给学生留有更多的思维空间,不须面面俱到,包办学生所做的一切。只有在自主学习的环境里,学生才有可能发挥创造性,体验创新的乐趣。例如:在讲WORD图文混排时,需要用到绘图工具栏,我只是把工具栏上重点工具,如阴影、三维效果、填充、自选图形等提示了一下,具体的操作留给学生自己完成。学生们凭着他们敏锐的观察,丰富的想象,做出了一幅幅好的作品。后来我对几副想象力丰富的作品给予了表扬,课堂气氛达到了高潮。在亲自实践的过程中,他们的创新意识和创新能力得到了充分的体现。
四、注重与其他学科的整合
信息技术课程的目的之一就是培养学生获取信息、处理信息的能力,而相应的信息应是与中小学生各科的学习内容相关的知识,这就产生了信息技术课程如何与其他学科课程整合的问题。课程整合是指用不同课程的素材和能力整合在一起,使学习的目标处于一个具体的,现实的情况,要求用到多种知识和能力。现代教育引入了以计算机为主的信息技术教学手段,提出了以超媒体方式组织教学信息的思想,这就为信息技术课程与其它学科课程的整合提供了理论基础和技术手段。
将中小学信息技术课程与其他课程整合,就是以其他学科知识的学习作为载体,把信息技术课程作为工具和手段渗透到其他学科的教学中去,从而在学习信息技术课程的同时,又能培养学生解决其他学科问题的综合能力。结合初一语文教学,我校采用的“计算机与语文识字教学整合”就是一个比较成功的例子。它主要是利用多媒体识字教学软件,让学生观看生字的笔画、笔顺、部首、间架结构、正确读音和汉字编码,同时跟随教学软件进行听、说、读、写、打(打字)的训练,通过人机交互进行自我学习、自我检查和自我提高。
五、注重青少年信息道德的培养
在信息技术蓬勃发展之际,人们往往只看到了它所带来的巨大利益,而忽视了信息技术中某些不利因素给青少年成长造成的干扰和不良影响。例如:在互联网上除了大量丰富的学科知识外,也有许多不健康的内容,有时还有计算机犯罪,计算机病毒肆虐等,而这些正是信息技术教育中容易忽略的问题。因此在学习网络这一章时,我不仅要讲解因特网的优秀之处,而且不断向学生渗透思想品德教育,培养学生健康的信息意识和信息伦理道德。
六、总结
随着信息社会的发展,教育信息化的实现,对教育既是机遇又是挑战,从培养模式上提出了更高的要求。在培养目标上,要求德智体美全面发展,具有高度创新能力和使用信息化手段能力;在培养内容上,教育需要对课程结构和教学内容进行改革。主要侧重在使学生掌握学习的方法,使每一个受教育者都具有自我获取知识和更新知识的能力;在培养方法上,教育需要更新观念,要寻求新的模式和传播手段,以适应终身教育,全民教育的需要。
第三篇:大数据环境下网络舆情管理方法研究
大数据环境下网络舆情管理方法研究
摘 要:随着互联网技术的快速发展及其广泛的应用,网络舆论信息的产生体量、传播速度和影响范围等方面都发生了巨大变化。这些变化要求舆情管理工作者在舆情管理理念、管理方法等方面必须与时俱进。大数据既是一种新技术,也是一种新方法,它侧重于信息挖掘和预测。将大数据运用到网络舆情管理工作之中,必将对舆情管理产生重要作用。在大数据环境下,网络舆情的管理方法也必将发生变革与创新。探讨大数据环境下网络舆情分析方法,以大数据为背景和前提创新网络舆情管理方法,总结大数据下舆情管理理念、视角、方式和方法等方面的变革与创新的思路,具有重要意义。
关键词:网络舆情;大数据;管理方法;变革与创新
DOI:10.15938/j.cnki.iper.2017.01.025
中图分类号: G641文献标识码:A文章编号:1672-9749(2017)01-0124-06
据《第37次中国互联网络发展状况统计报告》(由中国互联网络信息中心(简称:CNNIC)在2016年1月发布)显示,截至2015年12月,中国网民规模达6.88亿,全年新增网民3951万人。互联网普及率为50.3%,中国手机网民规模达6.20亿,手机上网使用率为90.1%[1]。随着移动互联网(Mobile Internet)、社交网络(Social Networking)、电子商务(Electronic Commerce)等的迅速发展,互联网的边界和应用范围有了极大扩展,各种信息和数据极具增多,并正在迅速膨胀变大。
网民们经常通过互联网表达意愿、观点,讨论各种话题,以表达自己的思想观点和诉求。互联网既是一个收纳器,聚集网民思想动态表达、文化和社会生活信息;又是一个扩音器,传播大众的社会舆论。在社交媒体时代,人们通过互联网平台表达社情民意,体现自己的意愿、态度和评论观点。舆情作为社会舆论的一个风向标,开展舆情分析主要是针对民众态度、观点的收集整理,分析出民众相关的意见倾向,客观体现舆情动态。
作为世界上网民数量最多、互联网访问量最大的国家,有效地分析网络舆情,对于政府,媒体、大型企事业单位都有着非常重要的意义。从政府的角度,有效的舆情管理有利于政府了解公众态度和诉求,有助于提升政府的政务管理和构建良好的社会和网络环境;从企业的角度,有效的舆情管理有利于企业掌握用户和大众对产品质量、产品功能与服务的评价及客户特征信息,更好地提供个性化产品与服务,实现利润增长,更有利于企业了解用户和大众对企业社会形象的反馈和认知,提升企业品牌知名度和社会声誉;从媒体的角度,有效的舆情管理能够突破传统信息搜集和发布渠道,更能够通过对公众舆论深入分析,提升新闻效果,实现新闻价值增值。因此,社会各界都非常重视网络舆情分析,并不断创新舆情的分析和管理的方式和方法,都是想最大化舆情的价值。
一、大数据及网络舆情的相关定义及特点
1.大数据的定义及特点
随着人们对大数据的研究和理解的不断深入,大数据已不仅仅是一个技术方面的名词了。而今,大数据相关的理论无论从内涵还是外延上,都在不断丰富和充实。关于大数据的定义,不同的机构和学者从不同的角度给出略有差异的定义:如高德纳咨询公司(2013)提出,大数据是指具有更强的洞察力和流程优化能力的海量、多样化的信息[2]。维基百科对大数据的定义是“一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集”。Gartner对大数据的定义:“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量高增长率和多样化的信息资产” [3]。
IDC市场研究公司2012年提出,“大数据”是为了从大容量的、不同类型的数据中获取有价值的信息而设计的新型架构和技术[2],并对大数据的采用三步法进行了界定,如图1所示。首先,从数据源场景方面,可以有三种情况,或者说需要具备三种情况至少满足一种,即大数据的容量大于等于100TB或数据源于超高速的数据流(Data Streaming),或数据产生的年增速大于60%;其次,必须部署在可动态适应的基础设施(dynamically adaptable infrastructure)上。这里的基础设施既可以是传统的scale-up架构,也可以是水平扩展架构(scale-out infrastructure);最后,必须有两个以上的数据源或数据格式,或者高速流数据源(如点击流或机器产生的数据流)。有了以上三个步骤的界定,才可以形成大数据。IDC指出“大数据技?g描述了一种新一代技术和架构,以非常经济的方式,以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值” [2]。
尽管对大数据的定义角度各有不同,但大数据的核心本质和特征的表述和定义相对比较统一,均认为大数据与传统意义数据具有本质区别。较传统数据相比,在数据基础上,大数据更倾向于全体数据而非抽样;在分析方法上,更强调相关分析而非因果分析;在分析效果上,追求的是效率而非绝对精确和在数据规模上强调相对数据而不是绝对数据。
在数据和信息的规模/体量方面、在内容形式和数据结构方面具有复杂性/变化频度多样、在产生速度方面及价值密度等四个方面都极大地超越了传统的数据形态,具有4V特征:
第一,数据规模大(Volume)
第二,数据种类多样(Variety)
第三,数据处理速度快(Velocity)
第四,数据价值密度高(Value)
如图2所示:大数据的4V特征。
具体而言,一是数据规模大(Volume):从容量角度,大数据具有数据容量大,“容量”或“体量”,从 TB→PB→EB级,每级都是按照进率1024(2的十次方)计算,这足以说明大数据规模之庞大。二是数据种类多样(Variety):结构化数据、非结构化数据以及半结构化数据,Web数据、文字、语音音频数据、图片图像数据、视频数据、模拟信号等数据都体现了数据的多样性。三是速数据处理速度快(Velocity):对数据访问、处理、交付等速度的要求快,而且数据产生速度也非常之快;四是价值(Value):大数据的核心价值在于资源优化配置,通过搜集海量数据,进而展开全量数据挖掘,分析数据背后的相关性,开展预测分析,获得数据的应用价值。
这些特性使得大数据与传统数据区别开来,强调了大数据是具有结构松散性、形式复杂性和有利用价值的数据信息资源[3]。
2.网络舆情的定义与特点
“舆情(Public Opinion)”翻译为“民众或公众的意愿、意见或观点”。根据百度百科:舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众?ψ魑?客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
有学者从社会学视域考察舆情的定义,认为舆情是指社会各阶层民众对社会现象或事件所持有的情绪、态度、观点、看法、意见和行为倾向等[4]。网络舆情则是社会总体舆情的一个组成部分,是以网络为载体存在,以网络传播方式汇聚、形成和表达的舆情,是在互联网上的民众情绪、态度和意见汇聚的总和[5]。
网络舆情的信息来源主要有:网络新闻(如:搜狐、新浪、人民网,或以RSS为基础聚合类新闻,如头条等),论坛贴吧(如:BBS,百度贴吧,天涯,西祠胡同等),新闻评论,社会化媒体社交网络(即时通讯工具:如:聊天室、QQ、微信、微博、博客等),搜索引擎(如:百度,google等),网络发起线上活动、网络调查、电子邮件等。
通常我们把网络舆情的基本特征概括为自由性与可控性、互动性与即时性、丰富性与多样性、隐匿性与外显性、情绪化与非理性、个体化与群体极化性[6]。如图3所示:网络舆情的特征
3.大数据是网络舆情管理的有效方式之一
大数据的目的在于发现新的知识与洞察并进行科学决策。大数据与网络舆情具有非常相似的特征。从这点上可见,利用大数据的手段管理网络舆情是网络舆情管理的有效方式之一。首先,大数据能够全方位记录民意,完整展现社会舆情,大数据体量巨大,从TB级到PB乃至ZB级别,能够完全、完整的记录社会民众的社情民意;其次,大数据的特点是挖掘数据背后的相关联性,因此,大数据能精准体现舆情背后的事件、相关人员以及读者等要素内在逻辑和社会关联;最后,大数据具有很强的预测能力,通过分析事件的读者特征(群体肖像刻画)、被关注程度/热度、传播速度、传播范围、发展趋势、影响程度和网民情绪变化等,也可以针对某个观点的深度研究,从而预测舆情走向,帮助决策者进行决策和判断。因此,大数据技术为网络舆情的预测提供了重要的技术、理论支撑和保证,也成为舆情研究关键技术的支撑和核心概念。
二、基于大数据技术网络舆情管理的一般步骤与方法
网络舆情的管理模型主要分为:信息采集、信息预处理、舆情分析、舆情报告四个步骤。如图4所示:大数据管理模块及流程示意。
1.信息采集
信息采集当前常用方式是网络爬虫技术。在网络爬虫的爬行策略中,应用最为基础的是深度优先遍历策略、广度优先遍历策略。对于信息抓取过程,要求信息抓取的覆盖范围要全面。高速发展的信息高速路使得网络信息数据容量不断增大、信息和数据的类型更加丰富和复杂、网页数量不断增多,这对舆情信息抓取的效率和全面性提出了更高的要求。
大数据网络舆情信息搜集改变了传统网络舆情信息的搜索采集方式,采用定向站点信息抓取辅以全面的实时监控、聚合内容(RSS)、社交网站信息搜集和摘要搜集等搜集技术,与传统人工监测采集相结合的方式进行,抓取效率和覆盖范围都有突破性进展。
数据监测要全面和实时,要做到精细采集信息数据。笔者整理了较为常用的监测范围和基本监测指标,如表1所示。
2.信息处理
信息处理主要包括数据清洗(Data Cleaning)、信息提取、文本分类等。信息处理的主要任务是将采集的各种信息转化成格式化文本存入数据库。
网络舆情在大数据环境中流动和变化速度非常快,因此,在信息处理部分,要求信息处理的时效性。
3.舆情挖掘与分析
大数据分析就是对海量数据进行分析、梳理和加工,获得具有价值的产品(Product)和服务(Service)或深刻洞见(Insight)的数据及处理方法。数据分析的主要技术手段是采用数据挖掘(Data Mining),数据挖掘又称数据库中的知识发现,即从数据库的大量数据中揭示出隐含的、前所未有的并具有潜在价值的信息的价值聚合、提炼的过程[7]。
舆情分析的技术方法主要有文本分类、聚类分析(不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别)、热点发现(利用关键词过滤、语义分析、数值统计识别热点和敏感话题)、话题识别、主题检测与跟踪、观点/文本倾向性识别和分析(对文章的观点进行倾向性分析和统计,识别正负面信息)、自动摘要等计算技术挖掘网络文本内容蕴含的各种观点(Opinion)、喜好(Preference)、态度(Attitude)、情感(Emotion)等,也可以明确网络传播者的意图和倾向,以及影响程度、影响范围和发展趋势。
当前一些实验室、研究机构等依据大数据分析的方法和实际的工作相结合,开发和建立了以下舆情专属的分析模型和方法。如:人民网推出的“舆论共识度”指数将为中国网络舆论场的研究和社会舆论的理性引导提供新的观察视角和决策依据。它把网络用户分为媒体、网民和意见领袖三大群体,通过对不同群体的舆论分析,对每月前十或前100的社会热点问题进行评估,形成“舆论共识度”,进而对用户对舆论话题的共识程度进行评价。
互联网与国家治理研究中心、中山大学大数据传播实验室设计的“网民认知模型”,通过透析网民对不同事件的情绪变化、态度偏向等,评测用户“正负能量”,分别从“网民情绪指数”“网民理性指数”和“网民态度指数”三个维度来评价具体热点事件当中网络舆论场的“网民正能量指数”,对舆情分析和研判也非常有帮助。
还有机构建立的热度评估指数,通过话题在传统媒体报道量、网络媒体报道量、微博量、论坛帖文量、博客文章量,转发数量、用户跟贴数量、评论数量、被关注数量、传播的速度和范围、关注的用户形态特征等相关数据,之后加权各项指标,得到每个热度事件或话题的综合热度指数。
更有一些专项深入分析,如针对传播源头的分析、传播渠道的分析、意见领袖的分析、传播主体挖掘分析或针对隐性数据(网络日志)的分析。
也有专家学者提出,舆情分析需要是一个综合分析模式,以大数据的方式为重点,同时要结合专项话?}市场调研、综合民意调查(定性与定量)、软件与人工、分析师与专家会商等方式相结合的方法来分析。
4.舆情报告
舆情分析的结果需要以报告的方式呈现,并将分析报告反馈或发布,为用户、管理者和决策者提供依据。
舆情报告要求舆情分析数据要真实可靠,分析方法要恰当准确,描述要符合客观事实,结论要简明扼要、通俗易懂。舆情报告中恰当采用示意图、图表、列表等展示形式,可以更形象、清晰、直观,并且更逻辑地展示舆情事件的发生、发展和变化,舆情的发展态势等。针对不同的表达目的可以选用不同的图表或图示方式,如:描述事件发展趋势可用折线图表示、展示用户立场或观点的比例可用饼状图、体现热点人群的分布可以用散点分布图、表示频率分布可以用网状图或柱状图、说明事态发展变化可以用流程图、用户之前或背后的人际关系可以用网状关系图等。丰富的图表工具可以更形象、生动的表述舆情的现状、发展和变化。
三、大数据环境下舆情管理模式变革与管理方法创新
虽然,目前对大数据研究越来越热,国内诸多大的互联网公司、各行业内的企业及科研机构都投入了巨大的人力、物力开展大数据及大数据下舆情研究,但在我国大数据研究依然处于探索阶段,在很多方面还只是停留在理论或对未来的畅想阶段。例如:在技术方面,目前常见的舆情监测工作的主要手段仍以人工检索为主,尽管也使用了市面相对成熟的相关搜索软件进行辅助搜索,但搜索舆情的技术仍采用传统的二维搜索方式,即主题关键词和网络平台二维坐标,由舆情管理的工作人员对采集的信息进行二次加工成舆情产品。而且搜索的舆情信息结果多为一级文本信息,对于深层次的多级舆情信息,如新闻、微博后的评论,网民的社会关系,网民针对某一事件评论反映出的情绪变化等数据无法深度挖掘,仍靠人工采集和分析判断。受制于舆情分析人员的知识水平和价值判断的不同,极有可能导致有价值的舆情信息丢失,无法准确及时预测舆情走势,大大降低了舆情监测工作的效率、准确性。
随着互联网的发展、自媒体的兴起,网络、通信技术在人们信息领域深入运用,发布者在人口统计学方面的特征、发布的载体、发布的形式、传播渠道、信息的数量和形式等有了全新的变化,这对舆情的管理提出了更高的要求,要求变革网络舆情管理方式以适应大数据时代的新形势。因此,舆情管理工作者在舆情管理的理念、模式和方式方法上均需要有相应的变革与创新。
1.舆情工作者的研究视角需要发生转变
舆情工作者要从全局角度,把舆情研究从单一向度的内容研究向多元化、多向度内容及关系研究方向转化。网络数据和信息背后体现的人的行为轨迹和复杂的人与人的社会关系(Social networking),所以关系研究将成为未来的研究重点。大数据的特征之一“关联分析”,通过社会话语表达、社会关系分析、社会心理描绘、社会诉求预测等多个角度[8],进行多向度的分析研究能够帮助构建立体化、全局化和动态化的网络舆情数据系统,通过舆情分析,挖掘网络舆情和社会动态背后的深层次关系,实现网络舆情管理和社会治理的紧密联动、同步推进。
2.舆情的研究方法需要创新
即便是研究的视角发生了改变,要想真正落实到具体工作中,研究方法的创新尤为关键。要在分析方法上更加丰富,结合数据挖掘技术分析(Data Mining)方法与行为分析(Behavior Analysis)方法的研究、结合云计算、移动可追塑性分析、个性化特征识别的网络机器人与社会心理分析实验因果模型等方法,一是要提升数据监测技术,实现对媒体、论坛、博客、微博、微信等各个网络平台数据的全面抓取和记录,特别是要提高对图片、音视频、模拟信号等数据的自动识别能力;二方面提高数据挖掘技术,从海量数据中快速识别有价值数据,并挖掘数据背后隐藏的规律。三要注重数据分析技术,包括关联分析、聚类分析、语义分析等等,自动分析网上言论背后的观点、意见倾向和信息、相互之间的关联性,揭示舆情发展趋势。四是确保数据安全和保密技术,包括网络攻击与攻击检测与防范问题、安全漏洞与安全对策问题、数据备份与恢复问题、灾难恢复问题等等,确保数据安全和保密[9]。
在数据分析方面,数据分析的准确性尤为重要。引入云计算的概念和技术,与大数据相结合,会使舆情分析更加准确。开展数据间、不同维度、不同领域的数据、多样化的数据间的关联分析,是十分重要的。专家认为舆情关联关系是网络舆情数据库中存在的一类重要的、可被发现的知识,引入网络舆情支持度和网络舆情可信度,可以更准确表示网络舆情间的关联度,量化网络舆情关联规则的相关性,从而使挖掘结果更准确。
3.研究结果要易懂、易应用和可视化呈现
大数据的真正价值是运用,舆情的最终价值是指导工作。研究结果的使用者未必是大数据和舆情分析的专家。因此,研究结果要求易懂易识,界面必须友好,结果必须可以直观识别。“用数据说话”。数据最有说服力,由于图表与列表能够清晰、直观、简洁、深刻、形象地表现舆情事件,因此舆情的研究结果要注重运用图表等可视化方式来展现。
4.重点强调舆情的预测,面向未来,做好舆情数据的再利用
大数据的核心是预测,未来舆情研究的重点应由舆情监测转向舆情预警和预测。舆情工作者通过收集分析互联网上关于社会热点或网民关注焦点事件的大量消息报道,发掘背后隐藏关系,进而预测事态发展趋势,为舆情事件处置提供决策参考。
展望未来,大数据时代数据使用的关键是数据再利用,数据再利用的意义在于:挖掘数据的潜在价值,实现数据重组的创新价值。基于大数据的舆情分析,能同时分析更多数据,揭露更多隐藏价值,使预测更准确,决策更合理。未来大数据将使舆情监测功能大大丰富,舆情分析功能更加强大,舆情预测能力进一步增强,这将实现全方位、立体式的综合舆情管理模式,实现舆情管理的价值最大化。
参考文献
[1] 中国互联网络信息中心(CNNIC).第37次中国互联网络发展状况统计报告[EB/OL].[2016-01-22].http://www.xiexiebang.com/hlwfzyj/hlwxzbg/hlwtjbg/201601/PO***51954.pdf.[2] 谢耘耕,刘锐,乔睿,等.大数据与社会舆情研究综述[J].新媒体与社会,2014(4):133-154.[3] 张宁熙.大数据在突发公共事件网络舆情信息工作中的应用[J].现代情报,2015(6):38-42.[4] 王宏伟.舆情信息工作策略与方法[M].北京: 中国人事出版社,2012:6.[5] 戴维民,刘轶.我国网络舆情信息工作现状及对策思考[J].图书情报工作,2014(1):24-29.[6] 刘毅.网络舆情研究概论[M].天津: 天津人民版社,2007:74.[7] 喻国明.大数据分析下的中国社会舆情:总体态势与结构性特征――基于百度热搜词(2009―2012)的舆情模型构建[J].中国人民大学学报,2013(5):2-9.[8] 李小娜.大数据时代社会舆情监测的转变和发展[J].青年记者,2015(11):69-70.[9] 卿立新.创新大数据时代的网络舆情管理[J].红旗文稿,2014(22):28-29.[责任编辑:张学玲]
第四篇:大数据助推银行业监管
“大数据”助银行业监管
——现场检查系统在湖北的实践
基于数据大集中的监管手段——现场检查系统(EAST系统)应运而生。现在,运用EAST系统进行建模分析,从系统中直接筛选符合条件的信息,实时跟踪数据异动,仅用一分钟就能迅速筛查出过去需要好几天才能查出来的贷款挪作保证金等违规情况,现场检查质效得到大幅提升。
这一系统已经在提升监管水平与效率等方面发挥了重要作用。从实践来看,湖北银监局组织了专业团队,认真做好制定实施规划、夯实数据基础、强化科技支撑等先期工作,顺利成为省局版EAST系统首批试点单位之一。由于EAST系统采集数据具有大规模、细颗粒、标准化、自动化等特点,易于进行海量数据的筛选、关联、比对等操作,正好与信用卡的业务特点以及所秉承的“大数法则”风控基础相契合。
在对辖内某银行信用卡业务的现场检查中,湖北银监局以风险管理、收费管理、质量管理等常见违规问题为切入点,利用EAST系统分析功能建立了一系列模型,提取了不少违规疑点信息,实现“精确打击”。
信用卡疑似套现在交易数据上常有一些异常表现,如每笔交易金额较大、先还后借且交易间隔时间短、为得到最长免息期交易一般发生在还款日附近等等。根据这些疑点信息,湖北银监局建立了相关模型,筛选出近千笔存在套现倾向的交易,督促该银行做好风险排查和防范工作。通过EAST系统建立模型还筛选出恶意透支的可疑名单,下一步将通过现场检查核实催收情况综合判断。信用卡业务作为EAST系统运用的“标靶”,为下一步这一系统延伸到对银行信贷业务、表外业务及外部风险的现场检查打下了扎实基础。
从实践中来看,通过EAST系统的数据直接对接,一方面可以有效克服以往银行机构手工数据录入的选择性规避和操作失误,确保了数据的真实性和一致性;另一方面可以依托系统数据的前期跟踪、监测和分析,准确定位疑点,有效聚焦风险,大幅缩小检查范围,提升检查针对性,实现非现场监管和现场监管的高效联动。EAST系统还能够充分及时地对数据信息进行处理,为监管人员及时
捕捉、监测、分析银行风险创造了有利条件,提升了对风险的识别、预判、预警能力,从而将各类风险隐患更好地消灭在萌芽阶段,提高银行业整体风险防控水平。
为更有效地推广EAST系统的运用,上下间的协调联动非常重要。应努力将EAST系统打造成一个开放式平台。同时,还应建立跨部门的联动工作机制。由于EAST系统科技含量高、技术难度大,推广工作中应注重集成监管人力资源,发挥各部门专业优势,建立沟通联络机制,加强科技与业务部门的融合,提高试点工作效果。EAST系统可以为现场检查提供线索,为非现场监管提供情况验证,同时也为市场准入提供参考意见;现场检查和非现场监管可以运用EAST系统将问题查深查透,这样才能将EAST系统用活用足,将其效用发挥到极致。(作者单位:湖北银监局)
链接
EAST系统是银监会自2008年起推出的现场检查系统。这一系统颠覆了过去用抽查代替普查,用点上的问题推测面上的问题的监管模式,构造了先进的现场检查系统平台和灵活的系统架构,实现了对银行业金融机构海量数据的有效挖掘和深度分析,不仅大大提高了现场检查效率,而且为“精确打击”提供了技术上的支持,是我国银行业监管技术的重要突破。
第五篇:大数据环境下的数据安全性探讨
大数据环境下的数据安全性探讨
学号:E41314059 姓名:李俊梅 专业:信息安全
一.引言
随着互联网、物联网、云计算等新兴技术的高速发展,各种智能终端、社交网络服务的大量涌现,全球数据量出现了巨幅增长。据相关数据统计,仅在2011年就达到1.8万亿GB。互联网数据中心预计到2020年全球数据将翻50倍。显而易见,真正的大数据时代已经到来。一方面,云计算技术的成熟,为这些多样化的数据提供了存储和运算的平台。与此同时,数据挖掘和人工智能等技术为大数据时代提供了信息参考,大数据的快速发展进一步扩大信息的开放程度,但是随之而带来的数据的安全性,防止数据泄露和保障数据安全已经成为我们研究的课题
二.大数据的概念与特征
大数据本身是一个较为抽象的概念,我们从表面上理解规模庞大的数据,但是随着应用的越来越广泛,对大数据研究越来越深,可以发现大数据不仅是在数量规模上庞大,而且还包括数据结构相当复杂,数据与数据之间的关联程度相当高。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。当前,普遍较为统一对大数据特征的认识可以用4V来表达:数据规模大(Volume),数据种类多(Varity),数据要求处理速度快(Velocity),数据价值密度低(Value),概括为所谓的四V特性。这些特征让大数据即区别与传统的数据概念,又体现出大数据的复杂。大数据除了有四个特性之外,大数据时代的数据还呈现出其他三个特征。第一个特征是数据类型繁多。第二个特征是数据价值密度相对较低。第三个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。
三.大数据面临的安全挑战
大数据的广泛应用注定了大数据的安全保卫战必须是持久战。在大数据时代,各种智能终端、互联网社交服务和各种数字化存储无处不在。不得不承认,大数据已经遍布各行各业,互联网的高速发展使得获得数据十分便利,同时也给信息安全带来了巨大的挑战。当前,数据安全的形势也不容乐观,需要保护的数据量增长已经超过了数据总量的增长。首先个人隐私很容易通过互联网泄露,随着社交网络、电子商务的兴起,们之间的联系越来越依赖网络,个人的信息会分散在不同的网络位置,只要将个人的相关数据聚集起来分析,就可以很容易获取个人的相关信息,从而分析出个人的隐私数据。上升到国家层面,大数据也可能给国家安全带来隐患。但是在网络高速发展的今天,如果在大数据处理技术方面落后的话,就可能导致数据的单向性。一些发达国家诸如美国已经开始大数据研发计划,大数据技术的发展和完善有助于增强国家数据的安全性。其次,网络普及化使大数据极易受到攻击。网络的高速发展,各个行业领域利用大数据技术能实现彼此资源共享和数据互通。加之云计算技术的普及,为大数据提供了一个开放的环境,将分布在不同区域的资源进行快速整合,智能化分配,从而实现数据资源的共享。正因为大数据处于一个开放的环境中,吸引黑客对其中的有价值的数据感兴趣,比如个人的银行账户信息等成为主要攻击目标。也就是说,在当今开放的网络化社会,大数据的本身数据量庞大,而且数据之间关联性强,对于黑客而言,只要付出相对低的成本,就可以获得巨大的收益。再次,数据的非结构化对大数据存储提出新要求。在大数据之前,数据存储一般分为关系型数据库和文件服务器两种。而相对于当前的大数据来说,数据类型的多样化也使我们措手不及。如今大数据一般都采用NoSQL数据库存储技术,该技术具有可扩展性和可用性等优点,但该技术仍然存在诸多漏洞,没有内置足够的安全性。所以时常会发生类似于身份验证、输入验证等大量安全问题。最后,计算机技术的发展也增加了安全风险。随着计算机网络技术的发展,各种服务器、防火墙、无线路由等网络设备的更新普及,数据挖掘等新兴技术越来成熟,为大数据智能化采集以及智能化数据分析性提供极大的方便。但是,我们也必须注意到一个问题就是技术的快速发展也会相应地增加了大数据的安全风险。一方面,从大数据本身的安全性来说,自身的防护也有不完善的地方,存在着漏洞。虽然云计算对大数据提供极大的方便,但云毕竟是一个开放的环境,对大数据的安全性无法提供最大的保证;API(Application Programming Interface,应用程序编程接口)访问安全权限控制以及密钥生成、存储技术和数据管理方面的不足都有造成数据泄漏的可能。同时大数据他本身可以成为一个可持续攻击的载体,有大量的恶意代码存在其中很难被发现,从而达到持续隐藏性攻击的目的。另一方面,黑客攻击的技术也在逐步提高,数据挖掘和数据分析技术的原理被黑客利用作为攻击的主要技术。
四.大数据安全策略
4.1 大数据存储安全策略
基于云计算架构的大数据,数据的存储和操作都是以服务的形式提供。目前,大数据的安全存储采用虚拟化海量存储技术来存储数据资源,涉及数据传输、隔离、恢复等的问题。解决大数据的安全存储,一是数据加密。在大数据安全服务的设计中,大数据可以按照数据安全存储的需求,被存储在数据集的任何存储空间,通过SSL(安全套接层)加密,实现数据集的节点和应用程序之间移动保护大数据。在大数据的传输服务过程中,加密为数据流的上传与下载提供有效的保护。应用隐私保护和外包数据计算,屏蔽网络攻击。二是分离密钥和加密数据,使用加密把数据使用与数据保管分离,把密钥与要保护的数据隔离开。同时,定义产生、存储、备份、恢复等密钥管理生命周期。三是使用过滤器。通过过滤器的监控,一旦发现数据离开了用户的网络,就自动阻止数据的再次传输。四是数据备份。通过系统容灾、敏感信息集中管控和数据管理等产品,实现端对端的数据保护,确保大数据损坏情况下有备无患和安全管控。4.2 大数据应用安全策略
随着大数据应用所需的技术和工具快速发展,大数据应用安全策略主要从以下几方面着手:一是防止APT攻击。借助大数据处理技术,针对APT安全攻击隐蔽能力强、长期潜伏、攻击路径和渠道不确定等特征,设计具备实时检测能力与事后回溯能力的全流量审计方案,提醒隐藏有病毒的应用程序。二是用户访问控制。根据大数据的密级程度和用户需求的不同,将大数据和用户设定不同的权限等级,并严格控制访问权限。而且,通过单点登录的统一身份认证与权限控制技术,对用户访问进行严格的控制,有效地保证大数据应用安全。三是整合工具和流程。整合点平行于现有的连接的同时,减少通过连接企业或业务线的SIEM工具的输出到大数据安全仓库,以防止这些被预处理的数据被暴露算法和溢出加工后的数据集。同时,通过设计一个标准化的数据格式简化整合过程,同时也可以改善分析算法的持续验证。四是数据实时分析引擎。数据实时分析引擎融合了云计算、机器学习、语义分析、统计学等多个领域,通过数据实时分析引擎,从大数据中第一时间挖掘出黑客攻击、非法操作、潜在威胁等各类安全事件,第一时间发出警告响应。
4.3 大数据管理安全策略
通过技术措施来保护大数据的安全必然重要,但管理也很关键。大数据的管理安全策略主要有:一是规范建设。大数据建设是一项有序的、动态的、可持续发展的系统工程,一套规范的运行机制、建设标准和共享平台建设至关重要。规范化建设可以促进大数据管理过程的正规有序,实现各级各类信息系统的网络互连、数据集成、资源共享,在统一的安全规范框架下运行。二是建立以数据为中心的安全系统。基于云计算的大数据存储在云共享环境中,为了大数据的所有者可以对大数据使用进行控制,可以通过建设一个基于异构数据为中心的安全方法,从系统管理上保证大数据的安全。三是融合创新。大数据是在云计算的基础上提出的新概念,大数据时代应以智慧创新理念融合大数据与云计算,以智能管道与聚合平台为基础,提升数据流量规模、层次及内涵,在大数据流中提升知识价值洞察力。积极创造大数据公司技术融合平台,寻找数据洪流大潮中新的立足点,特别是在数据挖掘、人工智能、机器学习等新技术的创新应用融合创新。
五.结束语
大数据是信息化时代的“石油”。大数据转化为信息和知识的速度与能力将成为这个时代的核心竞争力之一,而大数据面临的安全挑战却不容忽视。只有大数据技术和大数据安全“两条腿”走路时,大数据才可以真正成为这个时代的驱动力量。