第一篇:大数据环境下通信系统降低PRAR的研究
大数据环境下通信系统降低PRAR的研究引言
阐述大数据环境下进行通信系统PRAR降低的重要性和意义。2 PRAR的定义
定义和数学表达式遗传算法
基本遗传算法的算法步骤和算法流程框图改进的遗传算法
引入多种群改进GA,阐述改进的GA的算法步骤和算法流程框图 5 算法仿真
(1)改进算法的仿真
(2)改进的GA和GA仿真结果对比
(3)结果分析结论
第二篇:大数据环境下网络舆情管理方法研究
大数据环境下网络舆情管理方法研究
摘 要:随着互联网技术的快速发展及其广泛的应用,网络舆论信息的产生体量、传播速度和影响范围等方面都发生了巨大变化。这些变化要求舆情管理工作者在舆情管理理念、管理方法等方面必须与时俱进。大数据既是一种新技术,也是一种新方法,它侧重于信息挖掘和预测。将大数据运用到网络舆情管理工作之中,必将对舆情管理产生重要作用。在大数据环境下,网络舆情的管理方法也必将发生变革与创新。探讨大数据环境下网络舆情分析方法,以大数据为背景和前提创新网络舆情管理方法,总结大数据下舆情管理理念、视角、方式和方法等方面的变革与创新的思路,具有重要意义。
关键词:网络舆情;大数据;管理方法;变革与创新
DOI:10.15938/j.cnki.iper.2017.01.025
中图分类号: G641文献标识码:A文章编号:1672-9749(2017)01-0124-06
据《第37次中国互联网络发展状况统计报告》(由中国互联网络信息中心(简称:CNNIC)在2016年1月发布)显示,截至2015年12月,中国网民规模达6.88亿,全年新增网民3951万人。互联网普及率为50.3%,中国手机网民规模达6.20亿,手机上网使用率为90.1%[1]。随着移动互联网(Mobile Internet)、社交网络(Social Networking)、电子商务(Electronic Commerce)等的迅速发展,互联网的边界和应用范围有了极大扩展,各种信息和数据极具增多,并正在迅速膨胀变大。
网民们经常通过互联网表达意愿、观点,讨论各种话题,以表达自己的思想观点和诉求。互联网既是一个收纳器,聚集网民思想动态表达、文化和社会生活信息;又是一个扩音器,传播大众的社会舆论。在社交媒体时代,人们通过互联网平台表达社情民意,体现自己的意愿、态度和评论观点。舆情作为社会舆论的一个风向标,开展舆情分析主要是针对民众态度、观点的收集整理,分析出民众相关的意见倾向,客观体现舆情动态。
作为世界上网民数量最多、互联网访问量最大的国家,有效地分析网络舆情,对于政府,媒体、大型企事业单位都有着非常重要的意义。从政府的角度,有效的舆情管理有利于政府了解公众态度和诉求,有助于提升政府的政务管理和构建良好的社会和网络环境;从企业的角度,有效的舆情管理有利于企业掌握用户和大众对产品质量、产品功能与服务的评价及客户特征信息,更好地提供个性化产品与服务,实现利润增长,更有利于企业了解用户和大众对企业社会形象的反馈和认知,提升企业品牌知名度和社会声誉;从媒体的角度,有效的舆情管理能够突破传统信息搜集和发布渠道,更能够通过对公众舆论深入分析,提升新闻效果,实现新闻价值增值。因此,社会各界都非常重视网络舆情分析,并不断创新舆情的分析和管理的方式和方法,都是想最大化舆情的价值。
一、大数据及网络舆情的相关定义及特点
1.大数据的定义及特点
随着人们对大数据的研究和理解的不断深入,大数据已不仅仅是一个技术方面的名词了。而今,大数据相关的理论无论从内涵还是外延上,都在不断丰富和充实。关于大数据的定义,不同的机构和学者从不同的角度给出略有差异的定义:如高德纳咨询公司(2013)提出,大数据是指具有更强的洞察力和流程优化能力的海量、多样化的信息[2]。维基百科对大数据的定义是“一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集”。Gartner对大数据的定义:“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量高增长率和多样化的信息资产” [3]。
IDC市场研究公司2012年提出,“大数据”是为了从大容量的、不同类型的数据中获取有价值的信息而设计的新型架构和技术[2],并对大数据的采用三步法进行了界定,如图1所示。首先,从数据源场景方面,可以有三种情况,或者说需要具备三种情况至少满足一种,即大数据的容量大于等于100TB或数据源于超高速的数据流(Data Streaming),或数据产生的年增速大于60%;其次,必须部署在可动态适应的基础设施(dynamically adaptable infrastructure)上。这里的基础设施既可以是传统的scale-up架构,也可以是水平扩展架构(scale-out infrastructure);最后,必须有两个以上的数据源或数据格式,或者高速流数据源(如点击流或机器产生的数据流)。有了以上三个步骤的界定,才可以形成大数据。IDC指出“大数据技?g描述了一种新一代技术和架构,以非常经济的方式,以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值” [2]。
尽管对大数据的定义角度各有不同,但大数据的核心本质和特征的表述和定义相对比较统一,均认为大数据与传统意义数据具有本质区别。较传统数据相比,在数据基础上,大数据更倾向于全体数据而非抽样;在分析方法上,更强调相关分析而非因果分析;在分析效果上,追求的是效率而非绝对精确和在数据规模上强调相对数据而不是绝对数据。
在数据和信息的规模/体量方面、在内容形式和数据结构方面具有复杂性/变化频度多样、在产生速度方面及价值密度等四个方面都极大地超越了传统的数据形态,具有4V特征:
第一,数据规模大(Volume)
第二,数据种类多样(Variety)
第三,数据处理速度快(Velocity)
第四,数据价值密度高(Value)
如图2所示:大数据的4V特征。
具体而言,一是数据规模大(Volume):从容量角度,大数据具有数据容量大,“容量”或“体量”,从 TB→PB→EB级,每级都是按照进率1024(2的十次方)计算,这足以说明大数据规模之庞大。二是数据种类多样(Variety):结构化数据、非结构化数据以及半结构化数据,Web数据、文字、语音音频数据、图片图像数据、视频数据、模拟信号等数据都体现了数据的多样性。三是速数据处理速度快(Velocity):对数据访问、处理、交付等速度的要求快,而且数据产生速度也非常之快;四是价值(Value):大数据的核心价值在于资源优化配置,通过搜集海量数据,进而展开全量数据挖掘,分析数据背后的相关性,开展预测分析,获得数据的应用价值。
这些特性使得大数据与传统数据区别开来,强调了大数据是具有结构松散性、形式复杂性和有利用价值的数据信息资源[3]。
2.网络舆情的定义与特点
“舆情(Public Opinion)”翻译为“民众或公众的意愿、意见或观点”。根据百度百科:舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众?ψ魑?客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
有学者从社会学视域考察舆情的定义,认为舆情是指社会各阶层民众对社会现象或事件所持有的情绪、态度、观点、看法、意见和行为倾向等[4]。网络舆情则是社会总体舆情的一个组成部分,是以网络为载体存在,以网络传播方式汇聚、形成和表达的舆情,是在互联网上的民众情绪、态度和意见汇聚的总和[5]。
网络舆情的信息来源主要有:网络新闻(如:搜狐、新浪、人民网,或以RSS为基础聚合类新闻,如头条等),论坛贴吧(如:BBS,百度贴吧,天涯,西祠胡同等),新闻评论,社会化媒体社交网络(即时通讯工具:如:聊天室、QQ、微信、微博、博客等),搜索引擎(如:百度,google等),网络发起线上活动、网络调查、电子邮件等。
通常我们把网络舆情的基本特征概括为自由性与可控性、互动性与即时性、丰富性与多样性、隐匿性与外显性、情绪化与非理性、个体化与群体极化性[6]。如图3所示:网络舆情的特征
3.大数据是网络舆情管理的有效方式之一
大数据的目的在于发现新的知识与洞察并进行科学决策。大数据与网络舆情具有非常相似的特征。从这点上可见,利用大数据的手段管理网络舆情是网络舆情管理的有效方式之一。首先,大数据能够全方位记录民意,完整展现社会舆情,大数据体量巨大,从TB级到PB乃至ZB级别,能够完全、完整的记录社会民众的社情民意;其次,大数据的特点是挖掘数据背后的相关联性,因此,大数据能精准体现舆情背后的事件、相关人员以及读者等要素内在逻辑和社会关联;最后,大数据具有很强的预测能力,通过分析事件的读者特征(群体肖像刻画)、被关注程度/热度、传播速度、传播范围、发展趋势、影响程度和网民情绪变化等,也可以针对某个观点的深度研究,从而预测舆情走向,帮助决策者进行决策和判断。因此,大数据技术为网络舆情的预测提供了重要的技术、理论支撑和保证,也成为舆情研究关键技术的支撑和核心概念。
二、基于大数据技术网络舆情管理的一般步骤与方法
网络舆情的管理模型主要分为:信息采集、信息预处理、舆情分析、舆情报告四个步骤。如图4所示:大数据管理模块及流程示意。
1.信息采集
信息采集当前常用方式是网络爬虫技术。在网络爬虫的爬行策略中,应用最为基础的是深度优先遍历策略、广度优先遍历策略。对于信息抓取过程,要求信息抓取的覆盖范围要全面。高速发展的信息高速路使得网络信息数据容量不断增大、信息和数据的类型更加丰富和复杂、网页数量不断增多,这对舆情信息抓取的效率和全面性提出了更高的要求。
大数据网络舆情信息搜集改变了传统网络舆情信息的搜索采集方式,采用定向站点信息抓取辅以全面的实时监控、聚合内容(RSS)、社交网站信息搜集和摘要搜集等搜集技术,与传统人工监测采集相结合的方式进行,抓取效率和覆盖范围都有突破性进展。
数据监测要全面和实时,要做到精细采集信息数据。笔者整理了较为常用的监测范围和基本监测指标,如表1所示。
2.信息处理
信息处理主要包括数据清洗(Data Cleaning)、信息提取、文本分类等。信息处理的主要任务是将采集的各种信息转化成格式化文本存入数据库。
网络舆情在大数据环境中流动和变化速度非常快,因此,在信息处理部分,要求信息处理的时效性。
3.舆情挖掘与分析
大数据分析就是对海量数据进行分析、梳理和加工,获得具有价值的产品(Product)和服务(Service)或深刻洞见(Insight)的数据及处理方法。数据分析的主要技术手段是采用数据挖掘(Data Mining),数据挖掘又称数据库中的知识发现,即从数据库的大量数据中揭示出隐含的、前所未有的并具有潜在价值的信息的价值聚合、提炼的过程[7]。
舆情分析的技术方法主要有文本分类、聚类分析(不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别)、热点发现(利用关键词过滤、语义分析、数值统计识别热点和敏感话题)、话题识别、主题检测与跟踪、观点/文本倾向性识别和分析(对文章的观点进行倾向性分析和统计,识别正负面信息)、自动摘要等计算技术挖掘网络文本内容蕴含的各种观点(Opinion)、喜好(Preference)、态度(Attitude)、情感(Emotion)等,也可以明确网络传播者的意图和倾向,以及影响程度、影响范围和发展趋势。
当前一些实验室、研究机构等依据大数据分析的方法和实际的工作相结合,开发和建立了以下舆情专属的分析模型和方法。如:人民网推出的“舆论共识度”指数将为中国网络舆论场的研究和社会舆论的理性引导提供新的观察视角和决策依据。它把网络用户分为媒体、网民和意见领袖三大群体,通过对不同群体的舆论分析,对每月前十或前100的社会热点问题进行评估,形成“舆论共识度”,进而对用户对舆论话题的共识程度进行评价。
互联网与国家治理研究中心、中山大学大数据传播实验室设计的“网民认知模型”,通过透析网民对不同事件的情绪变化、态度偏向等,评测用户“正负能量”,分别从“网民情绪指数”“网民理性指数”和“网民态度指数”三个维度来评价具体热点事件当中网络舆论场的“网民正能量指数”,对舆情分析和研判也非常有帮助。
还有机构建立的热度评估指数,通过话题在传统媒体报道量、网络媒体报道量、微博量、论坛帖文量、博客文章量,转发数量、用户跟贴数量、评论数量、被关注数量、传播的速度和范围、关注的用户形态特征等相关数据,之后加权各项指标,得到每个热度事件或话题的综合热度指数。
更有一些专项深入分析,如针对传播源头的分析、传播渠道的分析、意见领袖的分析、传播主体挖掘分析或针对隐性数据(网络日志)的分析。
也有专家学者提出,舆情分析需要是一个综合分析模式,以大数据的方式为重点,同时要结合专项话?}市场调研、综合民意调查(定性与定量)、软件与人工、分析师与专家会商等方式相结合的方法来分析。
4.舆情报告
舆情分析的结果需要以报告的方式呈现,并将分析报告反馈或发布,为用户、管理者和决策者提供依据。
舆情报告要求舆情分析数据要真实可靠,分析方法要恰当准确,描述要符合客观事实,结论要简明扼要、通俗易懂。舆情报告中恰当采用示意图、图表、列表等展示形式,可以更形象、清晰、直观,并且更逻辑地展示舆情事件的发生、发展和变化,舆情的发展态势等。针对不同的表达目的可以选用不同的图表或图示方式,如:描述事件发展趋势可用折线图表示、展示用户立场或观点的比例可用饼状图、体现热点人群的分布可以用散点分布图、表示频率分布可以用网状图或柱状图、说明事态发展变化可以用流程图、用户之前或背后的人际关系可以用网状关系图等。丰富的图表工具可以更形象、生动的表述舆情的现状、发展和变化。
三、大数据环境下舆情管理模式变革与管理方法创新
虽然,目前对大数据研究越来越热,国内诸多大的互联网公司、各行业内的企业及科研机构都投入了巨大的人力、物力开展大数据及大数据下舆情研究,但在我国大数据研究依然处于探索阶段,在很多方面还只是停留在理论或对未来的畅想阶段。例如:在技术方面,目前常见的舆情监测工作的主要手段仍以人工检索为主,尽管也使用了市面相对成熟的相关搜索软件进行辅助搜索,但搜索舆情的技术仍采用传统的二维搜索方式,即主题关键词和网络平台二维坐标,由舆情管理的工作人员对采集的信息进行二次加工成舆情产品。而且搜索的舆情信息结果多为一级文本信息,对于深层次的多级舆情信息,如新闻、微博后的评论,网民的社会关系,网民针对某一事件评论反映出的情绪变化等数据无法深度挖掘,仍靠人工采集和分析判断。受制于舆情分析人员的知识水平和价值判断的不同,极有可能导致有价值的舆情信息丢失,无法准确及时预测舆情走势,大大降低了舆情监测工作的效率、准确性。
随着互联网的发展、自媒体的兴起,网络、通信技术在人们信息领域深入运用,发布者在人口统计学方面的特征、发布的载体、发布的形式、传播渠道、信息的数量和形式等有了全新的变化,这对舆情的管理提出了更高的要求,要求变革网络舆情管理方式以适应大数据时代的新形势。因此,舆情管理工作者在舆情管理的理念、模式和方式方法上均需要有相应的变革与创新。
1.舆情工作者的研究视角需要发生转变
舆情工作者要从全局角度,把舆情研究从单一向度的内容研究向多元化、多向度内容及关系研究方向转化。网络数据和信息背后体现的人的行为轨迹和复杂的人与人的社会关系(Social networking),所以关系研究将成为未来的研究重点。大数据的特征之一“关联分析”,通过社会话语表达、社会关系分析、社会心理描绘、社会诉求预测等多个角度[8],进行多向度的分析研究能够帮助构建立体化、全局化和动态化的网络舆情数据系统,通过舆情分析,挖掘网络舆情和社会动态背后的深层次关系,实现网络舆情管理和社会治理的紧密联动、同步推进。
2.舆情的研究方法需要创新
即便是研究的视角发生了改变,要想真正落实到具体工作中,研究方法的创新尤为关键。要在分析方法上更加丰富,结合数据挖掘技术分析(Data Mining)方法与行为分析(Behavior Analysis)方法的研究、结合云计算、移动可追塑性分析、个性化特征识别的网络机器人与社会心理分析实验因果模型等方法,一是要提升数据监测技术,实现对媒体、论坛、博客、微博、微信等各个网络平台数据的全面抓取和记录,特别是要提高对图片、音视频、模拟信号等数据的自动识别能力;二方面提高数据挖掘技术,从海量数据中快速识别有价值数据,并挖掘数据背后隐藏的规律。三要注重数据分析技术,包括关联分析、聚类分析、语义分析等等,自动分析网上言论背后的观点、意见倾向和信息、相互之间的关联性,揭示舆情发展趋势。四是确保数据安全和保密技术,包括网络攻击与攻击检测与防范问题、安全漏洞与安全对策问题、数据备份与恢复问题、灾难恢复问题等等,确保数据安全和保密[9]。
在数据分析方面,数据分析的准确性尤为重要。引入云计算的概念和技术,与大数据相结合,会使舆情分析更加准确。开展数据间、不同维度、不同领域的数据、多样化的数据间的关联分析,是十分重要的。专家认为舆情关联关系是网络舆情数据库中存在的一类重要的、可被发现的知识,引入网络舆情支持度和网络舆情可信度,可以更准确表示网络舆情间的关联度,量化网络舆情关联规则的相关性,从而使挖掘结果更准确。
3.研究结果要易懂、易应用和可视化呈现
大数据的真正价值是运用,舆情的最终价值是指导工作。研究结果的使用者未必是大数据和舆情分析的专家。因此,研究结果要求易懂易识,界面必须友好,结果必须可以直观识别。“用数据说话”。数据最有说服力,由于图表与列表能够清晰、直观、简洁、深刻、形象地表现舆情事件,因此舆情的研究结果要注重运用图表等可视化方式来展现。
4.重点强调舆情的预测,面向未来,做好舆情数据的再利用
大数据的核心是预测,未来舆情研究的重点应由舆情监测转向舆情预警和预测。舆情工作者通过收集分析互联网上关于社会热点或网民关注焦点事件的大量消息报道,发掘背后隐藏关系,进而预测事态发展趋势,为舆情事件处置提供决策参考。
展望未来,大数据时代数据使用的关键是数据再利用,数据再利用的意义在于:挖掘数据的潜在价值,实现数据重组的创新价值。基于大数据的舆情分析,能同时分析更多数据,揭露更多隐藏价值,使预测更准确,决策更合理。未来大数据将使舆情监测功能大大丰富,舆情分析功能更加强大,舆情预测能力进一步增强,这将实现全方位、立体式的综合舆情管理模式,实现舆情管理的价值最大化。
参考文献
[1] 中国互联网络信息中心(CNNIC).第37次中国互联网络发展状况统计报告[EB/OL].[2016-01-22].http://www.xiexiebang.com/hlwfzyj/hlwxzbg/hlwtjbg/201601/PO***51954.pdf.[2] 谢耘耕,刘锐,乔睿,等.大数据与社会舆情研究综述[J].新媒体与社会,2014(4):133-154.[3] 张宁熙.大数据在突发公共事件网络舆情信息工作中的应用[J].现代情报,2015(6):38-42.[4] 王宏伟.舆情信息工作策略与方法[M].北京: 中国人事出版社,2012:6.[5] 戴维民,刘轶.我国网络舆情信息工作现状及对策思考[J].图书情报工作,2014(1):24-29.[6] 刘毅.网络舆情研究概论[M].天津: 天津人民版社,2007:74.[7] 喻国明.大数据分析下的中国社会舆情:总体态势与结构性特征――基于百度热搜词(2009―2012)的舆情模型构建[J].中国人民大学学报,2013(5):2-9.[8] 李小娜.大数据时代社会舆情监测的转变和发展[J].青年记者,2015(11):69-70.[9] 卿立新.创新大数据时代的网络舆情管理[J].红旗文稿,2014(22):28-29.[责任编辑:张学玲]
第三篇:大数据环境下的数据安全研究论文
大数据环境下的数据安全问题是信息化时代必须解决的问题。文章阐述了大数据的概念及特点以及其存在的一些问题,再来分析大数据环境下影响信息安全的因素,最后对如何保证大数据环境下的数据安全提出一些方法。
大数据就是指数据信息量的规模非常巨大,从而导致无法以当前的主流工具在合理时间内进行正常的收集处理。它是一种数据量大且数据形式多样化的数据。随着大数据环境下的数据安全问题越来越突出,如何保证大数据环境下的数据安全对建设大数据环境具有重大的意义。大数据的概念及特点
大数据就是指数据信息量的规模非常巨大,从而导致无法以当前的主流工具在合理时间内进行正常的收集处理。它是一种数据量大且数据形式多样化的数据。通过对它概念的研究可以得出它具有以下几个特点:(1)数据量大。大数据是数据信息来那个超大的资料,每天都会产生无数的数据,而且信息数据级别也越来越高。统计数据的级别PB的级别甚至更高。(2)形式多样。形式多样主要是指它的数据类型呈现出多样化的特点。随着信息技术的发展,越来越多的数据以非结构化的形式出现。比如视频、音频、图片等。据统计,非结构化数据在数据中的比重已经超过了80%。(3)价值密度低。大数据在运行过程中会产生大量有价值的信息,这些信息对于生产生活会产生非常大的帮助。但是大数据由于数据信息量太大,也就存在着价值密度低的特点。在很大一个数据统计中,可能有价值的信息只有很少一部分。大数据环境下存在的问题
大数据环境下的数据存在以下几个关键问题。
2.1 可表示问题
大数据环境下的一些非结构化数据呈几何的形式在增长,数据的规模巨大,形式多样化使得用户对于数据的需求也呈现出多样化的趋势。数据的不断增大导致数据运行的效率却越来越低。对于这些多而杂的非结构化数据,如何表示将是一个非常重要的问题。
2.2 可靠性问题
大数据环境是一个非常庞大的网络环境,在网络开放和共享的时代,计算机数据面临着安全性和可靠性的考验。在大数据环境下,数据的收集和发布方式比以前更加的灵活,但一些不确定的数据将很有可能会造成数据的失真,在网络开放的环境下,失真的数据就会影响巨大的负面影响。因此大数据环境下的数据的可靠性将是一个急需解决的问题。
2.3 可处理问题
由于目前的数据信息每天都以成千上万的形式增长,现有水文计算机处理能力已经很难有效地对其进行处理,在进行数据分析的过程中,需要研究一种新型的数据分析方法,将多种学科的计算方式相结合,对数据信息进行规律性的研究。大数据环境下影响数据安全的因素
3.1 自然灾害
自然灾害这里主要是指台风、龙卷风、飓风、地震、洪水、火灾等。随着信息技术的发展,网络已经成为世界人民生活中不可或缺的一部分。人们在使用计算机网络的过程中,有很多数据存储在服务器之中,并且经常与它们实时交互。在运营过程中,因为各种灾害例如火灾、停电、地震以及数据传送时线路的突然中断,将造成各种数据的丢失。
3.2 网络硬件
在信息化快速发展的今天,硬件虽然更新换代很快,但数据量的增长速度却是爆炸性的增长,进而造成以前的存蓄环境不能满足当前海量数据的需要,因此,应该对存储环境进行优化升级,使其能满足现今对数据存储的需要。在传输数据的过程中如果数据量过于庞大,而硬件设备由于老化导致传输速率的降低,那么网络的延迟可能会导致系统崩溃造成数据丢失,影响数据存储过程的安全。
3.3 操作失误
数据管理人员不管是面对怎样的应用软件,都有可能出现操作不当的情况。任何一个人在开展工作时都有可能会误删除系统的重要文件,或者修改影响系统运行的参数,以及没有按照规定要求或操作不当导致的系统宕机,尤其是进行数据库管理的工作人员,面对的数据量比较大,系统的运作也极为复杂,这都将导致操作不当或失误情况的发生,进而威胁到系统数据的完整性与安全性。
3.4 管理不善
由于存储系统越来越复杂,对管理维护人员的素质要求也越来越高,因管理不善而造成数据丢失的可能性会大大增加[2]。比如计算机网络中终端用户随意增减调换,每个终端硬件配备(CPU、硬盘、内存等)肆意组装拆卸、操作系统随意更换、各类应用软件胡乱安装卸载,各种外设(软驱、光驱、U盘、打印机、Modem等)无节制使用。如何保证大数据环境下的数据安全
4.1 建立大数据信息安全体系
大数据的应用规划以及它的信息安全应要提高到发展战略的高度,对大数据进行系统的分类,明确一些重点的保障对象,强化对数据的监控管理。大数据环境是一个庞大的数据信息系统,要确保数据信息的安全性,需努力建立起一个完整的数据信息安全体系。
4.2 进行数据安全删除
当今信息安全技术当中一个极为关键的问题。所谓的数据安全删除指的就是对数据恢复正常的条件进行破坏,使数据在删除之后无法恢复,无法逆转。相对于部分敏感数据而言,数据安全删除是十分关键的。众所周知,普通文档实行删除操作仅仅是对其标记进行删除;高级格式化同样无法对数据区内的数据信息进行覆盖处理,因此不能将其叫做安全删除。
4.3 对动态数据进行安全监控
相对与静态的信息数据,动态的信息数据更容易产生安全问题。因此需要对动态数据进行安全监控,完善对于动态数据的安全监控机制。在对动态数据进行监控的过程中,必须要对分布式计算系统进行健康监控,以保证其健康运行。在一些大规模的分布式计算中,要对动态数据的细粒度进行安全监控和分析,对大数据分布式进行实时监控。结语
随着信息化时代的到来,如今大数据环境下的数据不断增长。在大数据环境下的数据信息的安全性成为信息化时代的一个重要问题。对数据的安全性采取保障措施对整个大数据环境下的信息化发展具有非常大的意义。
第四篇:大数据环境下的数据安全性探讨
大数据环境下的数据安全性探讨
学号:E41314059 姓名:李俊梅 专业:信息安全
一.引言
随着互联网、物联网、云计算等新兴技术的高速发展,各种智能终端、社交网络服务的大量涌现,全球数据量出现了巨幅增长。据相关数据统计,仅在2011年就达到1.8万亿GB。互联网数据中心预计到2020年全球数据将翻50倍。显而易见,真正的大数据时代已经到来。一方面,云计算技术的成熟,为这些多样化的数据提供了存储和运算的平台。与此同时,数据挖掘和人工智能等技术为大数据时代提供了信息参考,大数据的快速发展进一步扩大信息的开放程度,但是随之而带来的数据的安全性,防止数据泄露和保障数据安全已经成为我们研究的课题
二.大数据的概念与特征
大数据本身是一个较为抽象的概念,我们从表面上理解规模庞大的数据,但是随着应用的越来越广泛,对大数据研究越来越深,可以发现大数据不仅是在数量规模上庞大,而且还包括数据结构相当复杂,数据与数据之间的关联程度相当高。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。当前,普遍较为统一对大数据特征的认识可以用4V来表达:数据规模大(Volume),数据种类多(Varity),数据要求处理速度快(Velocity),数据价值密度低(Value),概括为所谓的四V特性。这些特征让大数据即区别与传统的数据概念,又体现出大数据的复杂。大数据除了有四个特性之外,大数据时代的数据还呈现出其他三个特征。第一个特征是数据类型繁多。第二个特征是数据价值密度相对较低。第三个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。
三.大数据面临的安全挑战
大数据的广泛应用注定了大数据的安全保卫战必须是持久战。在大数据时代,各种智能终端、互联网社交服务和各种数字化存储无处不在。不得不承认,大数据已经遍布各行各业,互联网的高速发展使得获得数据十分便利,同时也给信息安全带来了巨大的挑战。当前,数据安全的形势也不容乐观,需要保护的数据量增长已经超过了数据总量的增长。首先个人隐私很容易通过互联网泄露,随着社交网络、电子商务的兴起,们之间的联系越来越依赖网络,个人的信息会分散在不同的网络位置,只要将个人的相关数据聚集起来分析,就可以很容易获取个人的相关信息,从而分析出个人的隐私数据。上升到国家层面,大数据也可能给国家安全带来隐患。但是在网络高速发展的今天,如果在大数据处理技术方面落后的话,就可能导致数据的单向性。一些发达国家诸如美国已经开始大数据研发计划,大数据技术的发展和完善有助于增强国家数据的安全性。其次,网络普及化使大数据极易受到攻击。网络的高速发展,各个行业领域利用大数据技术能实现彼此资源共享和数据互通。加之云计算技术的普及,为大数据提供了一个开放的环境,将分布在不同区域的资源进行快速整合,智能化分配,从而实现数据资源的共享。正因为大数据处于一个开放的环境中,吸引黑客对其中的有价值的数据感兴趣,比如个人的银行账户信息等成为主要攻击目标。也就是说,在当今开放的网络化社会,大数据的本身数据量庞大,而且数据之间关联性强,对于黑客而言,只要付出相对低的成本,就可以获得巨大的收益。再次,数据的非结构化对大数据存储提出新要求。在大数据之前,数据存储一般分为关系型数据库和文件服务器两种。而相对于当前的大数据来说,数据类型的多样化也使我们措手不及。如今大数据一般都采用NoSQL数据库存储技术,该技术具有可扩展性和可用性等优点,但该技术仍然存在诸多漏洞,没有内置足够的安全性。所以时常会发生类似于身份验证、输入验证等大量安全问题。最后,计算机技术的发展也增加了安全风险。随着计算机网络技术的发展,各种服务器、防火墙、无线路由等网络设备的更新普及,数据挖掘等新兴技术越来成熟,为大数据智能化采集以及智能化数据分析性提供极大的方便。但是,我们也必须注意到一个问题就是技术的快速发展也会相应地增加了大数据的安全风险。一方面,从大数据本身的安全性来说,自身的防护也有不完善的地方,存在着漏洞。虽然云计算对大数据提供极大的方便,但云毕竟是一个开放的环境,对大数据的安全性无法提供最大的保证;API(Application Programming Interface,应用程序编程接口)访问安全权限控制以及密钥生成、存储技术和数据管理方面的不足都有造成数据泄漏的可能。同时大数据他本身可以成为一个可持续攻击的载体,有大量的恶意代码存在其中很难被发现,从而达到持续隐藏性攻击的目的。另一方面,黑客攻击的技术也在逐步提高,数据挖掘和数据分析技术的原理被黑客利用作为攻击的主要技术。
四.大数据安全策略
4.1 大数据存储安全策略
基于云计算架构的大数据,数据的存储和操作都是以服务的形式提供。目前,大数据的安全存储采用虚拟化海量存储技术来存储数据资源,涉及数据传输、隔离、恢复等的问题。解决大数据的安全存储,一是数据加密。在大数据安全服务的设计中,大数据可以按照数据安全存储的需求,被存储在数据集的任何存储空间,通过SSL(安全套接层)加密,实现数据集的节点和应用程序之间移动保护大数据。在大数据的传输服务过程中,加密为数据流的上传与下载提供有效的保护。应用隐私保护和外包数据计算,屏蔽网络攻击。二是分离密钥和加密数据,使用加密把数据使用与数据保管分离,把密钥与要保护的数据隔离开。同时,定义产生、存储、备份、恢复等密钥管理生命周期。三是使用过滤器。通过过滤器的监控,一旦发现数据离开了用户的网络,就自动阻止数据的再次传输。四是数据备份。通过系统容灾、敏感信息集中管控和数据管理等产品,实现端对端的数据保护,确保大数据损坏情况下有备无患和安全管控。4.2 大数据应用安全策略
随着大数据应用所需的技术和工具快速发展,大数据应用安全策略主要从以下几方面着手:一是防止APT攻击。借助大数据处理技术,针对APT安全攻击隐蔽能力强、长期潜伏、攻击路径和渠道不确定等特征,设计具备实时检测能力与事后回溯能力的全流量审计方案,提醒隐藏有病毒的应用程序。二是用户访问控制。根据大数据的密级程度和用户需求的不同,将大数据和用户设定不同的权限等级,并严格控制访问权限。而且,通过单点登录的统一身份认证与权限控制技术,对用户访问进行严格的控制,有效地保证大数据应用安全。三是整合工具和流程。整合点平行于现有的连接的同时,减少通过连接企业或业务线的SIEM工具的输出到大数据安全仓库,以防止这些被预处理的数据被暴露算法和溢出加工后的数据集。同时,通过设计一个标准化的数据格式简化整合过程,同时也可以改善分析算法的持续验证。四是数据实时分析引擎。数据实时分析引擎融合了云计算、机器学习、语义分析、统计学等多个领域,通过数据实时分析引擎,从大数据中第一时间挖掘出黑客攻击、非法操作、潜在威胁等各类安全事件,第一时间发出警告响应。
4.3 大数据管理安全策略
通过技术措施来保护大数据的安全必然重要,但管理也很关键。大数据的管理安全策略主要有:一是规范建设。大数据建设是一项有序的、动态的、可持续发展的系统工程,一套规范的运行机制、建设标准和共享平台建设至关重要。规范化建设可以促进大数据管理过程的正规有序,实现各级各类信息系统的网络互连、数据集成、资源共享,在统一的安全规范框架下运行。二是建立以数据为中心的安全系统。基于云计算的大数据存储在云共享环境中,为了大数据的所有者可以对大数据使用进行控制,可以通过建设一个基于异构数据为中心的安全方法,从系统管理上保证大数据的安全。三是融合创新。大数据是在云计算的基础上提出的新概念,大数据时代应以智慧创新理念融合大数据与云计算,以智能管道与聚合平台为基础,提升数据流量规模、层次及内涵,在大数据流中提升知识价值洞察力。积极创造大数据公司技术融合平台,寻找数据洪流大潮中新的立足点,特别是在数据挖掘、人工智能、机器学习等新技术的创新应用融合创新。
五.结束语
大数据是信息化时代的“石油”。大数据转化为信息和知识的速度与能力将成为这个时代的核心竞争力之一,而大数据面临的安全挑战却不容忽视。只有大数据技术和大数据安全“两条腿”走路时,大数据才可以真正成为这个时代的驱动力量。
第五篇:大数据环境下初中信息技术教学浅议
大数据环境下初中信息技术教学浅议
【摘 要】作为社会最前沿的技术,信息技术在时代进步过程中不断发展。培养学生对信息技术的兴趣和意识,让学生掌握处理信息的基本技能,是初中信息技术课的主要目标。那么教学实践中如何践行这一目标呢?笔者通过本文简谈之。
【关键词】初中;信息技术;教育教学
信息技术由于具有较强的实用性和实践性,已经被纳入到中学素质教育中,并以培养学生计算机知识应用能力为主要目标。随着大数据时代的到来,中学信息技术教学既获得了机遇又需面对挑战,而怎样在机遇和挑战中提升教学有效性、改善教学现状,成为每个中学信息技术教师需要思考的问题。那么如何实施信息技术的教学呢?
一、注重培养学生的信息素养
在信息化社会的今天,信息素养已成为科学素养的重要构成部分。迅速地筛选和获取信息、准确地鉴别信息、创造性地加工和处理信息,将是所有社会成员应具备的、如同“读、写、算”一样重要的,终生有用的基础能力之一。对于21世纪的学生来讲,我们应努力培养他们基本的“信息素养”。
1.获取信息的能力。能够根据自己的学习要求,主动地、有目的地去发现信息,并能通过各种媒体,如互联网、书籍、报纸、电视等,或者自己亲自调查、参观等,收集到所需要的信息。
2.分析信息的能力。能够将丰富的获取到的信息进行筛选鉴别自己所需要的信息,判断它的可信度,然后对认为真实有用的信息进行分类。
3.加工信息的能力。将不同渠道获取的同一类信息进行综合,结合自己原有的知识,重新整理组织、存储,并能够简洁明了地传递给他人。
4.利用信息的能力。利用所掌握的信息,使用信息技术或其他手段,分析、解决生活和学习中的各种实际问题。
我们要充分利用学校教学的优势,通过各种形式的教育,使学生将上述信息的获取、分析、加工、利用等能力,内化为自身的思维习惯和行为方式。而在所有形式的教育中,创设一个在实际生活学习中使用信息技术解决问题的学习环境,是培养学生“信息素养”的关键。
二、注重学习兴趣的培养
教育家苏姆林斯基曾说过:“学习兴趣是学习活动的重要动力。”学习兴趣是学生基于自己的学习需要而表现出来的一种认识倾向,它在学生的学习中具有重要的作用。开始学习信息技术课时学生往往怀着好奇、兴奋的心理,但随着学习内容的深入,有的内容需要机械重复地训练,有的内容枯燥无味难度大,这样学生的学习热情就会慢慢降下来。根据建构意义新的学习理论,教师应由知识的传授者、灌输者转变为学生主动建构意义的帮助者、促进者,要充分激发学生的学习兴趣,帮助他们形成正确的学习动机。因此,教师要采取灵活多样的教学方式,激发学生的学习兴趣和主动探索的愿望。
三、培养学生的创新意识和创新能力
当今世界正在进入知识经济时代,知识的不断创新,高科技的迅速产业化,使得经济持续增长。而在这一时代,起核心作用的是知识创新,它是技术创新的基础,是技术进步和经济增长的革命性力量。因此二十一世纪需要的是有创新意识、具有创新精神和创新能力的人才。这就要求教育者,在教育过程中注重开发学生的创造潜力,鼓励启发学生主动思考,善于思考,学会独立思考,突出创新意识的培?B,强调创新能力的提高。
培养学生的创新意识和创新能力,首先要为学生创造尽可能多的环境和机会,给学生留有更多的思维空间,不须面面俱到,包办学生所做的一切。只有在自主学习的环境里,学生才有可能发挥创造性,体验创新的乐趣。例如:在讲WORD图文混排时,需要用到绘图工具栏,我只是把工具栏上重点工具,如阴影、三维效果、填充、自选图形等提示了一下,具体的操作留给学生自己完成。学生们凭着他们敏锐的观察,丰富的想象,做出了一幅幅好的作品。后来我对几副想象力丰富的作品给予了表扬,课堂气氛达到了高潮。在亲自实践的过程中,他们的创新意识和创新能力得到了充分的体现。
四、注重与其他学科的整合
信息技术课程的目的之一就是培养学生获取信息、处理信息的能力,而相应的信息应是与中小学生各科的学习内容相关的知识,这就产生了信息技术课程如何与其他学科课程整合的问题。课程整合是指用不同课程的素材和能力整合在一起,使学习的目标处于一个具体的,现实的情况,要求用到多种知识和能力。现代教育引入了以计算机为主的信息技术教学手段,提出了以超媒体方式组织教学信息的思想,这就为信息技术课程与其它学科课程的整合提供了理论基础和技术手段。
将中小学信息技术课程与其他课程整合,就是以其他学科知识的学习作为载体,把信息技术课程作为工具和手段渗透到其他学科的教学中去,从而在学习信息技术课程的同时,又能培养学生解决其他学科问题的综合能力。结合初一语文教学,我校采用的“计算机与语文识字教学整合”就是一个比较成功的例子。它主要是利用多媒体识字教学软件,让学生观看生字的笔画、笔顺、部首、间架结构、正确读音和汉字编码,同时跟随教学软件进行听、说、读、写、打(打字)的训练,通过人机交互进行自我学习、自我检查和自我提高。
五、注重青少年信息道德的培养
在信息技术蓬勃发展之际,人们往往只看到了它所带来的巨大利益,而忽视了信息技术中某些不利因素给青少年成长造成的干扰和不良影响。例如:在互联网上除了大量丰富的学科知识外,也有许多不健康的内容,有时还有计算机犯罪,计算机病毒肆虐等,而这些正是信息技术教育中容易忽略的问题。因此在学习网络这一章时,我不仅要讲解因特网的优秀之处,而且不断向学生渗透思想品德教育,培养学生健康的信息意识和信息伦理道德。
六、总结
随着信息社会的发展,教育信息化的实现,对教育既是机遇又是挑战,从培养模式上提出了更高的要求。在培养目标上,要求德智体美全面发展,具有高度创新能力和使用信息化手段能力;在培养内容上,教育需要对课程结构和教学内容进行改革。主要侧重在使学生掌握学习的方法,使每一个受教育者都具有自我获取知识和更新知识的能力;在培养方法上,教育需要更新观念,要寻求新的模式和传播手段,以适应终身教育,全民教育的需要。