大数据开题报告(含五篇)

时间:2019-05-14 07:08:42下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《大数据开题报告》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《大数据开题报告》。

第一篇:大数据开题报告

篇一:大数据时代内部控制-论文开题报告(初稿)本科毕业论文(设计)开题报告1200年 月 日 2 篇二:开题报告 1042806125沈东东(1)江苏科技大学毕业论文(设计)开题报告概述表

篇三:开题报告 上海工程技术大学

毕业设计(毕业论文)开题报告

学院 专业 班级学号 学生 指导教师

电子电气工程学院 电气工程及其自动化 021311123 鄢湘浩 陈宇晨 题 目

电力系统反外损事故大数据的研究 任务规定

进行日期 自 月日起,至年

电力系统反外损事故大数据的研究 1 课题介绍

1.1本课题的设计背景

大数据是近年来受到广泛关注的新概念,是指通过对大量的、种类和来源复杂的数据进行高速地捕捉、发现和分析,用经济的方法提取其价值的技术体系或技术架构。所以,广义上讲,大数据不仅是指大数据所涉及的数据,还包含了对这些数据进行处理和分析的理论、方法和技术。大数据早期主要应用于商业、金融等领域,后逐渐扩展到交通、医疗、能源等领域,电力系统反外损破坏也被看作是大数据应用的重要技术领域之一。1.2 电力系统故障的危害

电力系统运行过程中,可能出现各种故障和异常运行状态,其中短路故障是最常见的也是最危险的故障,造成的危害也非常严重: 1)、短路故障使系统短路电流过大,通过故障点的短路电流及其所产生的电弧,是故障元件受损或造成永久性故障; 2)、由于穿越性短路电流很大,在非故障电力元件上迅速发热,元件的温度在短时间内大幅度上升,同时还会受到很大的电动力作用,可以使元件受损变形,使元件的使用寿命缩短。3)、造成电力系统故障地区的电压大幅下降,越靠近故障点的地区,电压下降越厉害。电压幅值的高低直接关系到电网的供电质量,由于短路故障导致的电压下降,会破坏当地电力用户工作的稳定性,影响当地工厂的产品质量。4)、故障会破坏并列运行电力系统的稳定性,引发系统振荡,如果不能得到及时有效的控制,可能会导致整个并列的电力系统的崩溃; 1.3电力系统外损事故的类型 1)、自然因素:地震、冰雹、雷雨、风暴、火灾、热浪、洪水等; 2)、安装调试:回路接线错误或接线不可靠、设备安装调试不到位; 3)、认为操作:操作人员误操作,控制保护系统设置错误; 4)、维护因素:维护不当、维护更新旧的设备不及时。2研究内容

本课题以电力大数据技术的基本支撑为前提,着重探讨了电力系统外损事故的特征,以及如何运用大数据技术预防电力系统外损事故,进而达到电力系统安全稳定的运行。3设计思路

3.1 反外损结构及其功能

输电线路智能反外损系统的网络拓扑结构如图1所示。上海地区输电线路智能化反外损监控系统由现场视频采集终端、监控中心平台与监控 客户端组成。现场视频采集终端部分由视频采集、信号报警、主控器、电源、无线传输组成;通信方式采用的是wcdma无线传输技术,并通过图像压缩技术把视频信号传送到监控中心,支持mpeg4,h.264的压缩格式,支持双码流,图像无线传输帧率最大可达巧帧/s,时延小于55。监控中心平台部分由视频服务器子系统、实时智能视频监控子系统、监控信息子系统组成。监控客户端可利用用户可通过无线宽带、有线网络和智能手机实时监控经授权监控点的视频图像以及控制监控点的辅助设备,方便用户及时掌握现场异常,从而实现实时监控。基于上述结构及其功能,系统的工作原理如图2所示:终端视频采集装置采集视频信号,发生外力破坏时视频智能监控子系统发出报警控制信 号,控制现场声光报警,同时将报警地点现场图像作为报警信息通过无线方式发送到主管领导的移动监控终端或手机上。图1 智能化反外损系统的网络拓扑图

图2 智能化反外损工作原理示意图 3.2 大数据的研究方法

被广泛接受的大数据3层分析架构如图3所示,其中包含了数据访问和计算,数据隐私和领域知识,以及大数据挖掘算法。对于内层架构,即大数据挖掘平台,其核心主要集中于数据访问和计算过程,随着智能电网中数据量持续增长,数据的分布存储将成为必然,而一个高效的计算平台在计算时必须将分布式的大规模数据存储纳入考虑,将数据分析及处理任务分割成很多的子任务,并通过并行的程序在大量的计算节点上执行。在架构的外层,首先要对异构、不确定、不完备,以及多源的智能电网大

第二篇:大数据,开题报告

篇一:大数据时代内部控制-论文开题报告(初稿)本科毕业论文(设计)开题报告1200年 月 日 2 篇二:开题报告 1042806125沈东东(1)江苏科技大学毕业论文(设计)开题报告概述表

篇三:大数据时代下微博广告的互动营销策略分析(开题报告)武汉工程大学

本科生毕业设计(论文)开题报告

题 目: 大数据时代下微博广告的互动营销策略分析

学 号 1007080128 姓 名指 导 教 师 院(系)专业 日 期 2014年3月23日

一、研究的背景及意义近年来,近年来大数据(big data)一词被越来越多的人提及和热议,“数据”这个词我们都很容易理解,但“大数据”却让很多人觉得很遥远,深不可测。如今不管是大企业精英还是普通公众都在呼喊要积极适应大数据时代的变革,可真正做出成果的却寥寥无几。如何在大数据时代改革的浪潮中抢占先机,成为各行各业工作者们迫切想要解决的关键问题。

其实“大数据”并不是近几年才出现的一个专业词汇,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡。麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 据悉,“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。而对于广告行业来说大数据时代的来临无疑带来了巨大的发展潜能。

大数据背后对消费者的精准洞察能够为广告主带来有效的决策和评估,这也是广大广告主们渴求大数据的最主要原因。近年来社会化媒体的热门特别是微博平台的火爆,给企业主们提供了一个跟消费者近距离互动交流的机会。通过微博的互动营销,深度挖掘消费者背后的行为数据,可以为企业主提供最精准的决策和评估,使广告效果最大化。

二、研究的主要内容和主要目标 主要内容

研究从当今大数据时代的背景出发,来分析微博广告的互动营销策略。首先阐释大数据时代的概念及对广告行业的影响,分析大数据时代下广告格局的变化以及广告精准决策和评估的突破。接着引出微博广告的热门,从微博平台的火热到微博广告的精准投放来论述微博广告的应用价值。同时从微博广告的营销模式中挖掘最具代表性的互动营销来进行分析,如何通过大数据的分析与洞察来与消费者进行最有效的互动。最后总结分析微博广告互动营销的优劣势以及预测未来微博广告营销模式的创新。主要目标

1.让更多人熟知大数据及了解大数据给广告带来的影响

2.通过对微博广告的互动营销策略分析,探讨如何在大数据背景下寻找最有效的营销模式,引导企业品牌价值最大化。三:文献综述

人们对大数据时代下的定义中比较通俗一点是指“描述和定义信息爆炸时代产生的海量大数据时代”,何为大数据?大数据是以云计算为支撑,从各种各样类型的数据中,快速获得有价值信息的一种前沿技术。在pc和移动智能终端迅速普及的当下社会,每天都有数以亿计的海量数据产生,谁能率先发现数据背后隐藏的用户价值,挖掘用户数据背后潜在的消费习惯、购买动机和生活方式的差异与变化,谁将在新的营销环境下占领制高点。互联网突飞猛进的发展加速了大数据时代的到来,上网人数的增加以及网民所创造内容(ugc)的增加为大数据提供可能。在大数据处理需求时代背景下,全球存储容量也以爆发式速度在增长。但需要强调的是,大数据的“大”字不仅仅指数据量的增多,更在于对海量数据的整合以及深入挖掘,而后者对广告的影响是深远的。

“大数据”作为网络时代的信息矿山,无疑蕴含着大价值。目前,大数据比较明朗化的商业价值开发,发生在互联网广告精准营销领域。传统的广告营销,在经历了大众传播的喧嚣、分众传播的繁荣后,开始迎来新的变革窗口----针对特定网民的精准营销(有人称其“个众传播”)。基于对记录着网民人口属性、兴趣喜好、消费习惯、价值导向等信息的大数据的挖掘,通过人群定向技术,向特定的某个网民传播极具针对性的广告,从而降低广告的无效损耗,提升品牌的投资回报率(roi),这是大数据在网络精准营销领域“闪出的一道金光”。微博平台的火爆催生了微博广告。自从2009年新浪推出国内首个微博平台以来,微博在国内的发展犹如雨后春笋,遍布大江南北。根据相关统计表明2013年以新浪和腾讯为主的微博用户已突破5亿人次。微博是一个平民化的社会传播平台,是基于互联网平台上诞生的“新生命”,它不但具备信息传播、及时互动以及真实可靠等特性,而且本身具备了媒体的诸多特性。从媒介商业模式构建上分析来看,媒体与广告是天生的一对,相辅相成,共同成长。微博广告作为一种新兴的广告宣传形式越来越受到广告主们的青睐。

每一个微博注册用户,既是用户者同时也是消费者。美国财经网站cnnmoney曾撰文指出,facebook每名用户每个季度能给其贡献1.21美元的营收,在这个微博火热的时代,谁抢占了微博的先机,谁就会在激烈的竞争中更脱颖而出。微博商业化的核心在于为用户提供增值服务,利用广告对应的页面吸引粉丝互动,对品牌和产品进行推广。如今国内外已经出现很多专业数据挖掘和分析机构,利用微博平台收集海量数据,对微博用户的言论和兴趣爱好进行分析,从微博“大数据”中挖掘商业价值。

很多企业品牌通过微博广告营销取得了意想不到的好效果。如2011年被评为最具代表性的社交网络营销案例——杜蕾斯鞋套微博营销就成功地引发大家的关注。2011年6月23日下午5点,北京天降大雨,而这时也正好是临近下班是时候,大雨倾盆,微博上的网友们也开始讨论如何回家。而此时一个叫“地空捣蛋”的网友发了一条微博“北京今日暴雨,幸亏包里有两只杜蕾斯”,他在图解中详细的介绍了怎样把杜蕾斯做成鞋套的过程。此微博一发出,便被网友疯狂的转法,一个小时内便被转发了一万余次。

“地空捣蛋”发出此微博短短20分钟之后,杜蕾斯已经成为新浪微博一小时热门榜第一名。并在当晚24点转发近5.8万条,成为6月23日全站转发量最高的微博内容。根据有关的数据统计,杜蕾斯此次微博传播覆盖至少5000万新浪用户,同时在腾讯微博、搜狐微博也有发布,影响到的人群达到千万级,营销效果显著。分析杜蕾斯鞋套营销的成功原因,不外乎三点。首先是定位准确,杜蕾斯将目标定位在时尚、爱酷、热衷网络的年轻人群上,可谓是相当准确。一是年轻人大多集中在网上,能够有效的参与沟通和互动。二是年轻人的性观念相对开放,不太忌讳谈性,而且富于创新,这是中老年人无法具有的优势。其次是创新内容,抓住时事热点,通过北京降大雨很多上班族担心鞋子湿无法回家,巧妙利用产品特性进行宣传。最后是互动,杜蕾斯的官方微博非常热衷于与网友互动,据不完全统计,官方微博平均每天要回复400多次,最高纪录是一天回了1000条。同时对于一些与自己品牌相关的其他博主发布的微博也积极转发,尤其是充满创意、和自身品牌调性相符的内容。

由此我们可以总结出微博广告的互动营销策略。首先要找准受众群,设置议题。众所周知,企业若想依靠单纯地发布品牌、活动信息,聚拢品牌消费者进行微博营销是毫无价值的。只有瞄准目标受众群,投其所好谈他们喜欢的话题才能拉近彼此的距离。其次要人性沟通,注重互动。微博除了意味着更短的信息内容,也更强调双向的沟通。通过发起一个引人人胜的话题,吸引自己的跟随者和其他用户的踊跃讨论、响应,培育出一群互动密切的忠诚粉丝,还能藉由社群串联,接触到朋友的朋友,让群众范围无限延伸,使个人媒体不断壮大成稳固的社交圈。最后要整合推广,任何单一的广告传播渠道都不能带来广泛的受众,只有整合有效的资源,全面覆盖目标受众的行为路径,才能最大限度地让目标受众产生深刻印象。微博广告的互动营销可以有效地对企业品牌进行推广和提升形象,但与此同时也给企业的品牌管理带来了新的难题。随着微博上信息传播可控性管理难度加大,一度失控的信息传播局面有可能给企业难以负载的影响。如何才能真正发挥微博平台的营销价值,弱化负面信息流对品牌、对企业带来的反向冲击,是企业需要共同思索和探讨的问题。

四、研究思路和研究方法

1.研究思路:大数据时代下海量的、碎片化的信息让企业积极寻求广告的精准决策与投放,微博平台的火爆为广告主们提供了有效的营销新模式。微博广告的互动营销模式为企业品牌的精准营销注入了强大的力量,但微博上负面信息流一旦失控也有可能给企业带来难以承载的压力。我们需要在微博广告的互动营销模式中寻找更有效的营销模式使企业品牌价值最大化。

五、论文提纲 引言

1.大数据时代及对广告行业的影响 1.1大数据时代的概念

1.1.1大数据的定义及产生的时代背景

第三篇:数据挖掘技术-毕业设计-开题报告-毕业论文

数据挖掘技术综述

数据挖掘(Data Mining)是一项较新的数据库技术,它基于由日常积累的大量数据所构成的数据库,从中发现潜在的、有价值的信息——称为知识,用于支持决策。数据挖掘是一项数据库应用技术,本文首先对数据挖掘进行概述,阐明什么是数据挖掘,数据挖掘的技术是什么,然后介绍数据挖掘的常用技术,数据挖掘的主要过程, 如何进行数据挖掘,主要应用领域以及国内外现状分析。

一.研究背景及意义

近十几年来,随着数据库系统的广泛流行以及计算机技术的快速发展,人们利用信息技术生产和搜集数据的能力大幅度提高。千万个数据库被用于商业管理、政府办公、科学研究和工程开发等,特别是网络系统的流行,使得信息爆炸性增长。这一趋势将持续发展下去。大量信息在给人们带来方便的同时也带来了一大堆的问题:第一是信息过量,难以消化;第二是信息真假难以辨认;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。面对这种状况,一个新的挑战被提出来:如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?这时出现了新的技术——数据挖掘(Data Mining)技术便应用而生了。

面对海量的存储数据,如何从中发现有价值的信息或知识,成为一项非常艰巨的任务。数据挖掘就是为迎合这种要求而产生并迅速发展起来的。数据挖掘研究的目的主要是发现知识、使数据可视化、纠正数据。

二.概述

1,数据挖掘

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,可以集成数据数据库、人工智能、数理统计、可视化、并行计算等技术。2,数据挖掘技术

数据挖掘就是对观测到的数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。它利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。

数据挖掘的过程就是知识发现的过程,其所能发现的知识有如下几种:广义型知识,反映同类事物共同性质的知识;特征型知识,反映事物各方面的特征知识;差异型知识,反映不同事物之间属性差别的知识;关联型知识,反映事物之间依赖或关联的知识;预测型知识,根据历史的和当前的数据推测未来数据;偏离型知识,揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。

数据挖掘是涉及数据库、人工智能、数理统计、机械学、人工神经网络、可视化、并行计算等的交叉学科,是目前国际上数据库和决策支持领域的最前沿的研究方向之一。

3,数据挖掘的功能

数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,按其功能可分为以 下几类。

3.1 关联分析(Association Analysis)

关联分析能寻找到数据库中大量数据的相关联系,常用的一种技术为关联规则和序列模式。关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。

3.2 聚类

输入的数据并无任何类型标记,聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很大。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。

3.3 自动预测趋势和行为

数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。

3.4 概念描述

对于数据库中庞杂的数据,人们期望以简洁的描述形式来描述汇集的数据集。概念描述就是对某类对象的内涵进行描述并概括出这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

3.5 偏差检测

数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。这常用于金融银行业中检测欺诈行为,或市场分析中分析特殊消费者的消费习惯。

三.目前的研究现状及存在的主要问题

自KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议以来。迄今为止,由美国人工智能协会主办的KDD国际研讨会已经召开了13次,规模由原来的专题讨论会发展到国际学术大会,人数由二三十人到超过千人,论文收录数量也迅速增加,研究重点也从发现方法逐渐转向系统应用直到转向大规模综合系统的开发,并且注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。其他内容的专题会议也把数据挖掘和知识发现列为议题之一,成为当前计算机科学界的一大热点。

与国外相比,国内对DMKD的研究稍晚,没有形成整体力量。1993年国家自然科学基金首次支持我们对该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。其中,北京系统工程

研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及Web数据挖掘。

四.研究内容

1,数据挖掘的过程

数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息,并使用这些信息做出决策或丰富知识。

数据挖掘的一般过程如下流程图所示:

图1,数据掘的一般过程

2.1 神经网络

神经网络方法是模拟人脑神经元结构,以MP模型和Hebb学习规则为基础。它主要有三种神经网络模型:前馈式网络、反馈式网络、自组织网络。为

2.2决策树

决策树学习着眼于从一组无次序、无规则的事中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。

2.3 遗传算法

遗传算法是一种优化技术,是模拟生物进化过程的算法。基于进化理论,并采用遗传结合、遗传变异以及自然选择等设计方法。由三个基本算子组成:繁殖、交叉、变异。

2.4 传统统计分析

这类技术建立在传统的数理统计的基础上。在数据库字段项之间存在两种关系:函数关系(能用函数公式表示的确定性关系)和相关关系(不能用函数公式表示,但仍是相关确定性关系),对它们的分析可采用判别分析、因子分析、相关分析、多元回归分

析及偏最小二乘回归方法等。

2.5 关联规则

关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。关联规则是展示属性: 值频繁地在给定数据集中一起出现的条件,是数据挖掘中作用比较广泛的知识之一。

2.6 可视化技术

可视化技术是利用计算机图形学和图像技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。可视化数据挖掘技术将可视化有机地融合到数

据挖掘之中,使用户对于数据挖掘有一个更加直接直观清晰的了解,提供让用户有效、主动参与数据挖掘过程的方法。

3,数据挖掘的应用领域

数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观、中观乃至宏观的统计,分析,综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动

进行预测。

一般Data Mining较长被应用的领域包括金融业、保险业、零售业、直效行销业、通讯业、制造业以及医疗服务业等。更广义的说法是:数据挖掘意味着在一些事实或观察数据的集合中寻找模式的决策支持过程。

4,数据挖掘的发展方向

目前,数据挖掘的研究方面主要有:数据库知识发现方面,将知识发现(KDD)与数据库系统、数据仓库系统和Web数据库系统紧密结合,力图充分利用Web中的丰富资源;机器学习方面,进一步研究知识发现方法,希望克服现存算法的计算性瓶颈,如注重对Bayes(贝叶斯)方法以及Boosting算法的研究和提高;统计领域,加大传统统计方法在数据挖掘中的应用。数据挖掘研究正蓬勃开展,在今后还会掀起更大的波澜,其研究焦点集中到以下几个方面:研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化;寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户理解,也便于在知识发现过程中的人机交互;研究在网络环境下的数据挖掘技术,特别是在Internet上建立数据挖掘服务器,与数据库服务器配合,实现数据挖掘;加强对各种非结构化数据的挖掘,如文本数据、图形图像数据、多媒体数据。

5,数据挖掘的新技术

Web数据挖掘技术首要解决半结构化数据源模型和半结构化数据模型的查询与集成问题。这就必须要有一个模型来清晰地描述Web上的数据,而寻找一个半结构化的数据模型是解决问题的关键所在。除此之外,还需要一种半结构化模型抽取技术,即自动地从现有数据中抽取半结构化模型的技术。

XML可看作一种半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性对应起来,实施精确地查询与模型抽取。利用XML.Web设计人员不仅能创建文字和图形,而且还能构建文档类型定义的多层次、相互依存的系统、数据树、元数据、超链接结构和样式表。

6,数据挖掘面临的问题和挑战

虽然数据挖掘技术已经在各方面都得到了广泛的应用,但数据挖掘技术的研究还不够成熟,在应用上有很大的局限性。正是这些局限性,促使数据挖掘技术进一步的发展:

(1)挖掘的对象 数据库更大,维数更高,属性之间更复杂,数据挖掘处理的数据通

常十分巨大。

(2)数据丢失问题 因大部分数据库不是为知识发现而定做的,那么它就有可能会存在一些重要的数据和属性丢失的问题。

(3)多种形式的输入数据 目前数据挖掘工具能处理的数据形式有限,一般只能处理数值型的结构化数据。

(4)网络与分布式环境的KDD问题 随网络的发展,资源的丰富,技术人员各自独立处理分离数据库的工作方式应是可协作的。

五.研究达到的预期结果

系统的介绍数据挖掘技术,使更多的研究人员在数据库中发现有用的,有潜在价

值的数据知识。

六.小结

通过各方面资料的查找,理解了基本的数据挖掘概念、数据挖掘技术、数据挖掘的实际应用及国内外现状。在论文中将对数据挖掘的概念以及发展概况进行介绍,并总结数据挖掘中使用的技术,主要结合当前的研究成果,分析了数据挖掘领域的。研究领域方面,可能主要集中在网络信息中的主要应用。

七.毕业论文进程安排

序号 论文各阶段安排内容 日期资料调研及方案设计 1.4-1.10数据挖掘的概论研究 1.11-1.25数据挖掘常用技术研究 1.26-2.15数据挖掘的应用研究 2.15-3.1(中期检查)数据挖掘的新技术研究 3.1-3.10数据挖掘的发展方向 3.11-3.16撰写论文 3.16-4.10论文修改 4.11-4.30准备答辩,交老师审阅 5.1-5.5毕业论文答辩 5.6-?

第四篇:大数据背景下的机器算法论文开题报告

论文题目

大数据背景下的机器算法

专业

计算机科学与技术

学生姓名

杨宇潇

学号

***4

一、选题的背景、研究现状与意义

为什么大数据分析很重要?大数据分析可帮助组织利用其数据并使用它来识别新的机会。反过来,这将导致更明智的业务移动,更有效的运营,更高的利润和更快乐的客户。

在许多早期的互联网和技术公司的支持下,大数据在2000年代初的数据热潮期间出现。有史以来第一次,软件和硬件功能是消费者产生的大量非结构化信息。搜索引擎,移动设备和工业机械等新技术可提供公司可以处理并持续增长的数据。随着可以收集的天文数据数量的增长,很明显,传统数据技术(例如数据仓库和关系数据库)不适合与大量非结构化数据一起使用。Apache软件基金会启动了第一个大数据创新项目。最重要的贡献来自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是复杂数据准备和ETL的旗舰,可以为许多数据存储或分析环境提供信息以进行深入分析。Apache Spark(由加州大学伯克利分校开发)通常用于大容量计算任务。这些任务通常是批处理ETL和ML工作负载,但与Apache Kafka等技术结合使用。

随着数据呈指数级增长,企业必须不断扩展其基础架构以最大化其数据的经济价值。在大数据的早期(大约2008年),Hadoop被大公司首次认可时,维护有用的生产系统非常昂贵且效率低下。要使用大数据,您还需要适当的人员和软件技能,以及用于处理数据和查询速度的硬件。协调所有内容同时运行是一项艰巨的任务,许多大数据项目都将失败。如今,云计算已成为市场瞬息万变的趋势。因为各种规模的公司都可以通过单击几下立即访问复杂的基础架构和技术。在这里,云提供了强大的基础架构,使企业能够胜过现有系统。

二、拟研究的主要内容(提纲)和预期目标

随着行业中数据量的爆炸性增长,大数据的概念越来越受到关注。由于大数据的大,复杂和快速变化的性质,许多用于小数据的传统机器学习算法不再适用于大数据环境中的应用程序问题。因此,在大数据环境下研究机器学习算法已成为学术界和业界的普遍关注。本文主要讨论和总结用于处理大数据的机器学习算法的研究现状。另外,由于并行处理是处理大数据的主要方法,因此我们介绍了一些并行算法,介绍了大数据环境中机器学习研究所面临的问题,最后介绍了机器学习的研究趋势,我们的目标就是研究数据量大的情况下算法和模型的关系,同时也会探讨大部分细分行业数据量不大不小的情况下算法的关系。

三、拟采用的研究方法(思路、技术路线、可行性分析论证等)

1.视觉分析。大数据分析用户包括大数据分析专业人士和一般用户,但是大数据分析的最基本要求是视觉分析。视觉分析直观地介绍了大数据的特征,并像阅读照片的读者一样容易接受。2.数据挖掘算法。大数据分析的理论中心是数据挖掘算法。不同的数据挖掘算法依赖于不同的数据类型和格式来更科学地表征数据本身。由于它们被全世界的统计学家所公认,因此各种统计方法(称为真值)可以深入到数据中并挖掘公认的值。另一方面是这些数据挖掘算法可以更快地处理大数据。如果该算法需要花费几年时间才能得出结论,那么大数据的价值是未知的。3.预测分析。大数据分析的最后一个应用领域是预测分析,发现大数据功能,科学地建立模型以及通过模型吸收新数据以预测未来数据。4.语义引擎。非结构化数据的多样化为数据分析提出了新的挑战。您需要一套工具来分析和调整数据。语义引擎必须设计有足够的人工智能,以主动从数据中提取信息。5.数据质量和数据管理。大数据分析是数据质量和数据管理的组成部分。高质量的数据和有效的数据管理确保了分析结果在学术研究和商业应用中的可靠性和价值。大数据分析的基础是前五个方面。当然,如果您更深入地研究大数据分析,则还有更多特征,更深入,更专业的大数据分析方法。

四、论文(设计)的工作进度安排

2020.03.18-2020.03.20 明确论文内容,进行相关论文资料的查找与翻译。2020.04.04-2020.04.27:撰写开题报告。

2020.04.28-2020.04.30 :设计实验。

2020.05.01-2020.05.07 :开展实验。

2020.05.08-2020.05.15 :准备中期检查。

2020.05.16-2020.05.23:根据中期检查的问题,进一步完善实验2020.05.24-2020.05.28 :完成论文初稿。

2020.05.29-2020.06.26 :论文修改完善。

五、参考文献(不少于5篇).王伟,王珊,杜小勇,覃雄派,王会举.大数据分析——rdbms与mapreduce的竞争与共生.计算机光盘软件与应用,2012.被引量:273..喻国明.大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009—2 012)的舆情模型构建.中国人民大学学报,2013.被引量:9.3.李广建,化柏林.大数据分析与情报分析关系辨析.中国图书馆学报,2014.被引量:16..王智,于戈,郭朝鹏,张一川,宋杰.大数据分析的分布式molap技术.软件学报,2014.被引量:6..王德文,孙志伟.电力用户侧大数据分析与并行负荷预测.中国电机工程学报,2015.被引量:19..江秀臣,杜修明,严英杰,盛戈皞,陈玉峰 ,郭志红.基于大数据分析的输变电设备状态数据异常检测方法.中国电机工程学报,2015.被引量:8..喻国明.呼唤“社会最大公约数”:2012年社会舆情运行态势研究——基于百度热搜词的大 数据分析.编辑之友,2013.被引量:4.

六、指导教师意见

签字: 年 月 日

七、学院院长意见及签字

(办公室盖章)

年 月 日

第五篇:开题报告

《农村小学生习作能力的培养策略研究》

开题报告

各位领导、老师们: 大家好!

我校申报的《农村小学生习作能力的培养策略研究》教育科研课题,经聊城市科学规划办批准,立项为聊城市基础教育专项课题。根据聊城市教育规划办的要求,定于今天开题。下面我代表课题组作开题报告,请各位领导、老师提指正、审议。

一、课题提出的背景及意义

1、基于时代发展的需要,21世纪是科学技术、信息技术迅猛发展的时代,在这个知识经济高速发展的时代中,人们越来越重视以语言文字作为载体,介绍科技成果,传播科学知识,交流社会信息,储存精神财富,人类已在不知不觉中进入了一个空前的写作时代。

2、基于学生一生发展的需求,《语文课程标准》指出:“学生的写作能力是语文素养的综合体现,写作是运用语言文字进行表达和交流的重要方式,是认识世界、认识自我、进行创造性表述的过程。”写作能力的高低,对于学生一生的发展起着至关重要的作用。因此,研究如何有效地进行习作教学,切实提高小学生的习作能力,是一个具有现实意义和应用价值的课题。

3、基于农村小学习作教学现状的思考,虽然新课程改革已经进行了很多年,但是我们农村小学的教育历来比较薄弱,尤其是习作教学,教师还采用“教师命题——指导——学生习作——教师批改——教师讲评”的教学程式。这些教学方法,束缚了学生的思维发展,不利于学生语文素质的提高。改革农村小学习作的教学方法,大面积提高农村小学生习作水平,已是当务之急。

二、课题研究的目的与意义

1、课题研究目的: 促进农村小学语文写作教学中方法的多样性;注重研究引导学生改变学习方式,让学生经历探究过程以获取理智和情感体验,建构知识,从而提高农村小学语文写作教学的整体水平。

2、课题研究的实践意义

(1)有助于培养学生自主创作的能力及自改习作的良好习惯;

(2)有助于促进教师评价形式的多样化,教师形成丰富的评价体系,建构起教师的自我教学特色;

(3)有助于促进民主、学生个性鲜明教学新课堂的生成,从而为语文课程教学改革注入新鲜活力。

3、课题研究的理论价值

(1)有助于丰富小学语文写作教学理论,通过培养学生习作能力,获得更加宝贵的教学经验和理论,从而使写作教学有一套更加完整的理论体系。(2)有助于丰富个性教育理论,本课题的研究将促使学生在个性化写作中成为有个性的学生,使教师在个性化教学中成为有个性的教师,从而进一步完善个性教育的理论体系。

三、课题研究的目标:

1、通过研究,让学生掌握一些写作基本知识和技巧,了解一些写作途径,培养学生的观察力,想象力和思维能力,全面提高学生语文素养;

2、促进农村小学语文写作教学中方法的多样性;

3、促进教师语文习作教学水平的提高;

4、建立有效的教学模式,促进语文课程改革的深入发展。

四、课题研究的方法

1、文献法:组织课题组成成员认真学习,密切关注教改动态,积极搜集与本课题研究相关的教学资料、信息,研读《语文课程标准》等,使课题实施建立在扎实的理论支撑基础上。

2、调查法:通过问卷、谈话等方法与手段,针对学生现有习作水平、教师习作教学方式、教材内容、学生生活等进行分析,找出对策。以发现规律性的问题,获得研究成果。

3、资料研究法:通过搜集资料,总结实验学校、优秀教师的研究成果、教学经验,及时了解同行的研究动态和特色,从而不断调整本课题的研究策略。

4、行动研究法:根据研究目标与策略进行实践,边实践边反思,通过教育实践诊断矫正教师的习作教学方法,优化教学效果。

5、总结法:通过实验研究,总结习作能力培养的成功做法,进行必要的筛选和归类,并将经验升华到理性高度。

五、课题实施的原则

1、自主性原则。

语文课应当是课堂、活动、生活三位一体的形式,语文教师必须树立强烈的语文意识,让学生亲近文本,跟着学生走,放开学生的手。让学生独立思考并交流、独特体验并表述、独到见解并习作。

2、积累性原则

语言是听说读写的基础、先导。能否听懂别人的话,能否在朗读的过程中迅速抓住文章的要点,也都是以自身语言储存作为基础的。就连思维、审美、鉴赏等一系列活动,无一不是以语言的传递、转换来完成的。作文教学的基础环节,在于帮助学生不断积累、熟悉语言,真正把古今语言的精华据为己有,为学生作文创作奠定基础。

3、合作性原则

习作也是学生、教师与学生的观察力,想象力和思维能力的对话,更提倡生生之间、师生之间的对话。这个过程就是同伴协作合作学习的过程、在共同对话中共同求知发展。

六、课题研究的计划 第一阶段:准备阶段(2013年12月-2014年5月)1.建立课题研究小组,分解研究内容,具体开展活动; 2.设计研究的具体方案和研究活动行事历;

3.查阅大量文献资料,对国内外关于小学生习作能力研究现状进行研究; 4.收集有关研究资料,对国内外关于小学生习作能力的研究对策进行研究。

第二阶段:实施阶段(2014年6月—2015年7月):

在语文课中培养学生习作能力的途径、方法、基本模式等,使语文习作教学提高小学各学段学生写作能力,完善习作教学的评价体系,提高学生习作水平。

1.开展学生 “自主习作交流会”。

2.展示学生的作文和习作心得体会,并作分析总结。

3.进行“农村小学生习作能力的培养策略研究”的课堂教学成果展示活动。4.课例搜集,撰写论文、案例、教学反思、阶段性总结等。

第三阶段 :总结阶段(2015年8月—2015年12月)总结经验,对学生的自主学习材料进行分类整理。收集总结材料,将论文、教学设计、教学案例、学生作品等汇编成册。汇编研究成果,撰写结题报告,进行研究成果鉴定

七、课题研究的保障措施

1、研究组织机构的保证:建立学校课题组。学校课题组成员,年轻富有活力,较好的具备了课题研究所必须的业务水平,知识结构合理,教学业务水平高。所有成员均为学校教学骨干,是一支具有研究能力、结构合理、素质良好,更有创新精神的研究成员队伍。

2、制度保证:我校已建立一些相应的措施和制度来确保本课题的开展,使教科研各项活动制度化,我校还出台了一些有关教科研工作的奖励制度,以此来鼓励那些在教科研工作方面成绩突出教师的积极性,确保课题研究工作的顺利实施。

八、课题小组 课题主题主持人:刘秀娥 主持全面研究工作

刘春婷习作课教学实验 张婷婷 语文课程理论指导 宋瑞敏 语文课程理论指导 宋玉焕 语文课程理论指导

刘秀娥:负责课题的总设计;统筹课题的运作;编写课题的实施方案;编制课题的管理方案;撰写课题的结题报告等。

刘春婷:负责实验课题各阶段的计划、总结;负责相关的理论研究,组织课题的教研活动;课件制作的指导等。

张婷婷:负责课堂教学的研究实验,撰写工作经验总结及教学案例;课题活动记录,资料分析,课题资料收集、整理、汇编等。

宋瑞敏:负责课件制作指导,课堂教学的研究实验,撰写工作经验总结及教学案例。

宋玉焕:负责课堂教学的研究实验,撰写工作经验总结及教学案例;课题会议记录;资料的收集、整理、存档等。

各位领导、各位老师,本课题取得了学校领导的高度重视,在人力、物力和精力上都给予了大力支持和充分保障,业得到了联校教研室领导的支持和指导,我们课题组成员有信心克服在实验、研究过程中遇到的重重困难。坚信:只要我们团结在一起共同努力,按计划扎实开展课题研究工作,我们就一定能取得圆满成功。

妹冢镇中心小学《农村小学生习作能力的培养策略研究》课题组 2013年12月10日

下载大数据开题报告(含五篇)word格式文档
下载大数据开题报告(含五篇).doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    开题报告

    安徽工程大学 本科毕业设计(论文)开题报告 题目: 年产二十万吨醋酸生产工艺设计 课 题 类 型: 设计 论文□ 学 生 姓 名: 学 号: 专 业 班 级: 教 学 单 位: 指 导 教 师: 沈凤翠......

    开题报告

    第1篇范文 一、课题开题报告含义与作用开题报告,就是当课题方向确定之后,课题负责人在调查研究的基础上撰写的报请上级批准的选题计划。它主要说明这个课题应该进行研究,自己......

    开题报告

    附件1 论房地产开发项目的成本控制 开题报告 一、 综述 (一)研究的意义 房地产业作为国民经济中的一个重要的支柱产业,在近几年来得以迅速发展,但随着国家宏观调控政策的逐步实......

    开题报告

    开题报告范例在人们越来越注重自身素养的今天,报告使用的频率越来越高,报告中涉及到专业性术语要解释清楚。写起报告来就毫无头绪?以下是小编帮大家整理的开题报告范例,仅供参考......

    开题报告

    一.为什么要写这个题目? 不等式是高中数学的重点和难点,在高考中丢分率较高,而且高考中占分值较高.在近年来的高考中, 涉及不等式的试题一般占总分的12%左右, 考查内容中不仅有......

    开题报告

    论文开题报告 学号:2011122142 姓名:方景 指导老师:孙立智 论文题目:家庭暴力立法问题研究 一、研究的目的和意义 家庭暴力是古今中外家庭常见的一种带有普遍性的丑恶现象,是一......

    开题报告

    篇一:开题报告格式及范文模板(最全面,最实用) 过氧化钙对于沉睡植物的毒害影响1. 开题报告方法介绍: 开题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用......

    开题报告111

    “十二•五”县级教育科研课题 农村小学生“养成教育”的实践与研究 开 题 报 告 剑阁县柳沟小学、垂泉小学课题组 各位领导、各位专家、老师们: 柳沟小学、垂泉小学“十二......