第一篇:大数据工程实验室申报书
大数据工程实验室申请书
1.工程实验室拟突破的技术方向
大数据工程实验室拟突破的技术方向为:R语言与Hadoop分布式计算平台交互技术。
R语言是一种自由免费软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发。R的源代码可自由下载使用,可在多种平台下运行,包括UNIX,Linux,Windows和MacOS。R主要是以命令行操作为主,同时支持GUI的图形用户界面。R内建多种统计学及数字分析功能,R比其他统计学或数学专用的编程语言有更强的物件导向功能。R的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可媲美GNU Octave甚至商业软件MATLAB。CRAN为Comprehensive R Archive Network的简称,它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。全球有超过一百个CRAN镜像站,上万个第三方的软件包。R的行业应用非常广泛,例如:统计分析,应用数学,计量经济,金融分析,财经分析,人文科学,数据挖掘,人工智能,生物信息学,生物制药,全球地理科学,数据可视化。
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了可移植操作系统接口的要求,这样可以以流的形式访问文件系统中的数据。自2006年,Hadoop以MapReduce和HDFS独立发展开始,到今年2013年不过7年时间,Hadoop的家族已经孵化出多个Apache的顶级项目。特别是最近1-2年,发展速度越来越快,并且融入了很多新技术(YARN, Hcatalog, Oozie, Cassandra)。
Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算)成为了可能。R语言的强大之处,在于统计分析,在没有Hadoop之前,我们对于大数据的处理,要取样本,假设检验,做回归,长久以来R语言都是统计学家专属的工具。所以,hadoop重点是全量数据分析,而R语言重点是样本数据分析。两种技术放在一起,恰好是取长补短。以计算机开发人员的思路,所有事情都用Hadoop去做,没有数据建模和证明,“预测的结果”一定是有问题的;以统计人员的思路,所有的事情都用R去做,以抽样方式,得到的“预测的结果”也一定是有问题的。所以R语言与Hadoop的结合,是产界业的必然的导向,也是产界业和学术界的交集,同时也为交叉学科的人才提供了无限广阔的想象空间。
目前,通常有两种方法将R语言与大数据处理平台相结合使用。第一种方法是,在Hadoop上用MapReduce处理PB、TB量级的数据,缩小数据容量到GB量级,然后将其加载到R中进行处理。在R中,GB级别的数据可以利用MPI并行处理框架构建的集群计算。R包Rmpi、snow、snowfall都可以实现多种MPI支持的并行编程模式。第二种方法是,直接使用支持Hadoop的R包,在R中操作存放在HDFS中的数据,并利用R语言完成MapReduce算法,用来替代Java的MapReduce实现。R包Rhadoop使得R语言具有处理高达TB甚至PB级的大数据的能力。在GitHub社区可以找到该项目与开源实现代码。Rhadoop包含有三个包,分别是rhdfs,rmr以及rHBase,分别对应Hadoop系统架构中的HDFS, MapReduce和Hbase三个部分。除了Rhadoop之外,还有从R中进行Hive查询的Rhive包,能够直接从Hive中进行查询。将R和结合起来,其既能够利用分布式计算打破数据量的限制,又能够利用R中的众多优秀的免费扩展包,快速实现所需的数据处理分析。
综上所述,R语言与Hadoop的交互使用技术就成了本项目急需突破的技术方向。
2.工程实验室的主要功能与任务 大数据工程实验室的主要功能如下:
(1)为统计学学科与大数据有关的课程教学提供支持。统计学专业的就业前景非常广阔。整个世界已经迎来了大数据时代,就业市场对熟悉并且能够分析大数据的应用型人才思贤若渴,所以对《大数据挖掘》等与大数据相关的课程的理论学习和实践操作显得尤为重要。一个功能齐全、技术先进的大数据工程实验室将对大数据的学习者提供一个良好的实践环境,为学习者将来从事大数据处理做好充足的准备。
(2)为统计学学科大数据相关科研课题的研究提供支撑。在保证完成学校教学任务的前提下,大数据工程实验室打算面向学校及社会开放,为大数据相关科研课题研究提供支持。为大数据的相关科研课题的研究提供大量、详实的数据。为大数据的相关科研课题的研究提供数据处理与分析工具。
(3)在一定程度上为社会提供相关服务。可以为社会有关单位和个人提供大数据的采集、准备、存储、分析与挖掘以及大数据的展示与可视化等一系列服务。可以进行大数据分析与挖掘的设计、开发、培训,真正实现产、学、研的有机结合。
工程实验室的任务如下:
(1)培养统计学学科学生对大数据的分析与挖掘能力,尤其培养学生面对复杂大数据时分析与挖掘方法的创新。
(2)以实验室为基地建立学术氛围浓厚的大数据分析科研团队。提倡科研团队先根据数据特点构建缜密的大数据分析模型,然后依托于功能齐全的大数据工程实验室对模型进行实践验证,继而最终修正完善模型。(3)把自主研发的大数据分析与挖掘的技术应用到企业中,通过我们对模型的预测和决策确保企业的最终决策能应对日益增加的复杂性,跟上日益加快的步伐。3.工程实验室的近期和中期目标
大数据工程实验室的近期目标如下:
(1)建立先进稳定的Hadoop与R的交互平台;
(2)组建具有行业领先水平,结构合理的大数据分析与挖掘创新团队。力争使该团队成员人人熟练掌握Hadoop与R的交互技术,利用R语言对复杂大数据进行建模最终用于预测和理论上的决策;
大数据工程实验室的中期目标
(1)自主研制开发基于Hadoop与R交互平台的大数据分析与挖掘技术,尤其针对复杂数据,例如基于物联网和云计算的大数据。主要针对不同类型的复杂数据,开发基于Rhadoop的R程序包,申请国家专利,继而把R程序包上传国际CRAN镜像站,为大数据R程序的开发贡献自己的力量;
(2)把项目团队的研究成果应用到产品销售、服务销售等企业的商业预测和决策之中,构建长期有效的产学研合作机制,成为提高企业竞争力和创新能力的支撑平台。
第二篇:数据工程与知识工程教育部重点实验室.
数据工程与知识工程教育部重点实验室 2009开放基金课题申请指南
一、总则
根据“开放、联合、流动、竞争”的运行机制,数据工程与知识工程教育部实验室热忱欢迎和邀请各有关领域的国内外科研人员来实验室进行合作研究,共同推动数据工程与知识工程的发展,促进我国数据工程与知识工程研究和技术自主创新。
二、资助对象
具有中级职称(助研、讲师或工程师)以上,或具有博士学位并在科研机构、高等院校中有一定工作经验的科研、教学及技术人员。均可在《指南》规定的范围内提出资助申请。资助数量:不超过10个。其中,有2项为定向支持合作实验室。
三、申请程序
1、申请人根据实验室开放基金的主要资助方向填写“重点实验室开放基金课题申请书”一式二份。经所在单位主管领导同意后,向本实验室提出申请。开放基金申请截止日期2009年11月30日。
2、实验室将组织有关专家对提交的申请书进行评审,由实验室学术委员会确定资助项目和金额,网上公布,并通知获得资助的申请人。
3、申请书可在网上下载(deke.ruc.edu.cn),也可打电话、发电子邮件索取。
四、资助范围
围绕实验室目前支持的下列研究方向开展基础性或者应用基础性的研究。题目自定。方向一:数据工程,包括
高性能数据库系统与数据库新技术 数据永久存储与恢复迁移技术 系统与信息安全
方向二:知识工程,包括
数据挖掘与知识发现 知识网格 知识管理
五、经费额度和使用范围
每个开放课题资助金额不超过2万元人民币。经费使用参照国家科技经费管理办法进行,包括办公费、差旅费、交通费、会议费、出版费等,不支持设备购置。
资助经费不划拨到获得资助人员所在学校,采取报销的方式支付。开放基金项目申请人应完成至少1篇国内学报级或以上的学术论文,或者重要的国际会议论文。论文应标注本重点实验室名称和开放课题编号。另外,结项后一年内,需安排一次学术成果报告会。
六、联系人
易谦
电话:62512304,Email: deke@ruc.edu.cn,地址:北京市海淀区中关村大街59号中国人民大学数据工程与知识工程重点实验室,邮编:100872 此外,有关基金管理的信息和通知,请见实验室网站:deke.ruc.edu.cn
第三篇:工业大数据应用技术国家工程实验室揭牌
工业大数据应用技术国家工程实验室揭牌
“以全球发布INDICS+CMSS为起点,航天科工将与全球工业互联网平台企业开展广泛深入的合作,并与云端用户一起,锲而不舍地努力打造具有中国特色的信息化时代制造业生态系统发育载体,为实现‘中国制造2025’目标,为促进全球制造业在信息化时代的进步与发展,做出航天科工应有的贡献。”2017年6月15日,中国航天科工集团公司董事长高红卫在中国成都举办的工业互联网高峰论坛上阐述了建设中国工业互联网的决心。
据悉,此论坛由工业和信息化部、国家国防科技工业局、中国工程院、四川省人民政府、中国航天基金会、工业互联网产业联盟指导,成都市人民政府、四川省经信委、四川省国防工办、中国航天科工集团公司主办。论坛以“智·造价值,联·创未来”为主题,活动共吸引了包括工信部信软司、国防科技工业局计划司等相关部委领导、四川省政府领导,国内外工业互联网领域专家、学者,优秀企业相关负责人,中央及行业媒体记者等在内的800余人参加了。活动现场,与会嘉宾们聚焦工业互联网发展现状及趋势,积极探讨工业互联网中国模式的实践路径,分享在智能制造及工业大数据领域的实践经验。论坛开幕式由航天科工副总经理魏毅寅主持。航天科工董事长高红卫在致辞中阐述了建设我国工业互联网的意义,他表示,信息革命正在大幅度提升工业社会的生产力水平,而信息经济的主要特点是协同共享。工业互联网是集互联网技术、物联网技术、云计算技术、人工智能技术、大数据采集与挖掘技术于一体的全球性工业创新载体。通过构建制造业“信息互通、资源共享、能力协同、开放合作、互利共赢”的公共平台,通过促进云端企业智能制造、协同制造、云制造能力形成,可以最终实现“企业有组织,资源无边界”的目标,从而适应信息经济时代制造业转型升级的需要。
对于航天科工建设了2年的工业互联网平台——航天云网,董事长高红卫这样阐述该平台的建设理念:航天科工把工业互联网作为构建信息化时代制造业生态系统的载体来对待。除了要具备工业服务、物联网、制造业的互联网公共服务平台等一些基本属性以外,还要适应工业化时代的“标准化设计、大规模制造、同质化消费”模式转换为信息化时代的“定制化设计、单件小批量生产、个性化消费”模式的需求。在开幕式中,航天科工重磅发布了工业互联网云平台——INDICS(Industrialintelligentcloudsystem)。
该平台能够提供涵盖IaaS、DaaS、PaaS和SaaS的完整工业互联网服务功能,适合不同层次、类型、规模的企业;可支持各种工业设备接入、集成各类工业应用服务,构建良性工业生态体系,使制造管理更加便捷高效;构建了涵盖设备安全、网络安全、控制安全、应用安全、数据安全和商业安全的工业互联网完整安全保障体系。
会议中,中国工程院院士李伯虎、中国工程院院士倪光南、工业互联网产业联盟秘书长余晓晖分别发表了专题报告。同时,当日下午的四大分论坛同步召开,分别涉足智能工厂、工业大数据、军民融合、合作共赢四大主题。
此外,本次高峰论坛还进行了四川省经济和信息化委员会和中国信息通信研究院战略合作签约仪式、四川军民融合在线平台上线仪式、工业大数据应用技术国家工程实验室揭牌仪式和第一届“航天云网”杯工业互联网APP大赛颁奖典礼。
第四篇:优质结构工程申报书目录
XX市优质结构工程申报书
目录
一、《XX优质结构申请表》
二、XX市优质结构工程检查打分表
三、项目立项文件、中标通知书、开工意见书
四、工程承包合同复印件
五、质量目标及质量保证预控措施
六、基础、主体工程质量验收报告
七、工程文件质量汇总表
八、结构工程施工过程自评与图像资料
第五篇:建设工程竣工验收申报书
建设工程竣工验收申报书
江苏省建筑工程竣工验收报告书
工程名称:泗洪县临淮镇敬老院
建设单位:泗洪县临淮镇人民政府
江 苏 省 建 设 厅 制
质量监督单位:临淮镇城管环卫服务中心
建设单位:泗洪县临淮镇人民政府
项目法人(签字盖章):
(公章)
年月日
结 论 意 见
一、基 本 情 况
七、竣工验收时间、内容和组织型式
八、需要补充说明的问题