第一篇:大数据本科专业申报及认识
大数据本科专业申报及认识
摘要:从产业发展、数据科学的学科特征、大数据专业与其他相关专业的不同等3个方面,阐述增设大数据本科专业的合理性和必要性;以对外经济贸易大学专业建设为例,指出大数据专业人才应该能够围绕互联网平台上经济金融数据的商业价值进行挖掘并揭示数据间关系。
关键词:数据科学;大数据技术;大数据科学与应用
引言
互联网、云计算、移动计算等新兴技术拓展了人类创造和利用信息的范围和模式。联合国在2012年发布的大数据白皮书《大数据促发展:挑战与机遇》中指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响。2013年被称为中国大数据元年,各行各业开始高度关注大数据的研究和应用。在云计算技术、非结构化数据存储技术的助力下,大数据已经成为当前学术界、工业界的热点和焦点。从公司战略到产业生态,从学术研究到生产实践,从城镇管理乃至国家治理,都将发生本质的变换,大数据将成为时代变革的力量。“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围与时代特征愈发鲜明。大数据时代新特征要求设计和构建相应的管理决策分析模型与方法,有效地将信息科学和商业应用相结合。因此,掌握大数据核心技术且同时拥有“经管”专业知识的人才储备将成为国家大数据战略布局的重中之重。
1产业发展需要大数据人才
与大数据概念知名度和企业热情形成对比的是,大数据正面临全球性的人才荒。企业对新型大数据分析和预测技术人才的热情和需求正在超过传统的商业智能和信息管理人才。
根据麦肯锡报告,仅仅在美国市场,2018年大数据人才(包括高级数据分析专家)缺口将高达19万。此外美国企业还需要150万能够提出正确问题并运用大数据分析结果的大数据相关管理人才。商业数据分析是现在全美增长最迅速的领域,据New Vantage Partners公司对美国《财富》500强公司调查显示:85%的500强企业已经或正在筹划推出大数据项目,未来几年这些企业在数据分析上的投资将平均上涨36%。《哈佛商业评论》的一篇文章将数据分析称作“21世纪最热门的职业”。人力资源公司Kforce的调研报告预测2014年全球大数据相关的八大职业平均年薪将达到11.75万~14.06万美元。中国是人才大国,但掌握和应用大数据技术的创新人才仍是稀缺资源,培养大数据相关人才成为最为紧迫的问题。在这样的形势下,对外经济贸易大学于2015年7月向教育部申报开设“大数据科学与应用(目录外)”本科专业。
2.“数据科学”的时代性、科学性与合理性分析
“大数据”已经成为全球科技界和企业界关注的热点。数据为王的时代已经到来,企业关注的重点从追求计算机的计算速度转变为大数据处理能力,从以软件编程为主转变为以数据为中心。2012年3月,美国奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署。美国政府认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志,这对未来的科技与经济发展必将带来深远影响。
大数据研究的热潮激励基础研究的科研人员开始考虑“数据科学”问题。目前大数据的工程技术研究已走在科学研究的前面。美国政府6个部门启动的大数据研究计划中,国家科学基金会的研究内容提到要“形成一个包括数学、统计基础和计算机算法的独特学科”。图灵奖得主吉姆?格雷描绘了数据密集型科研第四范式的愿景,将大数据科研从第三范式(计算机模拟)中分离出来单独作为一种科研范式,是因为其研究方式不同于基于数学模型的传统研究方式。
大数据研究能成为一门科学的前提是,在一个领域发现的数据相互关系和规律具有可推广到其他领域的普适性。提炼“大数据”的共性还需要一段时间的实践积累才会逐步清晰明朗。将大量多元异构、交互性和时效性强并包含大量噪声的数据作为研究对象的专门学科,依然具备了鲜明的学科特征。
3大数据专业与其他相关专业的异质性分析
由于大数据专业主要支撑技术来源于信息技术,所以在专业申报中应将该专业所属学科门类及专业类推荐设在计算机科学与技术学科下,大数据专业与计算机学科下所属专业的关系及区分度可以概括如下几点。
(1)研究对象的侧重点不同。“大数据科学与应用”专业研究的核心对象是“大数据”,既不是硬件、软件理论研究,也不是计算机技术在某个领域的应用研究或者某一特定计算机技术的理论和应用研究,并且“大数据”引发的研究不可能在短时间完成,“大数据”问题研究具备了跨行业、跨领域的普适性。除去该专业所需的计算机学科之外的专业知识,就计算机学科内部而言,该专业所需知识在计算机学科的其他专业都有涉及,但又不被完全包含,所以不便将其归人现有专业之中。
(2)大数据科学素养要求高。该专业对学生在“大数据科学素养”方面有更高的要求,在理论上,强调学生有很好的数理统计基础、扎实的数据结构和算法的基本功,能够很好地理解和掌握各种机器学习和数据挖掘算法;在实践上,强调学生具备海量数据获取、数据组织与存储、数据清洗、数据预处理、数据分析以及数据可视化的工程实践能力,掌握数据处理各个环节的基本技能;在理论与实践结合方面,强调学生掌握处理“大数据”的先进技术和理论,即掌握与云计算相关的大数据处理平台及其生态系统,强调与数据来源紧密相关的新技术的融合与互动,即理解和掌握物联网、移动互联网相关理论和技术。
(3)专业具备前所未有的复合性特征。对大数据而言,技术走在科学前面。目前的局面是各个学科(如生物、医疗、金融等)的科学家都以自己为主处理本领域的海量数据,各领域的科学问题还掌握在各学科的科学家手里。本专业的设置希望从一开始就以培养复合型人才为目标,以大数据为核心研究对象,强调学生对专业领域(经济、金融、电子商务)数据的理解能力,深刻体现技术为数据服务的思想。
(4)与统计学专业的区别。本专业与统计学专业的最大区别来自于对IT技术的理解和掌握,强调数据在获取、清洗、存储、处理和展示等各个环节与IT技术的深度融合,而不仅仅是将IT技术作为辅助手段;就数据处理的种类而言,更重视对非结构化和半结构化数据(统计学专业处理的数据一般为结构化数据)的处理。
(5)与信息管理专业的区别。本专业与信息管理专业的区别主要体现在看待数据和信息的角度。信息管理主要强调在理解数据和业务流程的基础上,通过科学的分析和设计方法,实现管理信息系统,强调利用计算机技术介入、改造和升级原有的业务系统。“大数据”相关理论和技术更侧重对数据本身的洞察与理解,相对而言更加独立于原有的业务系统,更专注对海量、复杂、多元数据的深度分析和处理能力,更依赖于大数据处理平台和技术,也更好地支撑了物联网、移动互联网的应用和发展。
4国内外大数据相关专业发展情况及就业前景分析
4.1大数据相关专业发展情况
由于市场对大数据人才的需求日益激烈,国外很多大学开始专门开设数据分析类专业。美国US News排名Top50院校中的哈佛大学、哥伦比亚大学、斯坦福大学、芝加哥大学、麻省理工学院、卡内基梅隆大学等15所高校均开设了大数据相关专业。另外,由于大数据在2012-2013年开始兴起,人才市场无法迅速培养出大量符合企业期望的人才,美国一些公司采取了更现实的做法:和大学合作,长期培养大数据专业人才以及开展相关研究,比如英特尔就和数据学专业排名靠前的麻省理工学院合作,建立了大数据科学技术中心。
目前,国内大数据相关专业主要开设在研究生层次。2014年中国科学院大学开设首个“大数据技术与应用”专业方向,该专业面向科研发展及产业实践,培养信息技术与行业需求结合的复合型的大数据人才;2014年清华大学成立数据科学研究院,推出多学科交叉培养的大数据硕士项目;中国人民大学也设立了大数据应用与云管理、大数据与应用统计、大数据应用方向以及大数据与云计算研究方向;北京航空航天学院软件学院开设了大数据和云计算研究方向,并已经有毕业生;另外,上海交通大学、浙江大学、天津大学、厦门大学等也在研究生层次建立大数据专业。
许多高校同时也在筹建本科的大数据相关专业,西安交通大学、北京交通大学等与IBM公司合作启动了大数据本科专业的建设或者改造现有相关专业。针对当前中国市场急剧扩大的大数据与分析技能需求和人才缺口,IBM投入1亿美元在中国大学推行大数据教育,并推出“IBMU-100”合作计划,在100所高校设立大数据与分析技术中心,在其中30所高校开设本科和硕士课程,在5所大学设立“卓越中心”。
4.2复合型人才就业前景
Glassdoor公司2016年1月发布的“美国最好的工作”排名中,数据科学家位居第一,底薪为11.6万美元。通过分析大数据人才市场需求、与大数据公司研讨以及对业界的调研,我们认为对外经济贸易大学开设大数据专业及就业方向主要有如下三个方面:
(1)贸易金融方向大数据分析师:主要就业岗位在供应链融资公司、P2P信贷征信平台、商业银行等。
(2)网络营销方向大数据分析师:主要就业岗位在互联网广告、020营销公司、大型网络媒体等。
(3)物流与电子商务方向大数据分析师。主要就业岗位在电子商务公司、现代物流公司、第三方支付公司等。
学生职业生涯成长目标为首席数据官(CDO),如图1所示。
5对外经济贸易大学开设大数据分析专业的基础及对大数据专业的认识
5.1财经学校背景优势支撑大数据专业申报
对外经济贸易大学在经贸、金融、管理、法律等专业拥有得天独厚的条件。秉承创新“商业大数据人才”的培养方略,建立适合财经类院校的商务大数据专业,为国家产业转型与行业发展需求贡献合格的人才,支撑国家大数据战略的实现,是我们申报开设大数据专业的出发点。从社会发展需求出发,建设以国际化、精品化、金融与商务相结合为特色的大数据专业是我们进行专业建设的指导思想。
5.2师资队伍建设与储备
大数据专业申报所依托的信息学院近年来引进了多名优秀的具有海内外大数据分析背景的人才充实到教学科研队伍中。师资队伍多元化教育背景和工作经历是学院的巨大财富,也为该专业的创建提供了先决条件。同时2014年信息学院先后两次派教师参加大数据核心课程培训,为新专业申报进行了专业师资的储备。
5.3成立产学结合的大数据专业建设小组并开展专业研讨
信息学院为建设大数据专业,多次召开专业建设研讨会,特别邀请承担2015CCTV两会大数据制作的专业大数据公司技术总监来学院介绍大数据的采集、处理、展示等全过程;邀请新浪微博大数据中心建设人员就大数据专业人才需求、专业定位进行研讨。组建了有大数据企业参加的专业申报筹备小组,亿赞普大数据公司技术总监作为专业建设成员参与专业建设和课程体系设计与实施。
5.4与大数据企业和大数据产业协会联系紧密
信息学院大数据专业筹备组成员与中国信息化协会大数据分会、一线大数据联盟、中国大数据产业规划联盟、中国物流大数据产业合作联盟等产业协会建立了紧密的合作关系;与91金融超市建立了科学研究和实习基地;与京翰数据技术公司就物流大数据研发建立并签署了科研合作协议;2015年与京东物流大数据创新部进行合作接洽。
5.5人才培养方案及实践教学环境建设
目前大数据人才培养方案还处于探索阶段,鉴于大数据是一个交叉专业,业界的共识是在计算机科学技术相关专业基础上融合机器学习、数据挖掘的数据分析技术。针对业界共识与对外经济贸易大学学科背景实际,我们设计了具有对外经济贸易大学特色的人才培养方案,其主线是“大数据分析+信息技术+经济贸易应用”。
大数据是应用性、实践性很强的专业,信息学院拥有国家级实验教学示范中心,为大数据人才培养提供了可行的实践教学环境。
5.6对大数据专业的认识
IBM公司赋予大数据“领悟数据,提升见识,洞察秋毫,驱动优化”四个内涵,这也构成了本专业的基本特点:侧重于大数据技术的应用,强调大数据间相关性的发现,其核心能力是“大数据中的价值发现和应用”。“大数据科学与应用”专业设置具有显著的跨学科特点,学生不仅要掌握统计学、计算机科学、信息管理等专业的基础知识,还要具备其他专业领域较深的知识背景(如经济贸易或金融专业领域知识),最重要的是要有依托数据创造价值的能力。
在专业筹备和申报过程中,我们认为大数据专业的技术核心应围绕大数据采集、组织与存储、分析与处理、结果呈现而进行,而大数据的数据源及内容应该来源于经济贸易、金融交易、物流与电子商务等商务与管理应用领域。所以我们将该专业的培养目标界定为:旨在培养具备大数据科学素养,掌握经济管理、网络金融、电子商务等领域知识的专业人才,为以大数据技术为支撑的相关行业培养国际化、复合型的高素质人才;人才要具备将领域知识与计算机技术和大数据技术融合、创新的能力,能够从数据工程的视角从事经济、金融、电子商务等领域的大数据采集、组织、管理、分析以及应用的工作。
6结语
时代发展呼吁建立大数据专业人才培养体系,对外经济贸易大学“大数据科学与技术”专业申报经历了通讯评审、网上公示、专家委员会会审等系列程序。教育部学科发展与专业设置专家委员会评议后建议将专业名称统一规范为“数据科学与大数据技术”。我们认为这样更能体现工学学士学位特征。专业申报只是我们迈出的第一步,建设有对外经济贸易大学特色的大数据专业,培养受社会欢迎的、高质量的大数据人才,我们深感任重而道远。
第二篇:申报本科专业程序
第八条 高校设置专业应当具备下列基本条件:
(一)符合学校办学定位和发展规划;
(二)有稳定的人才需求;
(三)具有科学、规范的专业人才培养方案;
(四)能配备完成专业人才培养方案所必需的专职教师队伍及教学辅助人员,一般应有已设相关专业为依托;
(五)具备开办专业所必需的经费、教学用房、图书资料、仪器设备等办学条件,建立保障专业可持续发展的相关制度。
第九条 高校专业设置要在确保办学质量前提下,适度控制专业增长数量。
第十条 高校可根据社会需要、自身优势和特点,遵循人才培养规律,在专业学科属性范围内自主确定专业方向。
第十一条专业设置和调整实行备案或审批制度。备案或审批工作每年集中进行一次。教育部设专门网站作为本项工作的公共信息服务与管理平台。
第十二条 高校根据《普通高等学校本科专业目录》设置专业(国家控制布点专业除外),经以下程序报教育部备案:
(一)经高校专业设置评议专家组织审议通过,高校于每年7月31日前通过专门网站提交专业设置申请材料,内容包括:学校基本情况、人才培养方案、教师基本情况、办学条件等;
(二)高校专业设置申请材料在专门网站公示,公示期为一个月;
(三)公示期满后,高校将公示期间所提意见的研究处理情况及专业设置申请材料报高校教育主管部门(指省、自治区、直辖市教育行政部门,有关部门(单位)教育部门,下同);
(四)高校教育主管部门对高校是否具备开办专业的基本条件以及相关材料进行审核。审核后汇总,于当年9月30日前以文件形式报教育部;
(五)教育部于当年11月30日前公布备案结果。
第十三条高校设置《普通高等学校本科专业目录》规定的国家控制布点专业和尚未列入的新专业(以下简称新专业),经下列程序报教育部审批:
(一)经高校专业设置评议专家组织审议通过,高校于每年7月31日前通过专门网站提交专业设置申请材料,内容包括:学校基本情况、人才培养方案、教师基本情况、办学条件等。申请设置新专业,还须提供该专业与所属专业类中其他专业的区分情况和专业基本要求;
(二)高校专业设置申请材料在专门网站公示,公示期为一个月;
(三)公示期间,教育部委托相关教学指导委员会,对高校所申请的新专业的科学性、合理性、与已有专业的区分以及专业名称的规范性提出意见,并提交到教育部专门网站;
(四)公示期满后,高校将公示期间所提意见的研究处理情况及专业设置申请材料报高校教育主管部门;
(五)高校教育主管部门召开专业设置评议专家组织会议,进行审议。高校教育主管部门根据审议情况确定同意设置的专业并进行汇总,于当年9月30日前以文件形式(含专业设置申请材料)报教育部;
(六)教育部委托“教育部学科发展和专业设置专家委员会”对拟审批的专业进行评审,于当年11月30日前公布审批结果。
第十四条新专业经批准同意设置后,列入《特设专业名录》,予以公布。
第四章 专业调整
第十五条高校应在妥善安排拟调整专业在校学生培养工作的前提下,方可对现有专业进行调整。调整专业包括调整专业名称、学位授予门类、修业年限和撤销专业等。
第十六条高校调整专业名称时,如调整为《普通高等学校本科专业目录》专业,按备案程
序办理;如调整为新专业或国家控制布点专业,按审批程序办理。被调整的专业按撤销专业处理,并由高校教育主管部门报教育部备案。
第十七条高校调整专业学位授予门类或修业年限时,如属《普通高等学校本科专业目录》及有关要求范围内的调整(国家控制布点专业除外),按备案程序办理。其他按审批程序办理。
第十八条 高校现设专业连续五年不招生的,高校可提出撤销。
第五章 专业设置评议专家组织
第十九条 高校、高校教育主管部门和教育部设立相应的专业设置评议专家组织,或在现有专家组织中增加专业设置评议职能,并根据本规定制订工作细则。
第二十条 高校的专业设置评议专家组织根据社会人才需求、学校定位、办学条件等,对本校设置和调整的专业进行审议。
第二十一条 高校教育主管部门的专业设置评议专家组织根据本地区、本部门高等教育发展规划、人才需求、专业布点等情况,结合相关学科门类教学指导委员会所提意见,对高校设置和调整的专业进行审核、审议。
第二十二条 教育部学科发展与专业设置专家委员会作为教育部的专业设置评议专家组织,对教育部直属高校设置和调整的专业进行审核、审议;根据国家区域经济社会发展对人才的需求、专业布点、办学条件等情况,评审须由教育部审批的专业。
第六章 监督检查评估
第二十三条 高校应建立和完善专业建设的保障机制,开展专业自评工作。高校可引入专门机构和社会中介机构对学校专业水平和质量进行评估。
高校应高度重视新设专业的建设,保证新设专业的办学条件,对新设专业进行检查,发布专业建设质量报告,接受社会监督。
第二十四条高校教育主管部门综合应用拨款、规划、信息服务、政策指导、资源配置和必要的行政措施,促进所属高校加强专业内涵建设。
在新设置专业首届学生进入毕业学年时,高校教育主管部门组织实施专业评估。评估结论作为新设置专业继续招生、暂停招生或停止招生的依据。
第二十五条 教育部对高校教育主管部门及其所属高校的专业设置进行指导、检查、监督和评估;协调国务院有关部门定期发布国家经济社会发展和科技进步对人才的需求以及毕业生就业状况等信息,对高校的专业设置进行宏观引导。
第二十六条 高校的专业设置在教育教学过程中出现以下情形,教育部或高校教育主管部门应责令有关高校限期整改,问题严重的,暂停该专业招生。
(一)办学条件严重不足;
(二)教学质量低下,师资、开设课程等低于标准;
(三)明显不适应社会需求,就业率过低。
第二十七条 未经备案或审批同意设置的专业,不得进行招生宣传和招生。对违反本规定擅自设置专业或经查实申请材料弄虚作假的高校,教育部或高校教育主管部门予以通报批评,两年内不得申报增设或调整专业。
第七章 附 则
第二十八条 第二学士学位专业设置和调整按本规定执行。专科层次的高校不得设置本科专业。
第二十九条高校教育主管部门可依据本规定制订实施细则。
第三十条 本规定自发布之日起施行。教育部1999年发布的《高等学校本科专业设置规定》同时废止。
第三篇:大数据认识
大数据认识
班级:B200216电商本科2 姓名:陈家玮 学号:20021624
一
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
层面
第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术,技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践,实践是大数据的最终价值体现。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
价值
1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销 2)做小而美模式的中小微企业可以利用大数据做服务转型
3)面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值 趋势
趋势一:数据的资源化
何为资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。
趋势二:与云计算的深度结合
大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。趋势三:科学理论的突破
随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。
趋势四:数据科学和数据联盟的成立
未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。
趋势五:数据泄露泛滥
未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。
趋势六:数据管理成为核心竞争力
数据管理成为核心竞争力,直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关;此外,对于具有互联网思维的企业而言,数据资产竞争力所占比重为36.8%,数据资产的管理效果将直接影响企业的财务表现。
趋势七:数据质量是BI(商业智能)成功的关键
采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。其中要面临的一个挑战是,很多数据源会带来大量低质量数据。想要成功,企业需要理解原始数据与数据分析之间的差距,从而消除低质量数据并通过BI获得更佳决策。
趋势八:数据生态系统复合化程度加强
大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。而今,这样一套数据生态系统的基本雏形已然形成,接下来的发展将趋向于系统内部角色的细分,也就是市场的细分;系统机制的调整,也就是商业模式的创新;系统结构的调整,也就是竞争环境的调整等等,从而使得数据生态系统复合化程度逐渐增强。
二
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
优点
高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。
高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。
高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。
高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。
低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目的软件成本因此会大大降低。
hadoop大数据处理的意义
Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储,对例如像ETL这样的批处理操作相对合适,因为类似这样操作的批处理结果可以直接走向存储。Hadoop的MapReduce功能实现了将单个任务打碎,并将碎片任务(Map)发送到多个节点上,之后再以单个数据集的形式加载(Reduce)到数据仓库里。
大数据精髓
A.不是随机样本,而是全体数据:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(随机采样,以前我们通常把这看成是理所应当的限制,但高性能的数字技术让我们意识到,这其实是一种人为限制)B.不是精确性,而是混杂性:研究数据如此之多,以至于我们不再热衷于追求精确度;之前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大数据,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力
C.不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。
开源大数据生态圈:
1、Hadoop HDFS、HadoopMapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
2、.Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。
3、NoSQL,membase、MongoDb 商用大数据生态圈:
1、一体机数据库/数据仓库:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、数据仓库:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、数据集市:QlikView、Tableau、以及国内的Yonghong Data Mart。大数据分析
Analytic Visualizations(可视化分析)
不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。
Data Mining Algorithms(数据挖掘算法)
可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。
Predictive Analytic Capabilities(预测性分析能力)
数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。
Semantic Engines(语义引擎)
我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
Data Quality and Master Data Management(数据质量和数据管理)
数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。
假如大数据真的是下一个重要的技术革新的话,我们最好把精力关注在大数据能给我们带来的好处,而不仅仅是挑战。
数据存储,数据仓库
数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。
第四篇:酒店管理本科专业认识实习报告
酒店管理本科专业认识实习报告
一、实习目的通过这次实习让学生对酒店业的各个因素有一个初步的了解,运用所学专业知识,理论联系实际。学生通过现场观察、调查研究工作人员的讲解,获得与本专业有关的实际知识,进一步掌握所学理论;通过接触生产实际,提高学生分析和解决问题的能力,培养其创新意识和能力。另外还培养我们的团结合作精神,牢固树立我们的群体意识,即个人智慧只有融入集体之中才能最大限度地发挥。
二、实习概述
为了使我们了解酒店的有关情况和经营管理运作,加强我们的观察分析能力,学校组织了第19周周一至周五为期5天的认识实习。
我们先是参观了学校的实验室,然后去了桂林市内的桂湖饭店和翠园宾馆两家酒店,了解了酒店工作的性质、特点和作用,掌握了酒店工作人员的职责和各项工作程序。第一次亲身感受到了所学知识的实际运用,理论与实际相结合,让我们大开眼界,也是对以前所学知识的一个初审。通过这次认识实习,我还了解到了酒店各岗位对顾客服务的基本操作程序和管理方法,对酒店经营运作也有了一个初步的认识,为后续专业课的选择与学习打好了一个不错的基础。
三、实习内容及企业概况
1、酒店服务与管理模拟操作实验室
(1)实验室介绍
这个实验室有四个教室,分别提供前厅服务摸拟,客房服务摸拟、中西餐饮服务摸拟、酒吧服务模拟、美容化妆、形体训练等教学训练项目,前台电脑中配置有现代酒店运用的酒店管理信息系统。前厅大方简单,客房分两间,一间是标准间,另一间是双人床,都布置得整洁有序。西餐厅比较简约现代,吧台后还摆放了各种酒类,让同学们真实感受到调酒师的工作环境。
(2)实习内容
我们参观了这些模拟仿真的实验室,开始对本专业的工作场所有了初步的了解。知道了酒店管理专业的主要工作环境,尤其是实习生的主要工作环境包括前厅、餐厅、客房几个场所。
2、桂湖饭店
(1)酒店介绍
桂林桂湖饭店是一家中外合资的四星级饭店。饭店位于桂林市中心区老人山前的宝贤湖畔,坐山观水,环境优美,与著名的独秀峰、叠彩山、伏波山相映成趣,处处湖光山色,水榭楼台,入夜后灯火闪烁,流光溢彩,桂湖饭店坐落其间,像一座美丽的莲花台,成为
景区内的标志性建筑。
桂湖饭店拥有风格雅致的各类型客房258套,凭窗远眺,一窗一景,湖光山色,尽收眼底。酒店客房突出中国传统民族风格,舒适宜人,入住令人心旷神怡。酒店还精心打造了独立的商务楼层,设置了专用的办公、休闲区域,让客人在青山绿水的环绕中轻松度假,有序处理日常公务。
桂湖饭店拥有成功接待休闲度假客人和举办各类商务会展的经验,深受海内外知名人士的一致赞扬。酒店优美自然的生态环境和热忱的个性化服务被英国最著名的“SAGA”度假旅行社定位为桂林唯一定点度假酒店。专业的会议策划水准与精细、周到的完美服务,以及国际一流的会议设施,使桂湖饭店成为各类商务洽谈、商务会议、学术交流等商务活动的最佳首选。
酒店餐饮设施齐全,设有中、西餐厅以及伴山苑、依山居包厢群,装修典雅尊贵,拥有金牌主厨,酒店推出的粤、川、鲁、湘菜和地方菜,以优质的出品和服务,成为桂林市星级酒店餐饮品牌。位于酒店底楼的健身娱乐中心,为客人提供齐全的休闲服务设施,在旅游、度假和峰会的闲暇之余,可以放松心情,健康身心。
2001年,桂湖饭店就加入中国金钥匙组织和世界金钥匙酒店联盟,成为广西首家拥有酒店服务万能博士“金钥匙”的酒店,2005年至2007年连续获得国际金钥匙组织颁发的服务业至尊荣誉“钻石奖”、“服务品质奖”、管理创新奖”和“最佳经营奖”。2005获得广西“十佳”星级酒店称号。2008年,桂湖饭店又引进“皇金管家”服务理念,在对客服务中进一步提升“精细、周到、圆满、美好”的服务理念,打造桂湖品牌,以专业化,个性化的服务,让客人获得更优质的服务。
桂湖饭店自1990年开业以来,酒店营收屡创新高,多年来房均综合收入在桂林同星级酒店行列中位居榜首。连续7年被评为外商投资先进企业,现在酒店正以“以客为尊,用心服务”的全新面貌,迎接着四方客人,开创更美好的前景。
(2)实习内容
给我们讲解的工作人员是桂湖饭店人力资源部的部门经理。经理告诉我们,桂湖饭店正在由原来主要接待旅行团向商务型酒店转型中。
我们通过参观酒店的前厅、餐厅、会议室、客房了解到桂湖饭店每年都会接纳大量的实习生和学生小时工,为我们提供大量的实习机会。前厅是一个酒店的神经枢纽,酒店所有工作的起始点就是这里。前厅工作人员的礼仪、外语及工作细致程度要求都是很高的,而且是实习生比较愿意实习的岗位。另外,桂湖饭店与其他的酒店不同的是他们将行李部与前厅分开,避免了前厅拥挤杂乱的现象。酒店承办的婚宴和旅行团团餐比较多,因为其高质量的餐点和服务,预定日期已经排至明年10月,可谓相当受欢迎。由于顾客对象多以团体形式出现,酒店的大型餐厅较多,西式小餐桌仅在二楼有布置。大型餐厅有圆桌型的中式餐桌,也有自助式的。其中自助式的餐厅是推拉门,空间大小可自由控制,餐厅装置落地窗,可直观室外游泳池。我们参观了酒店的标准间和商务套房。桂湖饭店客房的装修风
格是以中式风格为主的,主要是为了迎合国外游客对中国传统文化的需求,同时也彰显了酒店的特色,形成独具一格的装修风格。酒店的客房也充分体现了节能环保的理念。他们的客房打扫是常住客人三日一换,非常住客人一客一换;毛巾也是根据客人要求来更换。酒店会在挂毛巾出张贴提示,与客人达成共识,提示用中、日、英三种语言书写,方便其阅读。酒店客房的服务手册也是用着三种文字书写,并附带针线包。卫生间内还设有启瓶器和体重秤,设置人性化。客房门后贴有紧急疏散图,确保发生紧急情况时,客人可以在第一时间找到逃生出口。客房布置小沙发和办公桌,桌上摆放鲜花,看着简约时尚。数码商务房设有不间断电源,保证客人离开房间仍有持续电源充电。房内电脑室无硬盘的,避免客人信息泄露,酒店同时贴有提示告知客人,电脑室无储存功能的。商务房还设有阳台,墙壁底部的壁灯光线柔和,达到了夜间在不影响客人休息的前提下的照明要求。酒店客房走廊设有喷淋头、烟雾感知器、手机信号接收器和音响,为客人安全和通讯提供保障和便利。经理在向我们展示客房的同时,还教我们客房服务是的一些注意事项,如先按门铃再敲门,开门时要稍有停顿等。由于我们参观时酒店正在装修,他们还在每一客房中摆放了致歉信,以取得客人的理解。
除了以上参观,经理还向我们解说了“金钥匙”和“黄金管家”的服务理念。让我们了解了“金钥匙”的服务对象主要是大众客户,可以提供全国范围内的旅游、酒店等预定服务;“黄金管家”的服务对象是VIP客户,它的服务就更加全面合理。桂湖饭店主的组织结构要是传统型的职能型组织结构,它对员工的激励机制主要是根据绩效考核来决定。小费的处理经理也有所提及,让我提前为将来的实习打下基础。
另外,我还了解到,实习生主要分布在前厅、餐饮、客房等部门,其他的如人事、财务等部门实习生相对较少。大学毕业生要做好吃苦的准备,虽然在实习阶段专科毕业生的竞争力比较大,但是本科生的发展空间更广阔。
2、翠园宾馆
(1)酒店介绍 桂林翠园宾馆位于“甲天下”的漓水之畔。紧临有桂林市徽之称的象鼻山,得山水之灵气,是一座装饰一新,具有欧路式建筑风格的新型旅游宾馆。下榻其中引人留连,让人既领略自然美景,又享受中西文化交融之乐。
桂林翠园宾馆占地面积1.3公顷,建筑面积为7150平方米,宾馆拥有标准客房100间,总统套间一间,豪华套间2间,商务客房间数及其它房型。客房内设中央空调、彩电、电话、地毯、卫生间及各式高档家俱; 拥有可容纳30人、50人、70人、120人、300人会议室,教室1间,以及中西餐厅、卡拉OK包厢、歌舞厅、茶艺休闲吧、商场、浴脚堂、发廊、停车场,可承办各种婚宴、生日酒会等。配有专项旅游服务,可容纳200多人会议集团和干部培训。
服务设施:停车场、出租车、收费停车场、商场、票务服务、行李存放服务、洗衣服务、叫醒服务、国内长途电话、国际长途电话
餐饮休闲:中餐厅、咖啡厅、限时送餐服务;迪斯科舞厅、卡拉OK厅
周围景观:象鼻山、漓江边、桂林市会展中心、南城百货、中心广场、正阳步行街信 用 卡:万事达卡(Master)、威士卡(VISA)、运通卡(AMEX)、大莱卡(Dinners Club)、JCB卡、银联卡
(2)实习内容
翠园宾馆相比桂湖饭店来说,虽然装修上也是欧式的,但是菜色和服务上更具本土特色,为我们讲解的负责人也更亲和一些。通过询问我了解到翠园酒店现在也处于转型阶段,他们现在主要由对外逐渐改为内部服务,专门向政府固定部门提供服务。
我们参观了酒店的前厅、餐厅、会议室及客房。酒店的餐厅是自助式的,但是也可以改装成中式餐厅。餐厅的墙壁上挂了各式各样的桂林特色菜,让人看了食欲大开。餐厅前十庭院式的草地和小桥,旁边还设有健身器材,让人觉得亲切。二楼设有多间会议厅及客房,客房的装修风格比较偏家居式,让人有回家的感觉。
酒店的大堂还设有特产超市,供入住客人选择,价格也比较合理,避免了外地客人盲目购买特产而上当受骗。
通过桂湖饭店和翠园宾馆的参观,我知道了每一家酒店都有自己的特色,而他们的员工要融入他们的文化中,通过自己的服务,向客人转达这一特色。
四、实习总结与体会
虽然我们现在才大一,专业课程也只接触了管理学一门,认识实习的过程中有很多现象都不能用专业知识去解释。但是这一次实习确实让我有机会将所学知识与实际相结合。认识实习并不能完整地学到一些专业知识,但作为一次大学生与实际环境的直接接触,而且是第一次,必将对以后的专业知识的学习和个人发展有所帮助。我们参观的桂湖饭店和翠园宾馆向我们提供了许多课本上学不到的知识,例如我们对客房服务只有一个脑海中的概念,并不清楚其中的具体流程,这次实习让我现场体验了一次。重新确立了自己的目标和自己未来发展的方向。
我明白了酒店的运营需要各个部门的配合,工作要细致谨慎,因为自己的一个错误可能会造成其他部门的工作失误,给其他部门甚至顾客造成不便。团队合作也是十分有必要的。另外,作为一个服务行业,亲和的态度和得当的礼仪也是内在的要求,让客人感到宾至如归是这个行业的职业要求。服务业还有一个要求就是与人沟通的能力,这就要求我们有一定的表达能力和理解能力。面对国外的客人,外语要求也是十分高的。
通过对这个职业要求的分析,我重新规划了一下我的大学生活。除了学好专业课程,还要尽量掌握外语课程,社会人文课程也要参加以培养我内在的气质和内涵。服务业的实习生在实习期的工作量是十分大的,因此,我们要有吃苦耐劳的决心,和脚踏实地的耐心。同时要有信心,相信这个行业的发展前景是广阔的。
第五篇:大数据工程实验室申报书
大数据工程实验室申请书
1.工程实验室拟突破的技术方向
大数据工程实验室拟突破的技术方向为:R语言与Hadoop分布式计算平台交互技术。
R语言是一种自由免费软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发。R的源代码可自由下载使用,可在多种平台下运行,包括UNIX,Linux,Windows和MacOS。R主要是以命令行操作为主,同时支持GUI的图形用户界面。R内建多种统计学及数字分析功能,R比其他统计学或数学专用的编程语言有更强的物件导向功能。R的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可媲美GNU Octave甚至商业软件MATLAB。CRAN为Comprehensive R Archive Network的简称,它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。全球有超过一百个CRAN镜像站,上万个第三方的软件包。R的行业应用非常广泛,例如:统计分析,应用数学,计量经济,金融分析,财经分析,人文科学,数据挖掘,人工智能,生物信息学,生物制药,全球地理科学,数据可视化。
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了可移植操作系统接口的要求,这样可以以流的形式访问文件系统中的数据。自2006年,Hadoop以MapReduce和HDFS独立发展开始,到今年2013年不过7年时间,Hadoop的家族已经孵化出多个Apache的顶级项目。特别是最近1-2年,发展速度越来越快,并且融入了很多新技术(YARN, Hcatalog, Oozie, Cassandra)。
Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算)成为了可能。R语言的强大之处,在于统计分析,在没有Hadoop之前,我们对于大数据的处理,要取样本,假设检验,做回归,长久以来R语言都是统计学家专属的工具。所以,hadoop重点是全量数据分析,而R语言重点是样本数据分析。两种技术放在一起,恰好是取长补短。以计算机开发人员的思路,所有事情都用Hadoop去做,没有数据建模和证明,“预测的结果”一定是有问题的;以统计人员的思路,所有的事情都用R去做,以抽样方式,得到的“预测的结果”也一定是有问题的。所以R语言与Hadoop的结合,是产界业的必然的导向,也是产界业和学术界的交集,同时也为交叉学科的人才提供了无限广阔的想象空间。
目前,通常有两种方法将R语言与大数据处理平台相结合使用。第一种方法是,在Hadoop上用MapReduce处理PB、TB量级的数据,缩小数据容量到GB量级,然后将其加载到R中进行处理。在R中,GB级别的数据可以利用MPI并行处理框架构建的集群计算。R包Rmpi、snow、snowfall都可以实现多种MPI支持的并行编程模式。第二种方法是,直接使用支持Hadoop的R包,在R中操作存放在HDFS中的数据,并利用R语言完成MapReduce算法,用来替代Java的MapReduce实现。R包Rhadoop使得R语言具有处理高达TB甚至PB级的大数据的能力。在GitHub社区可以找到该项目与开源实现代码。Rhadoop包含有三个包,分别是rhdfs,rmr以及rHBase,分别对应Hadoop系统架构中的HDFS, MapReduce和Hbase三个部分。除了Rhadoop之外,还有从R中进行Hive查询的Rhive包,能够直接从Hive中进行查询。将R和结合起来,其既能够利用分布式计算打破数据量的限制,又能够利用R中的众多优秀的免费扩展包,快速实现所需的数据处理分析。
综上所述,R语言与Hadoop的交互使用技术就成了本项目急需突破的技术方向。
2.工程实验室的主要功能与任务 大数据工程实验室的主要功能如下:
(1)为统计学学科与大数据有关的课程教学提供支持。统计学专业的就业前景非常广阔。整个世界已经迎来了大数据时代,就业市场对熟悉并且能够分析大数据的应用型人才思贤若渴,所以对《大数据挖掘》等与大数据相关的课程的理论学习和实践操作显得尤为重要。一个功能齐全、技术先进的大数据工程实验室将对大数据的学习者提供一个良好的实践环境,为学习者将来从事大数据处理做好充足的准备。
(2)为统计学学科大数据相关科研课题的研究提供支撑。在保证完成学校教学任务的前提下,大数据工程实验室打算面向学校及社会开放,为大数据相关科研课题研究提供支持。为大数据的相关科研课题的研究提供大量、详实的数据。为大数据的相关科研课题的研究提供数据处理与分析工具。
(3)在一定程度上为社会提供相关服务。可以为社会有关单位和个人提供大数据的采集、准备、存储、分析与挖掘以及大数据的展示与可视化等一系列服务。可以进行大数据分析与挖掘的设计、开发、培训,真正实现产、学、研的有机结合。
工程实验室的任务如下:
(1)培养统计学学科学生对大数据的分析与挖掘能力,尤其培养学生面对复杂大数据时分析与挖掘方法的创新。
(2)以实验室为基地建立学术氛围浓厚的大数据分析科研团队。提倡科研团队先根据数据特点构建缜密的大数据分析模型,然后依托于功能齐全的大数据工程实验室对模型进行实践验证,继而最终修正完善模型。(3)把自主研发的大数据分析与挖掘的技术应用到企业中,通过我们对模型的预测和决策确保企业的最终决策能应对日益增加的复杂性,跟上日益加快的步伐。3.工程实验室的近期和中期目标
大数据工程实验室的近期目标如下:
(1)建立先进稳定的Hadoop与R的交互平台;
(2)组建具有行业领先水平,结构合理的大数据分析与挖掘创新团队。力争使该团队成员人人熟练掌握Hadoop与R的交互技术,利用R语言对复杂大数据进行建模最终用于预测和理论上的决策;
大数据工程实验室的中期目标
(1)自主研制开发基于Hadoop与R交互平台的大数据分析与挖掘技术,尤其针对复杂数据,例如基于物联网和云计算的大数据。主要针对不同类型的复杂数据,开发基于Rhadoop的R程序包,申请国家专利,继而把R程序包上传国际CRAN镜像站,为大数据R程序的开发贡献自己的力量;
(2)把项目团队的研究成果应用到产品销售、服务销售等企业的商业预测和决策之中,构建长期有效的产学研合作机制,成为提高企业竞争力和创新能力的支撑平台。