第一篇:数据模型设计心得
首先简单的说一下我对数据、模型、数据模型、数据模型要素以及数据模型的分类的理解。
数据:是符号。例如 张三
模型:现实世界事与物特征的抽象与模拟。如飞机模型、空气动力模型。
数据模型:通过对现实世界的事与物主要特征的分析、抽象,为信息系统的实施提供数据存取的数据结构以及相应的约束。数据模型的要素由操作、数据结构以及约束。通常情况下我们在数据模型设计的时候考虑最多的是数据结构而忽视了其他两个要素。
根据数据模型的应用层次可以分为概念数据模型模型(概念模型)、逻辑数据模型(数据模型)、以及物理数据模型(物理模型)。
概念模型:从业务的角度来考虑问题,主要用来描述事与物的概念化结构,其用途是统一业务概念,作为业务人员和技术人员之间沟通的桥梁。其描述方法有ER图、Merise图、Barker图等。在建立概念模型的过程中主要考虑的是现实世界中的事与物以及他们之间的关系而不用关注事与物的具体属性。
逻辑数据模型:从数据库的角度来考虑问题,在概念模型的基础上对事与物属性的细化以及对象整合。其描述方法有ER图。在这个层面数据模型可以分为层次、网状、关系模型。物理模型:面向具体的物理计算环境。
下面我们来说一下什么样的数据模型才是好的数据模型。数据模型的设计是自由的任意的,对于同一个系统或者同一个表每个设计人员的设计结果都是不一样的,那么有没有什么标准来评价数据模型的好与坏呢。我觉得应该从以下几个方面来考虑。
1:是否满足现有的业务需求。
2:是否易于应对未来的可能的业务变更。好的扩展性、很强的灵活性。3:是否高效。对开发人员来是否简单高效,运行是否高效。
最后来说一下在数据模型设计过程中的感悟。
0:数据模型的分层与抽象,数据模型按照考察的系统不同可以分为三个层次:通用层、行业层、业务层,通用层从社会、自然的角度去考察对象;行业层从行业的角度去考察对象;业务层从所在公司的业务发展去考察对象,这三个层次是从抽象到具体的过程,越抽象越有通用性。在某个具体的层都可以分别对实体、关系进行抽象以达到相应的灵活性、扩展性。在具体实现的过程中,将稳定的实体、实体关系与多变的业务对象分别建模,保证模型的稳定性。
1:关于扩展性 可以通过横表转纵表的方式。视图可以为开发人员提供一个接口屏蔽底层
具体实现的复杂性同时提高系统的扩展性。
2:关于数据源 要有元数据的概念同样的数据尽量在一个源头去取,这对数据的维护以及数据一致性都很有好处。
3:关于抽象 抽象是我们分析问题解决问题非常重要的手段,抽象能力的高低充分体现了数据模型设计人员的水平。
4:关于动静分离 动静是相对的没有绝对的动与静。在实体属性的选取、表空间等方面考虑动态数据与静态数据分离。用一个例子来说明这个问题吧。在电子商务系统中从灵活的角度来看后端管理系统会涉及多个表,但是对于前端展现来说如果从多个表获取数据的话那么在高并发的情况下会严重的影响性能。于是乎就有了发布这个环节。发布的目的除了对信息进行审核外,还把相关的信息发布到一个表或者缓存中再或者生成静态页面,如果使用oralce的话还可以使用物化视图。
5:关于数据字典 要重视数据字典这对开发人员理解数据模型的设计以及以后的维护都非常重要。
6:如何进行数据模型设计
【01】首先是要了解业务然后建立概念模型,确定实体以及实体关系。
【02】在概念模型的基础上生成逻辑模型,确定实体属性,标准化数据(消除多值字段达到第一范式;消除部分依赖达到第二范式;消除传递依赖达到第三范式)。
【03】模型验证:通过具体的业务来验证模型是否能满足要求。
【04】在逻辑模型的基础上生产物理模型。
7:三少 整个模型中表应该尽量的少;在一个表中字段应该尽量的少同时复合主键字段应尽量的少
8:如果在大数据量或者高并发的情况下,要充分考虑数据库的压力,事先要考虑哪些表可能是热表。要尽量的降低模块的耦合。如果使用的是oracle RAC 的话要考虑一下多实例竞争的问题,不同的模块访问不同的实例。
9:一定要做压力测试、要做充分的压力测试,要不上线后会死的很惨,移动总部的一个web项目应为没有做充分的压力测试,导致上线后不的不挂维护页面,动用了n多的资源去解决问题。
10:在做模型设计的时候要考虑项目的各个生命周期阶段对模型的要求,不能仅仅把
眼光限制在功能的实现,例如要考虑模型对以后维护的支持,对于大表的数据如何进行清除、转历史,显然delete、insert是首先可以想到的但是不可行的方法,建议做分区转换。
11: 数据模型设计对系统可变性的支撑:业务系统的变化点通常是流程相关部分,这部分会随着不同的公司、公司的不同发展阶段而变化,因此最好将这部分单独建模,独立于系统核心模型之外。
12:动静分离,11条说的是将多变的业务过程相关实体同稳定的实体以及实体关系分离,用来适应业务变化;动静分离从系统运行的角度,将实体进行分类、实体数据进行拆分,用以提升系统的稳定性、可扩展性。
13:数据模型是对现实世界的模拟,不是对现实世界的完全照搬,对于一个实体一定要重点考虑这个实体在系统内的角色,对这个角色建模而不是照搬现实世界。
以上是本人在数据模型设计方面的一点体会,写的不够细,以后会针对某点给出图文化的实例来具体说明,希望大家多给宝贵意见,共同交流。
第二篇:《数据模型与决策》学习心得
《数据模型与决策》学习心得
——运用运筹学的理念定会取得 “运筹帷幄,决胜千里”
运筹学问题和运筹思想可以追溯到古代,它和人类实践活动的各种决策并存。现在普遍认为,运筹学是近代应用数学的一个分支,主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼,然后利用数学方法进行解决。界定运筹学作为在科学界的一门独立学科的出现,应当说是在1951年,即P.M.Morse和G.E.Kimball 的专著“运筹学方法”出版的那一年。运筹学的思想贯穿了企业管理的始终,运筹学对各种决策方案进行科学评估,为管理决策服务,使得企业管理者更有效合理地利用有限资源。优胜劣汰,适者生存,这是自然界的生存法则,也是企业的生存法则。只有那些能够成功地应付环境挑战的企业,才是得以继续生存和发展的企业。作为企业的管理者,把握并运用好运筹学的理念定会取得“运筹帷幄之中,决胜千里之外”之功效。
一、企业发展原则与战略管理
企业战略管理是企业在宏观层次通过分析、预测、规划、控制等手段,充分利用本企业的人、财、物等资源,以达到优化管理,提高经济效益的目的。随着我国经济市场化的日益加深,市场竞争日趋激烈,我国企业面临着更多的环境因素的影响与冲击。企业要求得生存与发展,必须运筹帷幄,长远谋划,根据自身的资源来制定最优的经营战略,以战略统揽全局。企业战略过程包括,明确企业战略目标,制定战略规划,作出和执行战略决策,并最后对战略作出评价。企业战略管理作为企业管理形态的一种创新,应是以市场为导向的管理、是有关企业发展方向的管理、是面向未来的管理、是寻求内资源与外资源相协调的管理、是寻找企业的长期发展为目的。也就是将企业看作一个系统,来寻求系统内外的资源合理分配与优化,这正体现了运筹学的思想。我国企业战略管理的内容应根据自己的国情,制定对应的战略。主要侧重规定企业使命、分析战略环境、制定战略目标。中国现在绝大部分商品已由卖方市场转为买方市场,知识经济正向我们走来,全球经济一体化的程度在加深,我国企业不仅直接参与国内市场,还将更直接面临与世界跨国公司之间的角逐,企业间竞争的档次和水平日益提高,因而企业将面临更加复杂的竞争环境。只有确定了宏伟的奋斗目标,才能使企业凝集全部的力量,众志成城,向一个共同方向努力,争取实现有限资源的最有效的利用。显然,运筹学理念的作用举足轻重。
二、企业生产计划与市场营销
1、生产计划。使用运筹学方法从总体上确定适应需求的生产、贮存和劳动力安排等计划,以谋求最大的利润或最小的成本,运筹学主要用线性规划、整数规划以及模拟方法来解决此类问题。线性规划问题的数学模型是指求一组满足一个线性方程组(或线性不等式组,或线性方程与线性不等式混合组)的非负变量,使这组变量的一个线性函数达到最大值或最小值的数学表达式.建立数学模型的一般步骤:
(1)确定决策变量(有非负约束);对于一个企业来说,一般是直生产某产品的计划数量。
(2)写出目标函数(求最大值或最小值)确定一个目标函数;
(3)写出约束条件(由等式或不等式组成).约束条件包括指标约束需求约束、资源约束等;
(4)最后根据目标函数为作出最合适的企业生产计划决策。
2、市场营销。一个市场研究专家试图用数据证明消费者的洞察多么有意义,而一个战略管理咨询专家则强调成功营销案例中隐藏的思路更有价值。我认为市场营销管理的任务主要是探查决策环境,进行数据和信息的搜集、加工、分析,确定影响决策的因素或条件。因此,在确定目标阶段实际上包含了问题识别和问题诊断两个内容。在设计方案阶段要理解问题,建立模型,进行模拟,并获得结论,提供各种可供选择的方案(方案主要通过对产品、价格、销售渠道、促销等基本环境的控制来影响消费需求的水平、时机和构成)。评价方案阶段要根据确定的决策准则,从可行方案中选择出最优或满意的方案。这些都都可以使用运筹学的理念来为管理者提供辅助决策。
三、企业库存管理与运输问题
1、库存管理。如果说生产计划是从信息流的角度指挥、控制生产系统的运行,那么库存的管理则是从物质流的角度来指挥和控制。库存管理的目标是如何最有效的利用企业的物质资源的问题。
由于库存的物质属性,因此对生产系统的日常运行具有更直接的作用,库存是指处于存储状态的物品或商品。库存具有整合需求和供给,维持各项活动顺畅进行的功能。而库存的存在又意味着占用资金、面积、资源,这种矛盾的处境导致了库存管理的必要性与难度。现在流行的库存管理系统的库存管理软件,一般含货品进货、出货管理系统,仓库管理系统,报表系统等子模块等,运用的原理还是运筹学模型。
2、运输问题。在企业管理中经常出现运输范畴内的问题,例如,工厂的原材料从仓库运往各个生产车间,各个生产车间的产成品又分别运到成品仓库。这种运输活动一般都有若干个发货地点(产地)、又有若干个收货地点(销地);各产地有一定的可供货量(产量);各销地各有一定的需求量(销量);运输问题的实质就是如何组织调运,才能满足各地地需求,又使总的运输费用(公里数、时间等)达到最小。运输模型是线性规划的一种特殊模型。这模型不仅实用于实际物料的运输问题,还实用于其它方面:新建厂址的选择、短缺资源的分配问题、生产调度问题等。
四、企业人事管理与财务管理
1、人事管理。随着知识经济的到来,现代企业的竞争已经变成人才的竞争。知识经济条件下,经济发展中的知识含量高,对过去一直贯穿和渗透于农业和工业经济中的知识的作用就凸显得日益突出,知识经济时代的到来,是知识成为社会的主要财富,知识和信息逐步成为与人力、资金并列的企业第三大“战略资源”。因此,人力资源的竞争已成为企业间竞争的焦点。所以企业应根据自身的特点和发展状况,应该建立战略导向型的人力资源管理,根据客户总部与下属公司不同的架构,建立对应的人力资源管理模式,最大程度地通过战略纽带将“分割”的人力资源管理职能整合起来,带动企业文化、企业管理等的全面提升,以内部管理的完善获取市场竞争中的优势。这显然蕴涵的是运筹学的理念。还可以用指派问题对人员合理分配;用层次分析方法可以确定一个人才评价体系等。
2、财务管理。运筹学的理念在财务与会计中显得更为突出也就是说它解决企业如何最有效的利用资金资源的问题。其涉及到投资决策分析、成本核算分析、证券管理等。在投资决策分析中,企业如何利用剩余资金,如何投资往往有多种方案。而运筹学的作用就是要要对这些不同的投资方案进行决策,以确定最优的方案,使得企业的收益最大。通常是利用线性规划模型、决策论来进行判断。
第三篇:数据模型与决策学习体会
《数据模型与决策》课程学习体会
“数据、模型与决策”,看这个名字给人的感觉是既理论又实践还颇有些高深。所谓的数据模型与决策就是管理科学的另外一种称呼方式。管理科学(mangement science),它包含了管理和科学两门课程的内容,或者说是管理的科学。如果这个定义还是非常的模糊,那么还可以这么解释,它就是对与定量因素有关的管理问题通过应用科学的方法进行辅助管理决策制定的一门科学。再说的通俗一些,就是将管理过程中出现的定量问题,运用科学的方法,建立相应的模型进行分析,从而为管理者提供决策的依据。
我在课程学习过程中感受到其实质内容主要是线性规划模型和概率统计(检验、估计),内容主要包括统计学和数据模型决策两部分。我自己以前没有学过线性规划,所以感觉课程的这部分是成功的,通过课程的学习懂得了高级线性规划和应用。统计学主要讲授数据收集方法和数据处理方法,包括抽样方法、样本分布、参数估计、置信区间、假设检验、方差分析和回归分析。数据模型决策主要讲述线性规划内容,包括线性规划模型的建立、求解模型的软件使用。通过该课程学习我了解和掌握数据、模型和决策的基本原理、基本方法及其在管理决策中的广泛应用,提升了计算机数量分析的应用分析能力。
统计决策的思想贯穿了企业管理的始终,对各种决策方案进行科学评估,为管理决策服务,使得企业管理者更有效合理地利用有限资源。优胜劣汰,适者生存,这是自然界的生存法则,也是企业的生存法则。只有那些能够成功地应付环境挑战的企业,才是得以继续生存和发展的企业。作为企业的管理者,把握并运用好数据模型与决策的理念定会取得“运筹帷幄之中,决胜千里之外”之功效。
一、企业发展原则与战略管理
企业战略管理是企业在宏观层次通过分析、预测、规划、控制等手段,充分利用本企业的人、财、物等资源,以达到优化管理,提高经济效益的目的。随着我国经济市场化的日益加深,市场竞争日趋激烈,我国企业面临着更多的环境因素的影响与冲击。企业要求得生存与发展,必须运筹帷幄,长远谋划,根据自身的资源来制定最优的经营战略,以战略统揽全局。企业战略过程包括,明确企业战略目标,制定战略规划,作出和执行战略决策,并最后对战略作出评价。企业战略管理作为企业管理形态的一种创新,应是以市场为导向的管理、是有关企业发展方向的管理、是面向未来的管理、是寻求内资源与外资源相协调的管理、是寻找企业的长期发展为目的。也就是将企业看作一个系统,来寻求系统内外的资源合理分配与优化,这正体现了数据模型决策的思想。我国企业战略管理的内容应根据自己的国情,制定对应的战略。主要侧重规定企业使命、分析战略环境、制定战略目标。中国现在绝大部分商品已由卖方市场转为买方市场,知识经济正向我们走来,全球经济一体化的程度在加深,我国企业不仅直接参与国内市场,还将更直接面临与世界跨国公司之间的角逐,企业间竞争的档次和水平日益提高,因而企业将面临更加复杂的竞争环境。只有确定了宏伟的奋斗目标,才能使企业凝集全部的力量,众志成城,向一个共同方向努力,争取实现有限资源的最有效的利用。显然,数据模型决策理念的作用举足轻重。
二、企业人事管理与财务管理
1、人事管理。随着知识经济的到来,现代企业的竞争已经变成人才的竞争。知识经济条件下,经济发展中的知识含量高,对过去一直贯穿和渗透于农业和工业经济中的知识的作用就凸显得日益突出,知识经济时代的到来,是知识成为社会的主要财富,知识和信息逐步成为与人力、资金并列的企业第三大“战略资源”。因此,人力资源的竞争已成为企业间竞争的焦点。所以企业应根据自身的特点和发展状况,应该建立战略导向型的人力资源管理,根据客户总部与下属公司不同的架构,建立对应的人力资源管理模式,最大程度地通过战略纽带将“分割”的人力资源管理职能整合起来,带动企业文化、企业管理等的全面提升,以内部管理的完善获取市场竞争中的优势。这显然蕴涵的是数据模型决策的理念。还可以用指派问题对人员合理分配;用层次分析方法可以确定一个人才评价体系等。
2、财务管理。数据模型决策的理念在财务与会计中显得更为突出也就是说它解决企业如何最有效的利用资金资源的问题。其涉及到投资决策分析、成本核算分析、证券管理等。在投资决策分析中,企业如何利用剩余资金,如何投资往往有多种方案。而数据模型决策的作用就是要要对这些不同的投资方案进行决策,以确定最优的方案,使得企业的收益最大。通常是利用线性规划模型、决策论来进行判断。
该课程使我更好地理解与应用管理科学当中的数学与技术方面的概念。数据模型与决策还有很多实际应用的实例,例如盈亏平衡分析、资源分配、新产品定价策略、销售量预测、投资组合和供应链网络设计等方面。这些方面的内容是任何一家公司在生产经营过程当中,都是必须要考虑的内容,也是管理者必须要做出决策的内容。怎样保证管理者做出的决策都是最佳的方案,能够产生最大的经济利润呢?这些问题都是通过本门课程建立科学的模型,进行分析,从而得出最优的解决方案,知道我们管理者进行正确决策,减少因错误决策而导致的资源和利润的损失。
通过学习管理科学方法与模型来解决实际的生产管理问题,其中包括如何对问题求解的技术。改课程的学习使我了解管理科学的应用程序,而且还了解到管理科学是如何辅助决策的。教授老师还引用了很多被广泛认可的理论,引用决策分析、实践中的管理科学、案例和问题等内容,使得课程内容更加贴近管理实际。从第一节课开始教授首先从宏观上分析了管理学的本质,就管理学的科学性和艺术性在课堂上开展了讨论,并通过几个案例,例如木料的数量确定,如何决定做多少把椅子和多少把桌子可以使得收益最大等等,我不经顿悟,这门学科就是解决之前遇到的那个数学建模的学科嘛。从第一堂课开始就被教学风格所吸引,通过在教师学术造诣深厚,理论水平高超,更加让人惊喜的是他能够利用简明扼要的知识点讲述、生动丰富的案例教学和风趣幽默的语言风格,带领我们发现了看似杂乱无章的数据背后的规律和联系,向我们展示了数据模型分析的种种运用,教会了我们通过数据分析为我们的决策行为提供依据的基本方法,进而大大开拓了我们的管理视野。通过学习我发现这门课程在工作和生活中有极大的应用价值。可以不夸张的说,该课程使我提高了科学分析能力、风险和优化的决策能力和创新能力,在一定程度上影响了我工作方法和思维。
第四篇:污染源普查数据模型和应用研究
贵州省污染源普查数据库结构和应用研究
曹巍
(贵州省环保厅电子政务中心,贵州 贵阳 550002)
摘要:介绍污染源普查污染源普查数据库的内容和结构,描述了该数据库的应用方法。
关键词:污染源普查数据库SQL语言数据查询
A preview of CPSC data sturctrue and application
Abstract:The China Pollution Source Census had lasted three years to establish a database that aggregating a huge digital information of Pollutant source in several aspect.This article aim to make a preview of the database strcutrue and set some examples to explain how to use it.Key words:CPSC , database , SQL langurage , data query
0 引言
贵州省全国第一次污染源普查工作历时3年,经过入户清查、普查填表、质量审核、数据录入等工作阶段,获取139,334家各类污染源信息868万条(数据来自‚贵州省第一次全国污染源普查工作总结‛),如何应用这么大量的数据是一个亟待解决的问题。一方面,这些数据多而详实,涉及工业、农业、居民生活、集中式污染治理设施4大类,700多小类的各种基础数据,对于深入了解各种污染状况提供了可能;另一方面,涉及到的实体过于多元化,数据结构复杂,因此怎样用好这些书据以资正确判断环境形势、科学制定发展规划、强化环境监督管理、推进治污减排工作、促进经济结构调整、建设节约型社会是目前面临的一个新的课题。
1数据内容
污染源普查调查内容涉及面广,内容涵盖工业、农业、居民生活、集中式污染治理设施等各领域污染
表1:按子行业分类目录
1.1工业源。①工业企业基本情况,包括单位名称、地理位置、联系方式、经济规模、登记注册类型、行业分类等;②主要产品、主要原辅材料、能源消费情况等;③用水、排水情况、排水去向;④各类产污设施及污染治理设施建设、运行情况;⑤废水、废气、固体废物(包括危险废物)产、排污及综合利用情况;⑥污染源监测结果;⑦电磁辐射设备和放射性同位素及射线装置情况。
1.2农业源。① 种植业主要普查粮食作物、经济作物和蔬菜作物生产过程中污染物的产生情况。包括肥料和农药的名称、有效成分及其含量、施用量、施用方法、施用期等;农膜的地膜厚度、覆盖面积、使用量、回收量等;秸秆的产生量、直接还田量、露天焚烧量、随意丢弃量、饲料使用量、回收量等。②禽畜养殖业主要普查猪、奶牛、肉牛、蛋鸡、肉鸡在规模养殖条件下污染物的产生情况。包括禽畜种类、养殖组织模式、存栏量、出栏量、饲养阶段、禽畜体重、采食量、精粗饲
料主要成分含量;粪便和污水产生量、清粪方式、利用方式、利用量、排放量,粪便污水处理设施的处理方式、处理能力、运行时间和运行状态等。③ 水产养殖业主要普查鱼、虾、蟹等在规模养殖条件下污染物的产生情况。包括养殖种类、养殖方式、养殖模式、养殖产量、养殖面积,饵料、肥料、鱼药使用情况,养殖进排水等。
1.3生活源。① 排污单位基本情况,包括第三产业单位注册的基本信息,各类污染物产生、排放情况,污染治理情况等。②以城市地区为单位的机动车排气污染情况等。③城镇生活能源结构及其消费量、污染物排放情况,生活供水量、排水量及污染物浓度等。
1.4集中式污染治理设施。单位基本情况,污染治理设施情况和运行状况,污染物的处理处置量情况等,渗滤液、污泥、焚烧残渣的产生、处置及利用情况等。
2数据结构和数据应用
2.1 数据的采集和汇总
污染源普查数据的采集和汇总也被叫做数据处理工作,统一使用国务院第一次全国污染源普查数据处理软件,根据数据使用的需求不同软件分为单机版和网络版,两种版本功能、界面和操作方式保持一致。由于区(市、县)数据处理工作任务一般为简单的录入和汇总,因此一般使用单机版及其自带的mysql小型数据库,这样可以节省购置硬件服务器的经费;而市、省和国家这一层面由于会实施一定量的并行处理和较复杂的数据外部访问因此采用服务器版,以方便今后普查数据的进一步开发利用。
网络版软件可在局域网中建设,具备跨平台运行支持能力软件,采用J2EE架构,采用客户端、应用
服务器、数据库的多层C/S模式,主要在windows 2003 server或者windows xp上操作,软件架构如图示,图1:软件结构
JDBC提供的软件核心操作控件,在编译时既不需要知道DBMS也不需要知道模式信息也不需要知道模式信息,应用可以使用它驱动支持的核心SQL专用语句,同时,JDBC提供的功能允许应用在运行时向DBMS请求模式信息。JDBC软件体系结构由一组预定义的对象组成,这些对象的方法向数据库提供调用级的接口。在操作时,只需使用软件客户端操作界面上得的控制按钮实现数据处理的各种功能,主要包括数据录入、审核、查询和汇总等功能模块,不必考虑物理层的数据物理模式和概念模式,JDBC提供了丰富的数据外部模式,外部模式和概念模式之间的映射由DBMS来完成。
2.2 数据模型和结构
污染源普查数据以关系型数据库系统储存。
关系型数据库。关系型数据库以关系模型和关系代数(SQL)为基础,关系代数是基于一系列在关系(表)上操作的运算符。关系代数的基本运算符有选择(select)、投影(project)、并(union)、集合差(set difference)、笛卡尔积(Cartesian product),此外污染源普查数据操作还会常用到一些从基本关系运算符中导出的运算符,如交(intersection)、内连接(inner join)和聚集函数。
代码
XXX
XXX
XXX
XXX
…… 企业名 XXX XXX XXX XXX …… 地区 XXX XXX XXX XXX …… 污染物 XXX XXX XXX XXX …… …… …… …… …… …… ……
表2:数据表单(关系)
每个运算符在一个或多个关系上操作,并产生另一个关系作为结果。查询仅是包含这些运算符的一个表达式,表达式的结果是一个关系,它是这个查询的答案。SQL是一个描述性的语言,他不指定用于处理查询的算法,SQL定义他们的查询时,DBMS用关系代数作为中间语言来指定查询求职算法。DBMS解析SQL查询。
2.3 数据查询和应用
由于有了关系型数据模型的支撑,污染源普查的数据采集变得很简单。数据库的设计者可以很轻松的实现松散数据的整合。以重点工业污染源的套表为例(如表),所有的调查内容可分为企业基本信息、废水污染物信息、废气污染物信息和其它污染类别信息;而其中的每一块内容又分成若干具体表单来记录,在数据库系统中以表头G1XX表示。比如废气污染物信息中被分成‚锅炉及处理设施‛、‚窑炉及处理设施‛、‚工艺废气处理设施‛、‚废气污染物产‛、‚排量、废气污染物产排污系数核算‛、‚废气污染物监测‛这几张表,分别以‚G106‛—‚G109-2‛区分。
表3:重点工业污染源
在每个关系(表)中都记录一个‚代码‛,以它来唯一区分不同污染源个体,也就相当于个体的身份识别号码(identity)。它是一个字符变量,以‚‘行政区划代码’+‘污染源类型代码’+‘组织机构代码’‛的形式记录,是所有关系的键值,是唯一存在的。
在数据的查询中,我们实际上只需要在逻辑上对‚代码‛和各种类型关系进行操作就可以了。基于污染源普查的图形化控制元件,我们几乎可以进行一切想得到的数据查询事务,并可保存、导出查询结果。添加表。选择存放要查询数据的表单。不同的表单存放了不同的源信息,正确选取表单可以减小运算量。以重点工业源为例,表单数据内容如下表。
建立连接(join)。当查询涉及多张表单的时候需要将位于不同磁盘位置的字段抽象出来,同时返回一份满足条件的表单,但是被关联字段要同时满足完整性约束或部分满足完整性约束,不然会造成死锁。有三种连接方式:左连接(left join),以左表关联属性为键值、右表无纪录以null补足返回查询结果;而右连接(right join)则正好相反;全连接(inner join)需匹配左右表的分量值,为真则返回纪录。
查询条件。对查询的字段设置条件。
计算列。可设置系统支持的几种函数,比如sum()、substring()、trim()等等。
3实例分析
查询贵阳地区所有企业的二氧化硫排放总量,要求返回的表包含‚二氧化硫排放总量SO2ZL‛、‚燃烧过程二氧化硫排放量SO2RS‛和‚工艺过程二氧化硫排放量SO2GY‛的数据。
用标准的SQL语句描述该查询事务的代码如下:
而通过污染源普查软件的图形查询界面来操作的话就很简单。首先添加表‚G101‛和‚G109‛,两张表左内连接,查询条件为‚行政区划 like 5201%‛,在计算列中增加一个命名‚SO2ZL‛,公式为‚isnull(t2.rsgc,0)+isnull(t3.gygc,0)‛,保存。执行以后的结果与用SQL语句描述的结果一致。
3结论
污染源普查数据库为贵州省污染源普查技术报告提供了详实的数据信息,为环保部门的环境规划和环境管理等工作提供了第一手的数据依据,它作为贵州省环境污染状况的第一个10年样本(2007--1017),具有很高的研究价值,应该得到很好的保存和挖掘。污染源普查软件数据库提供了强大的图形化数据查询功能,易学易用,同时支持SQL语句的编译,可以进行更加复杂的查询操作,而且根据该软件的C/S架构和网络功能,可以轻松的在环保部门的办公地点架设应用系统,能够提升一定的环保信息化和科学决策能力。
参考文献
[1] Michael Kifer,Arthur Bernstein,Philip Lewis.Database Systems:An Application-Priented Approach[M].Posts & Telecom Press,2006:36-118
[2] Jeffrey D.Ullman.Jennifer Widom.A First Course in Database Systems[M].China Machine Press,2008:256-308
第五篇:数据模型与决策 课程总结
学习总结
(期中论文)
我们所用的教材叫做《数据、模型与决策》,我记得老师第一天给我们上课就提到过一些基本的概念以及思想,例如“什么是管理”;“什么是模型”;“如何对实际问题简化”等等。在这其中我认为非常重要的有以下几点:首先,管理的最初根源是因为资源是有限的。如何将有限的资源进行合理配制、优化从而达到最大的效益是我们应该要去注意的问题。其次,数学问题是有最优解的,当我们给定了一个确定的数学问题我们能够得到一个确定的解,但当我们在研究一个给定的现实管理问题的时候,我们是很难去找到一个最优解的,甚至可以说,管理问题是没有最优解的。(这不同于我们平时所做的运筹学等问题,因为我们平时所做的问题都已经经过了很多的化简,已经把现实管理问题进行了抽象,与其说那些问题是一个管理问题不如说它们是数学问题)这是因为现实中的管理问题比较复杂,具有很强的不确定性,我们只能是抓住主要矛盾,暂且不考虑次要矛盾。(当然了,当我们已经解决了主要矛盾之后我们可以开始考虑次要矛盾,因为这个时候次要矛盾已经上升为主要矛盾了。)所以我们去寻找的是管理问题的满意解而不是最优解。这两点在后面的学习建模中得到了很好的验证。
我们之前的学习大多是倾向于解决一个数学问题而不是一个管理问题。这一门课之所以在大三才开设我认为有其道理,在没有掌握基本的数学基本知识之前,我们是不可能很好地解决管理问题的,因为我们解决一个管理问题是先将其转化为一个可以解决的数学问题。但是并不是说我们掌握了高数、运筹学等知识就能顾很好的解决管理问题,因为如何把现实存在复杂的管理问题转化成为我们可以解决的数学问题正是这门课的核心内容之一。
以企业的生产计划安排作为例子,总结一下应用现行规划建模的步骤: 我们的问题是什么?(如何安排生产)
如何组合不同产品的生产、生产的种类。 我们能做什么?(不同产品的生产数量)明确决策变量,也就是管理中可以人为设定的要素。 确定决策的准则(利润最大化、成本最小化、社会责任最大化)
根据决策变量写出目标函数。 讨论决策环境(环境的约束)
决策环境包括:
1、组织内部环境要素
2、组织外部环境要素 这其中有几点需要特别注意:
企业的决策准则并不是一成不变的,它会受到很多方面的影响,例如:
1、管理者的理念
2、组织目标相关程度
3、外部环境的变化 等。 对于管理者来说,越高层的管理越复杂越宏观,处理起来也相对困难。而底层的管理问题相对简单。
(利润最大化≠成本最小化)虽然我们可以简单地理解为:利润=数量*(售价-成本)-固定成本。但利润最大化与成本最小化并不相同,这其中还有售价的变化等等。例如给定生产数量要求,企业在满足数量的基础上,就是去追求一个成本最小化而不是利润最大化。
企业外部环境要素我们认为是一个硬约束,因为它比较难通过企业自身去改变,至少很难在短时间内大幅度地去改变外部环境,例如国家相应的一些法律法规政策。而企业内部的一些环境约束我们认为是软约束,因为它可以通过招收工人,购买机器等等去改变这些限制条件。建立并求解相应的问题之后我们会得到一些数据,我们应该将每个数据的含义都表示清楚,并提交一份完整的决策报告,包括对现状的评述以及对未来的变化情况提供补救方案。一份满意的决策报告并不是单一的,它应当具有一定的适应性和稳定性,就如同老师所说,产品的售价随着市场的波动是时刻变动的,我们不可能因为一点点波动就重新建模计算,我们应当在决策报告中进行相应的说明,将一些可能存在的变动以及变动后的决策情况写清楚。每个数据的含义说明也绝不仅仅是“这个变量是紧约束”,而应该更为清晰地写为:“管理的关键是1-2环节”或者“如果可以新培训工人建议在1-2环节进行培训”等。这里还需要注意几个问题,首先这里我们考虑的都是单变量,我们应当结合边际效益递减的规律来进行决策。其次,传递效应是非线性的,(A、B商品的利润同时改变并不等于单个A改变加上单个B改变,两个因素若不独立,就具有相互效应,这也是动态复杂性的一种表现)我们应该尽可能完善我们的决策报告使得管理者可以更好地做出决策。
多地生产问题也是我们经常遇见的一种题型,单一产品的多地生产供应,需要考虑不同产地生产的数量以及单位成本。但是我们在这个模型里也做了相应的简化,我们只考虑了不同地域的生产成本,并没有去考虑不同地域的需求从而推算出不同地域的总运费。另外,如何选择生产地也是一个非常重要的问题。(如果可以新增,应该增加几个产地,每个产地的选址应该是什么样子的)
我们在大二时学习过一门课程叫做《市场营销学》,而这里我们也涉及到了“线性规划在市场营销、财务和运作管理领域的应用”。市场营销学中很重要的一个部分就是宣传,以书上案例为例,在媒体选择方面,我们需要注意:
宣传媒体的选择,各类媒体的使用量
如何去测定所谓的宣传效果(质量单位)(可以说这一点非常重要,是影响最终决策的好坏的最关键因素之一) 外部资源的可用性及内部资源的有限性
如何在活动的过程中体现出决策者的理念(偏好)
综合以上几点我们通过建模,可以给出一份包括:选择哪些媒体、每类媒体的选择数量、总的需要资金、总的宣传成果效用(这个只是一个相对的数值,在决策过程中提供一个比较的标准)
线性规划在财务和运作管理中也有很多应用,例如财务运用的投资组合,通过求解我们会发现合理安排财务的计划可以为企业节省很多成本,减少了占用的资金,为企业的发展提供了更多的可能。而生产运作管理也是我们本学期正在学习的一门课。在满足顾客的需求之下,成本最小,我们需要去分析产品成本的构成,包括: 生产成本(短期原材料、人力价格不变的情况下,生产成本不变,每一种产品在每个月的单位生产成本)
库存成本(每一种产品在每个月的库存成本)
管理成本(狭义的管理成本指由于生产活动的调整带来成本上升的部分,每个月产品总量增加单位产品的管理成本以及减少)通过这样的主要关系我们可以写出其目标函数,并根据实际来写出各约束。(这也就证明了我们必须要在具有一定的专业知识的基础上再来学习这一门课程,因为没有一些基础知识的情况下,我们很难写出具体的目标函数和约束,例如这里如果没有相应的基础知识就不能够写出成本的函数了,也不清楚成本的主要构成项目)
在高级线性规划应用中我们介绍了一种测量相同目标和目的的工作单位相对效率中的一种应用——DEA(数据包络分析)(当然除此还有其他的方法,比如非常经典的AHP也就是层次分析法)DEA方法的中心思想也就是:管理收益/管理成本(人财物),我们构建了一个假设的合成单位,然后通过与合成单位进行比较来判断该单位是否高效,哪些地方存在问题,这也解决了分析效率高低时没有“参照物”的问题。
高级线性规划也被应用到收益管理中。我们首先要知道不同商品的价格趋势是不同的。以毛衣和电视机为例比较。毛衣的价格一路走低而电视机的价格却呈现上下波动的状态。这是因为毛衣具有季节性。可能会因为使用时间,时尚型,过时等进行降价。降价商品的特征:库存(或者能力)是固定的;库存必须在过期前卖完,否则其价值迅速下降。(当然,长时间的情况下电视机的价格也是呈现下降趋势的,我们这里以一年为例)由此可以看出,不同商品的价格波动规律完全不同,我们一定要在理解其波动的基础上进行建模处理。收益管理的主要问题有:选择传统定价,差别定价,还是有限供应定价,能力的分配、网络管理、超订情况的处理。降价优化的要点是:寻找价格下降的合适时机和幅度,从而清楚库存并获得最大收益。高级线性规划应用中同样也包括投资组合。我们首先要注意一点:管理区别于经济,就是因为管理对投资主体的个人态度研究比较深入,而大部分经济管理问题简单地将主体的态度默认为风险规避即风险厌恶者。这里的投资组合并不是“最大化”问题,而是一个寻找一个“满意解”的问题。我们需要考虑三个方面:
项目的收益 项目的风险
主体的态度(风险偏好:风险爱好者,风险中立者,风险厌恶者)
我们这里与资产市场相比,实体市场的风险相对较小。我们投资于未来,所以具有不确定性,这里主要通过连贯性来判断,统计学时间序列向量。指数化证券投资基金是共同基金行业中相当流行的投资手段,书中的例子是用了普尔500收益用来作为对比。我记得当时下课我曾问过老师,有时候从五年来看,一个投资的收益率更高,一个更低,但根据这个方法我们却选择了收益低的那一个,这样是不是很不科学?其实并不是的,我们必须要有一个理念,也就是收益永远跟风险成正比。首先不论那些数据只是我任意假定的,就算是真的,也只是五年,虽然这五年的收益也许她更高,但其实它背后的风险也很大,只不过正好这几年正好都碰巧盈利而已。也许能对书中的一些模型方法提出自己的意见很好,至少说明我认真去看了,但这其实从另一方面来说,会产生这样的疑问,还是我经济学基本概念没有深深记在心里的后果。
在以上的研究基础上,我们注意到,对有些问题来说,例如包装人数、产品数等,这里的小数解没有意义,所以我们需要用到整数线性规划。(当然,像飞机、航空母舰这样的东西肯定是有意义的)整数线性规划分为三种:全整数线性规划、混合整数线性规划、0-1整数线性规划。我们可以根据具体需要进行使用。通过对Par公司的再思考,我们又引入了非线性最优化模型。有两个概念需要区分:
局部最优:如果没有其他有更好目标函数值的可行解可以在邻近域里找到,这个可行解就是局部最优的。对应局部最大值以及局部最小值。
全局最优:非线性最优化问题能有多个局部最优解,如果没有其他有更好目标函数值的可行解在可行域中找到,这个可行解就是全局最优。相对应全局最大值和全局最小值。
以par公司为例,其实我们最初的决策比较简化,对实际的决策来说参考价值不高,我们假定的利润是一成不变的,这在实际问题中是非常苛刻甚至根本不可能达到的条件。但同样的,当我们希望更真实更实际之后,我们的建模求解过程也会更加复杂,我们应当在两者之间找到平衡点,在自己力所能及的范围内做到最好。
这里还涉及到一个非常有趣的预测模型——BASS模型。Bass模型通过模仿系数以及创新系数来进行预测。为管理者的决策提供了一些帮助,例如如何设计产品可能会激发更多的潜在消费者,如何进行市场营销(高广告还是低广告),如何根据以前的经验来指导现行决策等。
等候线模型——排队论在我们的日常生活中应用非常常见,例如商场的结账点的数目、食堂用餐的座位等等。排队论的目的就是使得费用最小,这里的费用包括两部分:
1、服务费用
2、用户成本(我们认为用户成本会以某种方式回到公司)其是通过研究主要数量指标在瞬时或平稳状态下的概率分布及其数字特征,了解系统运行的基本特征。统计推断问题,建立适当的排队模型是排队论研究的第一步(检验系统是否达到平衡状态,检验顾客相继到大的独立性,确定服务时间的分布及相关参数)通过输入:
顾客总人数 顾客源 顾客到达方式 顾客流的概率分布 来确定:
1、最优的服务率
2、最佳的服务台数
3、最为合适的服务规则。但是我们在解决管理问题时需要时刻注意数学解和真正管理问题之间的一些区别。我还记得老师上课说的“维修打印机”的案例。我们如果盲目按照数学的解去进行管理可能会造成很多问题,比如员工之间的沟通交流,其在赶往维修地所花费的时间等等。我们作为管理学院的学生,不论在什么课堂上,都应该要时刻提醒自己现实管理问题十分复杂,不可草率想当然,一定要在多实践的基础上分析透彻。
在实际决策中,还有一种定量方法被人们广泛使用,就是模拟。模拟是对未来、对设想情形的不同状态给出表现,针对带有波动性参数,针对随机系统。
其基本步骤为:
建立所研究系统或问题的理论模型 建立模拟模型 验证和确认模型 利用模型试验 进行试验,分析结果
随机数的生成大致有以下几类主要类型:
1、均匀分布
2、正态分布
3、指数分布
4、离散分布的查表法
模拟在新产品的开发、机票的超额预订、库存政策、交通流量、等候线中都有较多的应用。蒙特卡洛模拟基本上是抽样试验,其目的是估计依据若干概率输入变量而定的结果变量的分布。
最后我们介绍了多准则决策,其中AHP法也就是层次分析法是一种用来解决复杂多准则决策问题的方法。其分为三个层次,分别为:
目标层(客观)
准则层(主观):选择方案的准则
方案层(客观):必须要有两个以上的备选方案 每层有若干元素,层间元素的关系用相连直线表示。(每一层只有一个目标)。提到AHP方法我们就必须提到两两比较,因为两两比较是AHP的基石。因为人的判断能力有限,很难给较多的元素进行一次准确的比较,人们倾向于在两者之间比较,这个比较相对会比较准确。配合比较判断的一致性比率方法检验,我们可以得到比较准确真实的比较程度,这对后续进行决策有着非常重要的作用。
总结:这门课的学习对我来说收获很大,相比以前单纯的数学问题的学习,这门课让我与现实管理问题更加贴近了,发现了管理问题的复杂也发现了其魅力,让身为大三的我有一些紧迫感和对未来的向往。这门课与其说在教我们方法,不如说是在传授一种思想,一种抽象、简化、转化、求解的思想。借用以前运筹学老师说过的一句话,其实你把式子列出来了,会算的人很多,但往往困难就在于你如何去列出这一些式子。这门课就正是教我们这一点。当然了,管理学知识一定不是通过一本书,一学期就能熟练掌握的,这本书只是为我们奠定下了良好的知识基础,在未来的实践过程中,我们应该要结合实际,重新回顾知识,将大学所学结合实践经验,我想这就是大学教育所希望达到的目的。
学习体会是按照老师上课的顺序结合我的课堂笔记以及一些思考对全书做一个总结。
最后,由衷地谢谢老师!您每次上课的板书都非常认真,非常精炼,相比较其他课程的普通PPT来说,更让我觉得贴近。所以我每次都会把您的板书认真记录下来。谢谢老师一学期的辛勤教育,我们在不久的将来一定不会让您失望的!
吴婉清 5504113084