第一篇:数据库考试期末总结
第1章 数据库系统概述
1、基本概念
• 数据库、数据库管理系统、数据库系统 • 数据库系统的特点和功能 • 数据抽象
– 三种数据抽象能力 – 三种数据库模式 – 两种数据独立性
• 数据库系统的用户 • 数据模型、数据库语言 • 数据库管理系统的结构
2、重点
• 数据库、数据库管理系统、数据库系统 • 两种数据独立性
第2章 关系数据库系统
1、知识点
• 关系数据模型
– 数据结构 – 完整性约束 – 操作
• 关系运算的安全性
• 关系代数、元组关系演算、域关系演算的等价性 • SQL – 交互式 – 嵌入式
2、基本概念
• 关系、属性、元组、关系模式、关系实例 • 关系的性质
• 候选键、主键、键属性、非键属性、外部键 • 实体完整性约束、关联完整性约束 • 关系代数操作的定义
• 关系代数的基本操作和附加操作 • 专门的关系运算 • SQL语言的子语言
• 每个SQL语句的功能及语法格式
3、重点
• 关系数据模型 • 关系代数 • SQL语句
第3章 数据库的安全性与完整性
1、知识点 • 安全性
– 定义
– 需要解决的问题 – 解决的方法
• 完整性
– 定义 – 类型
– 定义和验证方法
2、基本概念 • 安全性的定义 • 完整性的定义 • 完整性的类型
第4章 数据库设计概述与需求分析
1、基本概念 • DB设计的任务 • DB的生命周期 • DB的设计过程 • DB的需求分析的任务、目标、步骤
第5章 概念数据库设计
1、知识点
• 实体联系模型(ER模型)• 实体、实体型
• 实体的属性、实体的属性值、复合属性、单值属性、多值属性、导出属性、空值
• 键、简单键、复合键 • 实体间的联系
• 实体对应约束(1:
1、1:n、m:n)、实体关联约束(全域关联约束、部分关联约束)
• 弱实体型、弱实体、识别实体型、识别联系 • 弱实体型的部分键 • ER图
2、基本概念
• 复合属性、多值属性、导出属性 • 1:
1、1:n、m:n联系 • 概念数据库设计的任务 • 概念数据库设计的目标 • 概念数据库设计的步骤
• 概念数据库设计的方法、视图综合设计方法 • 概念数据库设计的策略
3、重点 • ER图
第6章 逻辑数据库设计
1、知识点
• 形成初始关系模式
– 普通实体、弱实体、多值属性、各种联系
• 函数依赖、完全函数依赖、部分函数依赖、传递函数依赖 • 给定关系实例,求函数依赖集 • Armstrong公理系统、三条推理规则 • 求属性闭包、求候选键
• 两个函数依赖集等价的判定、求最小函数依赖集 • 关系模式的规范形式
– 1NF、2NF、3NF、BCNF • 关系模式的规范化方法
– 无损连接性、函数依赖保持性、判别方法 – 关系模式的分解算法
2、基本概念
• 逻辑数据库设计的任务 • 逻辑数据库设计的目标 • 逻辑数据库设计的步骤 • 初始关系模式可能存在的问题
• 函数依赖、完全函数依赖、部分函数依赖、传递函数依赖 • Armstrong公理系统、三条推理规则 • 1NF、2NF、3NF、BCNF •
3、重点
• 形成初始关系模式,并指出每个关系模式的主键和外键 • 给定关系实例,求函数依赖集 • 求属性闭包、求候选键 • 判断两个函数依赖集等价
• 求与给定函数依赖集等价的最小函数依赖集 • 判断一个关系模式最高属于几范式 • 判断给定的分解是否具有无损连接性 • 关系模式的3NF、BCNF分解算法
第7章 物理数据库设计
1、知识点 • 物理数据库设计的任务 • 物理数据库设计的步骤
第8章 物理存储结构
1、知识点
• 物理存储设备
– 磁盘的存储特性和访问特性
• 磁盘冗余技术 • 文件和文件记录
• 各种文件结构的存储空间和查询时间的计算 • 各种索引的存储空间和查询时间的计算
2、基本概念 • 记录
• 定长记录文件、边长记录文件 • 跨块记录、非跨块记录 • 无序文件、有序文件 • 索引域、索引文件、索引记录 • 稀疏索引、稠密索引 • 主索引、辅助索引、聚集索引 • B树、B+树
3、重点
• 各种文件和索引占用的空间计算 • 利用各种文件和索引的查询时间的计算
第9章 数据库管理系统的数据字典
1、重点
• 数据字典的概念 • 数据字典中存储的信息
• 把数据字典作为普通关系处理具有两个优点
第10章 关系代数操作的实现算法
1、重点
• 查询处理的过程
• 各个关系代数操作的算法及代价分析
第11章 查询优化技术
1、知识点
• 关系代数的等价变换规律 • 启发式代数优化规则 • 初始关系代数表达式
• 关系代数表达式到查询树的转换 • 启发式关系代数优化算法 • 基于复杂性估计的查询优化算法 • 语义查询优化方法
2、重点
• 关系代数的等价变换规律 • 启发式代数优化规则 • 初始关系代数表达式
• 关系代数表达式到查询树的转换 • 启发式关系代数优化算法
第12章 并发控制技术
1、知识点 • 事务
• 不对并发事务进行控制导致的问题 • 事务的性质
• 事务的调度、串行调度、并行调度 • 可串行的调度 • 冲突 • 冲突等价 • 冲突可串行
• 冲突可串行的测试方法 • 两段锁协议
2、基本概念
• 事务处理包括哪两方面的内容 • 不对并发事务进行控制导致的问题
• 事务、事务的状态、事务的性质、事务的原子性 • 调度、串行调度、并行调度、可串行调度 • 冲突、冲突等价、冲突可串行
3、重点 • 基本概念
• 冲突可串行的测试方法
• 两段锁协议
第13章 数据库恢复技术
1、知识点 • 日志 • 日志的内容 • 日志的产生过程
• 使用日志进行系统恢复的方法
2、重点
• 使用推迟更新技术(REDO日志技术)和即时更新技术(UNDO/REDO日志)进行系统恢复的方法,包括恢复时所做的操作以及恢复后数据库中数据项的值。
第二篇:数据库期末复习总结
数据库原理综合习题答案
1.1 名词解释
(1)DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。
(2)DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。
(3)DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。
(4)1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。
(5)1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。
(6)M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。
(7)数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。
(6)概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。
(9)结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。
(10)层次模型:用树型结构表示实体类型及实体间联系的数据模型。
(11)网状模型:用有向图结构表示实体类型及实体间联系的数据模型。
(12)关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。
(13)概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。
(14)外模式:是用户与数据库系统的接口,是用户用到的那部
分数据的描述。
(15)内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。
(16)模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。
(17)外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。
(18)数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。
(19)物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。
(20)逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项),那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是对概念模式的修改尽量不影响外模式和应用程序。
(21)宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言,这些语言称为宿主语言(host language),简称主语言。
(22)DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。
(23)DML:数据操纵语言(Data Manipulation Language),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。
(24)交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。
(25)嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。
(26)过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。
(27)非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。
Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。
(28)DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。对数据库的操作都要通过访问DD才能实现。
(29)DD系统:管理DD的实用程序称为“DD系统”。
1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。
文件系统有三个缺陷:
(1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。
(2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。
(3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。
1.3 数据库阶段的数据管理有些什么特点?
(1)采用复杂的数据模型表示数据结构
(2)有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级)
(3)数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据,也可以用程序方式操作数据库。
(4)系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性,以保证数据库中数据是安全的、正确的和可靠的。
(5)对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。
1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。
实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等;也可以是抽象的事件,如:一次借书、一场足球赛等。
属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性,相应值域为字符、字符串、整数和字符串型。
字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。
记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。
1.5 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?
联系:
(1)逻辑记录与物理记录都是记录,是字段的有序集合;
(2)逻辑文件与物理文件都是文件,是同一类记录的汇集。
区别:
(1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。
(2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语),都是用来描述实际存储设备上的数据。
(3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。
1.6 为某百货公司设计一个ER模型。
百 货管辖若干个连锁商店,每家商店经营若干商品,每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。
试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。
实体:商店(商店编号,店名,店址,店经理)
商品(商品编号,商品名,单价,产地)
职工(职工编号,职工名,性别,工资)
联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。
SE(商店—职工之间1:N的联系),联系属性为“月销售量”。
关系模式集:商店模式(商店编号,店名,店址,店经理)
商品模式(商品编号,商品名,单价,产地,商店编号,月销售量)
职工模式(职工编号,职工名,性别,工资,商店编号,开始时间)
1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。
ER模型的主要特点:
(1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。
(2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。
层次模型的特点:
(1)优点:记录之间的联系通过指针实现,查询效率较高。
(2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。
网状模型的特点:
(1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。
(2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。
关系模型的特点:
用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。
1.8 试述概念模式在数据库结构中的重要地位。
概念模式是数据库中
全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。
1.9 数据独立性与数据联系这两个概念有什么区别?
数据独立性是指应用程序与数据之间相互独立,不受影响。
数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。
1.10 试述DBMS在用户访问数据库过程中所起的作用.用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。
(结合P22“用户访问数据的过程”来理解)
1.11 试述DBMS的主要功能。
DBMS的主要功能有:
(1)数据库的定义功能
(2)数据库的操纵功能
(3)数据库的保护功能
(4)数据库的存储管理
(5)数据库的维护功能
(6)数据字典
1.12 试叙DBMS对数据库的保护功能。
DBMS对数据库的保护主要通过四个方面实现:
(1)数据库的恢复。
(2)数据库的并发控制。
(3)数据库的完整性控制。
(4)数据库的安全性控制。
1.13 试叙DBMS对数据库的维护功能。
DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。
主要有四个实用程序:
(1)数据装载程序(loading)
(2)备份程序(backup)
(3)文件重组织程序
(4)性能监控程序
1.14 从模块结构看,DBMS由哪些部分组成?
从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器
(1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序
(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器
(以上几题具体可参照书上p20-21)
1.15 DBS由哪几个部分组成?
DBS由四部分组成:数据库、硬件、软件、数据库管理员。
1.16 什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么?
DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。DBA承担创建、监控和维护整个数据库结构的责任。
DBA应具有下列素质:
(1)熟悉企
业全部数据的性质和用途;
(2)对用户的需求有充分的了解;
(3)对系统的性能非常熟悉。
DBA的主要职责有五点:
(1)概念模式定义
(2)内模式定义
(3)根据要求修改数据库的概念模式和内模式
(4)对数据库访问的授权
(5)完整性约束的说明
1.17 试对DBS的全局结构作详细解释。
参照教材p24-25。
1.18 使用DBS的用户有哪几类? 使用DBS的用户有四类:
1)DBA
2)专业用户
3)应用程序员
4)最终用户
1.19 DBMS的查询处理器有哪些功能?
DBMS的查询处理器可分成四个成分:
1)DML编译器
2)嵌入型DML的预编译器
3)DDL编译器
4)查询运行核心程序
(各成分功能参照P24)
1.20 DBMS的存储处理器有哪些功能?
DBMS的存储处理器提供了应用程序访问数据库中数据的界面,可分成四个成分:
1)授权和完整性管理器
2)事务管理器
3)文件管理器
4)缓冲区管理器
(各成分功能参照P25)
1.21 磁盘存储器中有哪四类主要的数据结构?
数据文件:存储了数据库中的数据;
数据字典(DD):存储三级结构的描述;
索引文件:为提高查询速度而设置的逻辑排序手段;
统计数据组织:存储DBS运行时统计分析数据。
(1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。
(2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。关系模式不涉及到物理存储方面的描述,仅仅是对数据特性的描述。
(3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。
(4)属性:实体的一个特征。在关系模型中,字段称为属性。
(5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。
(6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。
(7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。
(8)候选键:不含有多余属性的超键称为候选键。
(9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”)
(10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。
(11)实体完整性规则:这条
规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值就起不了唯一标识元组的作用。
(12)参照完整性规则: 这条规则要求“不引用不存在的实体”。其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中,K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。3)外键值是否允许空应视具体问题而定。
(13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。
(14)非过程性语言:编程时只须指出需要什么信息,不必给出具体的操作步骤。各种关系查询语言均属于非过程性语言。
(15)无限关系:当一个关系中存在无穷多个元组时,此关系为无限关系。如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合,这是一个无限关系。
(16)无穷验证:在验证公式时需对无穷多个元组进行验证就是无穷验证。如验证公式(u)(P(u))的真假时需对所有的元组u进行验证,这是一个无穷验证的问题。
2.2 为什么关系中的元组没有先后顺序?
因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有行序。
2.3 为什么关系中不允许有重复元组?
因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制,关系中的元组不能重复,可以用键来标识唯一的元组。
2.4 关系与普通的表格、文件有什么区别?
关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:
1)关系中每一个属性值都是不可分解的。
2)关系中不允许出现相同的元组(没有重复元组)。
3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。
4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。
2.5 笛卡尔积、等值联接、自然联接三者之间有什么区别?
笛卡尔积对两个关系R和S进行乘操作,产生的关系中元组个数为两个关系中元组个数之积。
等值联接则是在笛卡尔积的结果上再进行选择操作,从关系R和S的笛卡儿积中选择对应属性值相等的元组;
自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作,并去掉重复的公共属性列。当两个关系没有公共属性时,自然连接就转化我笛卡尔积。
2.8 如果R是二元关
系,那么下列元组表达式的结果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}
这个表达式的意思是:从关系R中选择元组,该元组满足:第1分量值或第2分量值至少有一个不等于其他某元组。由于R是二元关系,只有两个分量,由于没有重复元组,上述条件显然满足。所以,这个表达式结果就是关系R。
2.9 假设R和S分别是三元和二元关系,试把表达式π1,5(σ2=4∨3=4(R×S))转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)域表达式。
(1)汉语表达式:
从R×S关系中选择满足下列条件的元组:
第2分量(R中第2分量)与第4分量(S中第1分量)值相等,或第3分量(R中第3分量)与第4分量(S中第1分量)值相等;并取第1列与第5列组成的新关系。
(2)元组表达式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])}(3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))}
2.10 假设R和S都是二元关系,试把元组表达式{t|R(t)∧(u)(S(u)∧u[1]≠t[2])}转换成等价的:(1)汉语查询句子;(2)域表达式:(3)关系代数表达式。
(1)汉语表达式:选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。
(2)域表达式:{xy|(u)(v)(R(xy)∧S(uv)∧(u≠y))}(3)关系代数表达式:π1,2(σ2≠3(R×S))
2.11 试把域表达式{ab|R(ab)∧R(ba)}转换成等价的:
(1)汉语查询句子;(2)关系代数表达式;(3)元组表达式。
(1)汉语查询句子:选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。
(2)关系代数表达式:π1,2(σ1=4∧2=3(R×R));
(3)元组表达式:{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])}
试用关系代数表达式表示下列查询语句。(见下一题)
2.14 试用元组表达式表示上题中各个查询语句。
(1)检索LIU老师所授课程的课程号、课程名。
πC#,CNAME(σTEACHER='LIU'(C))
{t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])}
(2)检索年龄大于23岁的男学生的学号与姓名。
πS#,SNAME(σAGE>'23'∧SEX='男'(S))
{t|(u)(S(u)∧u[3]>'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])}
(3)检索学号为S3学生所学课程的课程名与任课教师名。πCNAME,TEACHER(σS#='S3'(SCC))
{t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])}
(4)检索至少选修LIU老
师所授课程中一门课程的女学生的姓名。
πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC))
{t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])}
(5)检索WANG同学不学的课程号。
πC#(C)-πC#(σSNAME='WANG'(SSC))
或者,πC#(SC)-πC#(σSNAME='WANG'(SSC))(全部课程号减去WANG同学所学的课程号){t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])}
(从C中选择满足条件的元组:SC中的所有元组,如果学号与C中所选元组相同的话,其在S中对应的姓名肯定不是'wang'。)
Notice:“p1=>p2”的含义是:如果p1为真,则p2为真。
(6)检索至少选修两门课程的学生学号。
πS#(σ1=4∧2≠5(SC×SC))
SC自乘之后,再选择(同一个学号中两个课程号不同的元组),投影。
{t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]}
(7)检索全部学生都选修的课程的课程号与课程名。
πC#,CNAME(C(πS#,C#(SC)÷πS#(S)))(涉及到全部值时,应用除法,“除数”是“全部”){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])}
(8)检索选修课程包含LIU老师所授课程的学生学号。
πS#(σTEACHER='LIU'(SCC))
{t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])}
如果LIU老师有多门课程,则选修课程包含LIU老师所授全部课程的学生学号为:
πS#,C#(SC)÷πC#(σTEACHER='LIU'(C))
2.15 在教学数据库S、SC、C中,用户有一查询语句:检索女同学选修课程的课程名和任课教师名。(1)试写出该查询的关系代数表达式;(2)试写出查询优化的关系代数表达式。
(1)πCNAME,TEACHER(σSEX='女'(SSCC))
(2)优化为:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S))))
(基本思路:尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值。
2.16 在2.15题中,(1)画出该查询初始的关系代数表达式的语法树。
(2)使用2.4.4节的优化算法,对语法树进行优化,并画出优化后的语法树。
该查询初始的关系代数表达式的语法树
优化后的语法树
2.17 为什么要对关系代数表达式进行优化?
在关系代数运算中,各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤,直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化,可以提高系统的操作效率,达到执行过程即省时间又省空间的目的。
3.1 名词解释
(1)SQL模式:SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。
(2)SQL数据库:SQL(Structured Query Language),即‘结构
式查询语言’,采用英语单词表示和结构式的语法规则。一个SQL数据库是表的汇集,它用一个或多个SQL模式定义。
(3)基本表:在SQL中,把传统的关系模型中的关系模式称为基本表(Base Table)。基本表是实际存储在数据库中的表,对应一个关系。
(4)存储文件:在SQL中,把传统的关系模型中的存储模式称为存储文件(Stored File)。每个存储文件与外部存储器上一个物理文件对应。
(5)视图:在SQL中,把传统的关系模型中的子模式称为视图(View),视图是从若干基本表和(或)其他视图构造出来的表。
(6)行:在SQL中,把传统的关系模型中的元组称为行(row)。
(7)列:在SQL中,把传统的关系模型中的属性称为列(coloumn)。
(8)实表:基本表被称为“实表”,它是实际存放在数据库中的表。
(9)虚表:视图被称为“虚表”,创建一个视图时,只把视图的定义存储在数据词典中,而不存储视图所对应的数据。
(10)相关子查询:在嵌套查询中出现的符合以下特征的子查询:子查询中查询条件依赖于外层查询中的某个值,所以子查询的处理不只一次,要反复求值,以供外层查询使用。
(11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。联接查询的效率比嵌套查询低。
(12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。
(13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。
(14)共享变量:SQL和宿主语言的接口。共享变量有宿主语言程序定义,再用SQL的DECLARE语句说明,SQL语句就可引用这些变量传递数据库信息。
(15)游标:游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式。
(16)卷游标:为了克服游标在推进时不能返回的不便,SQL2提供了卷游标技术。卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进,也能一行行返回。
3.2 对于教学数据库的三个基本表
学生 S(S#,SNAME,AGE,SEX)
学习SC(S#,C#,GRADE)
课程 C(C#,CNAME,TEACHER)
试用SQL的查询语句表达下列查询:
(1)检索LIU老师所授课程的课程号和课程名。
SELECT C#,CNAME
FROM C
WHERE TEACHER=‘LIU’
(2)检索年龄大于23岁的男学生的学号和姓名。
SELECT S#,SNAME
FROM S
WHERE(AGE>23)AND(SEX=‘M’)
(3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。
SELECT SNAME
FROM S
WHERE SEX=‘F’ AND S# IN
(SELECT S#
FROM SC
WHERE C# IN
(SELECT C#
OM C
WHERE TEACHER=‘LIU’)
NOTICE:有多种写法,比如联接查询写法:
SELECT SNAME
FROM S,SC,C
WHERE SEX=‘F’ AND SC.S#=S.S#
AND SC.C#=C.C#
AND TEACHER='LIU' 但上一种写法更好一些。
(4)检索WANG同学不学的课程的课程号。
SELECT C#
FROM C
WHERE C# NOT IN
(SELECT C#
FROM SC
WHERE S# IN
(SELECT S#
FROM S
WHERE SNAME='WANG'))
FR
(5)检索至少选修两门课程的学生学号。
SELECT DISTINCT X.SNO
FROM SC X,SC Y
WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:对表SC进行自连接,X,Y是SC的两个别名。
(6)检索全部学生都选修的课程的课程号与课程名。
SELECT C#,CNAME
FROM C
WHERE NOT EXISTS
(SELECT *
FROM S
WHERE S# NOT IN
(SELECT *
FROM SC
WHERE SC.C#=C.C#))
要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。
其中,“不选这门课的同学”可以表示为:
SELECT *
FROM S
WHERE S# NOT IN
(SELECT *
FROM SC
WHERE SC.C#=C.C#)
或者
SELECT *
FROM S
WHERE
NOT EXISTS
(SELECT *
FROM SC
WHERE S.S#=C.S# AND
SC.C#=C.C#)
(7)检索选修课程包含LIU老师所授课的学生学号。
SELECT DISTINCT S#
FROM SC
WHERE C# IN
(SELECT C#
FROM C
WHERE TEACHER='LIU'))
3.3 设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:
(1)πA(R)
(2)σB='17'(R)
(3)R×S
(4))πA,F(σC=D(R×S))(1)SELECT A FROM R
(2)SELECT * FROM R WHERE B='17'(3)SELECT A,B,C,D,E,F FROM R,S
(4)SELECT A,F FROM R,S WHERE R.C=S.D
3.4 3.4 设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:
(1)R∪S
(2)R∩S
(3)R-S
(4)πA,B(R)πB,C(S)
(1)SELECT A,B,C
FROM R
UNION
SELECT A,B,C
FROM S
(2)SELECT A,B,C
FROM R
INTERSECT
SELECT A,B,C
FROM S
(3)SELECT A,B,C
FROM R
WHERE NOT EXISTS
(SELECT A,B,C
FROM S
WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)
(4)SELECT R.A,R.B,S.C
FROM R,S
WHE
RE R.B=S.B
3.5 试叙述SQL语言的关系代数特点和元组演算特点。
(P61-62)
3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询:
(1)统计有学生选修的课程门数。
SELECT COUNT(DISTINCT C#)FROM SC
(2)求选修C4课程的学生的平均年龄。
SELECT AVG(AGE)
FROM S
WHERE S# IN
(SELECT S#
FROM SC
WHERE C#='C4')或者,SELECT AVG(AGE)
FROM S,SC
WHERE S.S#=SC.S# AND C#='004'
(3)求LIU老师所授课程的每门课程的学生平均成绩。
SELECT CNAME,AVG(GRADE)
FROM SC ,C
WHERE SC.C#=C.C# AND TEACHER='LIU'
GROUP BY C#
(4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列。
SELECT DISTINCT C#,COUNT(S#)
FROM SC
GROUP BY C#
HAVING COUNT(S#)>10
ORDER BY 2 DESC, C# ASC
(5)检索学号比WANG同学大,而年龄比他小的学生姓名。
SELECT X.SNAME
FROM S AS X, S AS Y
WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE (6)检索姓名以WANG打头的所有学生的姓名和年龄。 SELECT SNAME,AGE FROM S WHERE SNAME LIKE 'WANG%' (7)在SC中检索成绩为空值的学生学号和课程号。 SELECT S#,C# FROM SC WHERE GRADE IS NULL (8)求年龄大于女同学平均年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE)FROM S AS Y WHERE Y.SEX='女') (9)求年龄大于所有女同学年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>ALL(SELECT AGE FROM S AS Y WHERE Y.SEX='女') 3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作: (1)往基本表S中插入一个学生元组(‘S9’,‘WU’,18)。 INSERT INTO S(S#,SNAME,AGE)VALUES('59','WU',18) (2)在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别,并把检索到的值送往另一个已存在的基本表STUDENT(S#,SANME,SEX)。 INSERT INTO STUDENT(S#,SNAME,SEX) SELECT S#,SNAME,SEX FROM S WHERE NOT EXISTS (SELECT * FROM SC WHERE GRADE<80 AND S.S#=SC.S#) (3)在基本表SC中删除尚无成绩的选课元组。 DELETE FROM SC WHERE GRADE IS NULL(4)把WANG同学的学习选课和成绩全部删去。 DELE TE FROM SC WHERE S# IN (SELECT S# FROM S WHERE SNAME='WANG') (5)把选修MATHS课不及格的成绩全改为空值。 UPDATE SC SET GRADE=NULL WHERE GRADE<60 AND C# IN (SELECT C# FROM C WHERE CNAME='MATHS') (6)把低于总平均成绩的女同学成绩提高5%。 UPDATE SC SET GRADE=GRADE*1.05 WHERE GRADE<(SELECT AVG(GRADE)FROM SC)AND S# IN(SELECT S# FROM S WHERE SEX='F') (7)在基本表SC中修改C4课程的成绩,若成绩小于等于75分时提高5%,若成绩大于75分时提高4%(用两个UPDATE语句实现)。 UPDATE SC SET GRADE=GRADE*1.05 WHERE C#='C4' AND GRADE<=75 UPDATE SC SET GRADE=GRADE*1.04 WHERE C#='C4' AND GRADE>75 3.8 在第1章例1.4中提到“仓库管理”关系模型有五个关系模式: 零件 PART(P#,PNAME,COLOR,WEIGHT) 项目 PROJECT(J#,JNAME,DATE) 供应商 SUPPLIER(S#,SNAME,SADDR) 供应 P_P(J#,P#,TOTOAL) 采购 P_S(P#,S#,QUANTITY) (1)试用SQL DDL语句定义上述五个基本表,并说明主键和外键。 CREATE TABLE PART (P# CHAR(4)NOT NULL,PNAME CHAR(12)NOT NULL,COLOR CHAR(10),WEIGHT REAL,PRIMARY KEY(P#)) CREATE TABLE PROJECT (J# CHAR(4)NOT NULL,JNAME CHAR(12)NOT NULL,DATE DATE,PRIMARY KEY(J#)) CREATE TABLE SUPLIER (S# CHAR(4)NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20),PRIMARY KEY(S#)) CREATE TABLE P_P (J# CHAR(4),P# CHAR(4),TOTAL INTEGER,PRIMARY KEY(J#,P#),FOREIGN KEY(J#)REFERENCE PROJECT(J#),FOREIGN KEY(P#)REFERENCE PART(P#)) CREATE TABLE P_S (P# CHAR(4),S# CHAR(4),QUANTITY INTEGER,PRIMARY KEY(P#,S#),FOREIGN KEY(P#)REFERENCE PART(P#),FOREIGN KEY(S#)REFERENCE SUPLIER(S#)) (2)试将PROGECT、P_P、PART三个基本表的自然联接定义为一个视图VIEW1,PART、P_S、SUPPLIER 三个基本表的自然联接定义为一个视图VIEW2。 CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL) AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL FROM PROJECT,PART,P_P WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J #CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY) AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUA NTITY FROM PART,P_S,SUPPLIER WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S# (3)试在上述两个视图的基础上进行数据查询: 1)检索上海的供应商所供应的零件的编号和名字。 SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI' 2)检索项目J4所用零件的供应商编号和名字。 SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4') 3.9 对于教学数据库中基本表SC,已建立下列视图: CREATE VIEW S_GRADE(S#,C_NUM,AVG_GRADE) AS SELECT S#,COUNT(C#),AVG(GRADE) FROM SC GROUP BY S# 试判断下列查询和更新是否允许执行。若允许,写出转换到基本表SC上的相应操作。 (1)SELECT * FROM S_GRADE 允许 SELECT S#,COUNT(C#),AVG(GRADE)FROM SC GROUP BY S# (2)SELECT S#,C_NUM FROM S_GRADE WHERE AVG_GRADE>80 允许 SELECT S#,COUNT(C#)FROM SC WHERE AVG(GRADE)>80 (3)SELECT S#,AVG_GRADE FROM S_GRADE WHERE C_NUM>(SELECT C_NUM FROM S_GRADE WHERE S#=‘S4’) 允许 SELECT S#,AVG(GRADE) FROM SC AS X WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#)FROM SC AS Y WHERE Y.S#='S4') GROUP BY S# (4)UPDATE S_GRADE SET C_NUM=C_NUM+1 WHERE S#=‘S4’ 不允许 (5)DELETE FROM S_GRADE WHERE C_NUM>4 不允许 3.10 预处理方式对于嵌入式SQL的实现有什么重要意义? 预处理方式是先用预处理程序对源程序进行扫描,识别出SQL语句,并处理成宿主语言的函数调用形式;然后再用宿主语言的编译程序把源程序编译成目标程序。这样,不用扩充宿主语言的编译程序,就能处理SQL语句。 3.11 在宿主语言的程序中使用SQL语句有哪些规定? 在宿主语言的程序中使用SLQ语句有以下规定: (1)在程序中要区分SQL语句与宿主语言语句 (2)允许嵌入的SQL语句引用宿主语言的程序变量(称为共享变量),但有两条规定: 1)引用时,这些变量前必须加“:”作为前缀标识,以示与数据库中变量有区别。 2)这些变量由宿主语言的程序定义,并用SQL的DECLARE语句说明。 (3)SQL的集合处理方式与宿主语言单记录处理方式之间要协调。需要采用 游标机制,把集合操作转换成单记录处理方式。 3.12 SQL的集合处理方式与宿主语言单记录处理方式之间如何协调? 由于SQL语句处理的是记录集合,而宿主语言语句一次只能处理一个记录,因此需要用游标(cousor)机制,把集合操作转换成单记录处理方式。 2.13 嵌入式SQL语句何时不必涉及到游标?何时必须涉及到游标? (1)INSERT、DELETE、UPDATE语句,查询结果肯定是单元组时的SELECT语句,都可直接嵌入在主程序中使用,不必涉及到游标。 (2)当SELECT语句查询结果是多个元组时,此时宿主语言程序无法使用,一定要用游标机制把多个元组一次一个地传送给宿主语言处理。 4.1 名词解释 (1)函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。 (2)函数依赖的逻辑蕴涵:设F是关系模式R的一个函数依赖集,X,Y是R的属性子集,如果从F中的函数依赖能够推出X→Y,则称F逻辑蕴涵X→Y,记为F|=X→Y。 (3)部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立,那么称W→A是局部依赖,否则称W→A为完全依赖。 (4)完全函数依赖:见上。 (5)传递依赖:在关系模式中,如果Y→X,X→A,且XY(X不决定Y),AX(A不属于X),那么称Y→A是传递依赖。 (6)函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。 (7)1NF: 第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。第一范式的模式要求属性值不可再分裂成更小部分,即属性项不能是属性组合和组属性组成。 (8)2NF: 第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。(注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R的非主属性。) (9)3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。 (10)BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R 是BCNF的模式。 (11)4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时,X必是R的超键,那么称R是第四范式的模式。 (12)推理规则的正确性和完备性:正确性是指,如果X→Y是从推理规则推出的,那么X→Y在F+中。完备性是指,不能从F使用推理规则导出的函数依赖不在F+中。 (13)依赖集的覆盖和等价:关系模式R(U)上的两个函数依赖集F和G,如果满足F+=G+,则称F和G是等价的。如果F和G等价,则可称F覆盖G或G覆盖F。 (14)最小依赖集:如果函数集合F满足以下三个条件:(1)F中每个函数依赖的右部都是单属性;(2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A})∪{Z→A}与F 不等价。则称F为最小函数依赖集合,记为Fmin。 (15)无损联接:设R是一关系模式,分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是“无损联接分解”。 (16)保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变,即关系模式R到ρ={R1,R2,...,Rk}的分解,使函数依赖集F被F这些Ri上的投影蕴涵。 (17)多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时,就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD)X→→Y在关系模式R中成立。 4.2 关系模式R有n个属性,在模式R上可能成立的函数依赖有多少个? 其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个? (要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言,本题没多大意义) 所有属性相互依赖时,函数依赖最多。 · 平凡的函数依赖:对于函数依赖X→Y,如果YX,那么称X→Y是一个“平凡的函数依赖”。 4.3 建立关于系、学生、班级、社团等信息的一个关系数据库,一个系有若干个专业,每个专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区,每个学生可以参加若干个社团,每个社团有若干学生。 描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。 描述班级的属性有:班级号、专业名、系名、人数、入校年份。 描述系的属性有:系名、系号、系办公地点、人数。 描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。 请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。指出各关系的候选键、外部键,有没有全键存在? 各关系模式如下: 学生(学号,姓名,出生年月,系名,班级号,宿舍区) 班级(班级号,专业名,系名,人数,入校年份) 系(系名,系号,系办公地点,人数) 社团(社团名,成立年份,地点,人数) 加入社团(社团名,学号,学生参加社团的年份) 学生(学号,姓名,出生年月,系名,班级号,宿舍区) ●“学生”关系的最小函数依赖集为: Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区} ●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区 ●候选键是学号,外部键是班级号,系名。 notice: 在关系模式中,如果Y→X,X→A,且XY(X不决定Y),A不属于X,那么称Y→A是传递依赖。 班级(班级号,专业名,系名,人数,入校年份) ●“班级”关系的最小函数依赖集为: Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名} (假设没有相同的系,不同系中专业名可以相同)●以上关系模式中不存在传递函数依赖。 ●“(系名,专业名)→班级号”是完全函数依赖。 ●候选键是(系名,专业名),班级号,外部键是系名。 系(系名,系号,系办公地点,人数) ●“系”关系的最小函数依赖集为: Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号} ●以上关系模式中不存在传递函数依赖 ●候选键是系名,系号 社团(社团名,成立年份,地点,人数) ●“社团”关系的最小函数依赖集为: Fmin={社团名→成立年份,社团名→地点,社团名→人数) ●以上关系模式中不存在传递函数依赖。 ●候选键是社团名 加入社团(社团名,学号,学生参加社团的年份) ●“加入社团”关系的最小函数依赖集为: Fmin={(社团名,学号)→学生参加社团的年份)●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。 ●以上关系模式中不存在传递函数依赖。 ●候选键是(社团名,学号)。 4.4 对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示,那么X→φ,φ→Y,φ→φ的含义是什么? 根据函数依赖的定义,以上三个表达式的含义为: (1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。 (2)φ→Y表示Y函数依赖于空属性。由此可 知该关系中所有元组中Y属性的值均相同。 (3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。 4.5 已知关系模式R(ABC),F={A→C,B→C},求F+。 可以直接通过自反律、增广律、传递律加以推广: F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC} 4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点: (1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。 首先,检查是否具有无损联接特点: 第1种解法--算法4.2: (1)构造表 (2)根据A→B进行处理 结果第二行全是a行,因此分解是无损联接分解。 第2种解法:(定理4.8)设 R1=AB,R2=AC R1∩R2=A R2-R1=B ∵A→B,∴该分解是无损联接分解。 然后,检查分解是否保持函数依赖 πR1(F1)={A→B,以及按自反率推出的一些函数依赖} πR2(F1)={按自反率推出的一些函数依赖} F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。 (2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC} 首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8)设 R1=AB,R2=AC R1∩R2=A R2-R1=C ∵A→C,∴该分解是无损联接分解。 然后,检查分解是否保持函数依赖 πR1(F2)={按自反率推出的一些函数依赖} πR2(F2)={A→C,以及按自反率推出的一些函数依赖} ∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。 (3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.首先,检查是否具有无损联接特点: 第1种解法: (1)构造表 (2)根据A→B进行处理 没有一行全是a行。因此这个分解不具有无损联接特性。 第2种解法:(定理4.8) 设 R1=AB,R2=BC R1∩R2=B R2-R1=C,R1-R2=A ∵B→C,B→A不在F3中 ∴该分解不具有无损联接特性。 然后,检查分解是否保持函数依赖 πR1(F3)={A→B,以及按自反率推出的一些函数依赖} πR2(F3)={按自反率推出的一些函数依赖} F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。 (4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC} 首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8) 设 R1=AC,R2=BC R1(AC)∩R2(BC)=C R2-R1=B,R1-R2=A ∵C→B,C→A不在F4中 ∴该分解不具有无损联接特性。 然后,检查分解是否保持函数依赖 πR1(F2)={按自反率推出的一些函数依赖} πR2(F2)={B→C,以及按自反率推出的一些函数依赖} ∵F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。 4.7 设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗?(1) πAB(F)={A→B,及按自反律所推导出的一些平凡函数依赖} πAC(F)={A→C,及按自反律所推导出的一些平凡函数依赖} πAD(F)={A→D,及按自反律所推导出的一些平凡函数依赖}(2) (1)构造表 (2)根据A→B,B→C,A→D,D→C进行处理 每一行都是a,ρ相对于F是无损联接分解。 (3)πAB(F)∪πAC(F)∪πAD(F)={A→B,A→C,A→D}, 没有满足B→C,D→C函数依赖,因此ρ相对于F的这个分解不保持函数依赖。 4.8 设R=ABCD,R上的F={A→C,D→C,BD→A}, 试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。 根据算法4.2 (1)构造表 (2)根据A→C,D→C,BD→A进行处理 没有一行都是a,所以,ρ相对于F不是无损联接分解。 4.9 设R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。 (1)若首先把R分解成{ACD,BD},试求F在这两个模式上的投影。 (2)ACD和BD是BCNF吗?如果不是,请进一步分解。 (1)πACD(F)={A→C} πBD(F)={D→B} (2)因为根据BCNF的定义,要求关系模式是第一范式,且每个属性都不传递依赖于R的侯选键。BCD中(A,D)为候选键,可是(A,D)→A, A→C,所以它不是BCNF模式。 它可进一步分解为:{AC,DC},此时AC,DC均为BCNF模式。 BD是BCNF,因为R2(BD)是第一范式,且每个属性都不传递依赖于D(候选键),所以它是BCNF模式。 4.10 设R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D}; (1)如果F1是R上的函数依赖集,此时ρ是无损联接分解吗?若不是,试举出反例。 (2)如果F2是R上的函数依赖集呢? (1)不是无损联接。可由算法4.2判断或由定理4.8判断。 根据算法4.2 (1)构造表 (2)根据A→B,B→C进行处理 结果没有出现一行全a的情况,所以它不是无损联接。举例如下: 设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)} 则有:r1=πAB(r)={(a1b1),(a2b2)} r2=πBC(r)={(b1c1),(b2c1)} r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={(a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a,所以ρ不是无损联接。 (2)如果F2是R上的函数依赖,则可以判断,ρ是无损联接。判断过程同上。 4.11 设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、选修课程的编号,成绩、任课教师地址等意义。如果规定,每个学生每学一门课只有一个成绩; 每门课只有一个教师任教;每个教师只有一个地址(此处不允许教师同名同姓)。 (1)试写出关系模式R基本的函数依赖和候选键。 (2)试把R分解成2NF模式集并说明理由。 (3)试把R分解成3NF模式集,并说明理由。 (1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR} 侯选键是(S#,C#)。 (2)在模式R中,TNAME不完全依赖于键(S#,C#),因此需进行分解,可分解为下列两个关系。 SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后,SC中,GRADE完全依赖于侯选键(S#,C#),在C中,主属性是C#,TNAME、TADDR均完全依赖于C#。因此,该分解符合2NF模式。 (3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。 按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中,C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME), T(TNAME,TADD)。 分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。 该分解符合3NF模式。 4.12 图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号(唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。 职工信息包括:职工号,他所参加的生产科研项目号(J#),他所在办公室的电话号(PHONE#)。 生产科研项目包含:项目号(唯一的),预算费。 办公室信息包含:办公室号(唯一的),面积。 对每个职工,数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。 请给出你认为合理的数据依赖,把这个层次结构转换成一组规范化的关系。 提示:此题可分步完成,先转换成一组1NF的关系,然后逐步转换成2NF,3NF,...。 先得到一个泛关系的模式如下: D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area} D#:部门号, Manager_E#:部门领导人员的职工号, E#:职工号, J#:生产科研项目号, Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积 根据所给信息,给出下列数据依赖: F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#,Office#→Area,Office→D#,#Phone#→Office#}(假设一个部门可能有多个办公室,有多个项目,一个办公室只属于一个部门,有多部电话,一个员工只参加一个项目,一个项目可能属于多个部门) 只要保证每个属性值不可分割,以上范式即为1NF。候选键为(E#,Business,Phone#) 转换成2NF关系(消除局部依赖): Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget) 对应 F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#} History(E#,Business,History) 对应 F={(E#,Business)→Sa_History} Phone(Phone#,Office#) 对应 F={Phone#→Office#} 转换成3NF关系(消除非主属性对侯选键的传递依赖): Department(D#,Manager_E#)Office(Office#,Area,D#)Emproee(E#,J#,Office#) History(E#,Business,History)Phone(Phone#,Office#)Project(J#,Budget) 注意:由于对题意理解的不同,可能答案不唯一。 4.13 设关系模式R(ABC)上有一个多值依赖A→→B。如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组? 从多值依赖的定义可以得出,至少应存在下列元组: (ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2) 5.1 名词解释 (1)数据库设计:数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。 (2)数据库工程:指数据库应用系统的开发,它是一项软件工程,但有数据库应用自身的特点。(3)评审:在数据库设计过程中,评审的目的是为了确认某一阶段的任务是否全部完成,避免重大的疏漏或错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。 (4)数据字典:是对系统中数据的详尽描述,它提供对数据库数据描述的集中管理。它的处理功能是存储和检索元数据,并且为数据库管理员提供有关的报告。对数据库设计来说,数据字典是进行详细的数据收集和数据分析所获得的主要成果。数据字典主要包括四个部分:数据项、数据结构、数据流、数据存储。 5.2 数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何? 分成七个阶段 :规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。 数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理设计,逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。 5.3 什么是数据库设计?数据库设计过程的输入和输出有哪些内容? 数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。 数据库设计过程的输入包括四部分内容:1)总体信息需求;2)处理需求;(3)DBMS的特征;(4)硬件和OS(操作系统)特征。 数据库设计过程的输出包括两部分: (1)完整的数据库结构,其中包括逻辑结构和物理结构; (2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。 5.4 基于数据库系统生存期的数据库设计分成哪几个阶段? 分为5个阶段:简记为(规需概逻物):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。 5.5 什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容? 一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。 一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。 5.6 数据库设计的规划阶段应做哪些事情? 数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。 5.7 数据库设计的需求分析阶段是如何实现的?目标是什么? 数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评审。 其目的在于对系统的应用情况作全面详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据设计者都能够接受的文档。 5.8 评审在数据库设计中有什么重要作用?为什么允许设计过程中有多次的回溯与反复? 评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。 如果在数据库已经实现时再发现设计中的错误,那么代价比较大。因此应该允许设计过程的回溯与反复。设计过程需要根据评审意见修改所提交的阶段设计成果,有时修改甚至要回溯到前面的某一阶段,进行部分乃至全部重新设计。 5.9 数据字典的内容和作用是什么? 数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。 其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理。 5.10 对概念模型有些什么要求? 对概念模型一般有以下要求: (1)概念模型是对现实世界的抽象和概括,它应真实、充分地反映现实世界中事物和事物之间的联系,具有丰富的语义表达能力,能表达用户的各种需求,包括描述现实世界中各种对象及其复杂联系、用户对数据对象的处理要求和手段。 (2)概念模型应简洁、明晰,独立于机器、容易理解、方便数据库设计人员与应用人员交换意见,使用户能积极参与数据库的设计工作。 (3)概念模型应易于变动。当应用环境和应用要求改变时,容易对概念模型修改和补充。 (4)概念模型应很容易向关系、层次或网状等各种数据模型转换,易于从概念模式导出也DBMS有关的逻辑模式。 5.11 概念设计的具体步骤是什么? 概念设计的主要步骤为: (1)进行数据抽象、设计局部概念模式; (2)将局部概念模式综合成全局概念模式; (3)评审。 (具体解释参见教材p131) 5.12 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用? 数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。 数据抽象有两种形式: (1)系统状态的抽象,即抽象对象; (2)系统转换的抽象,即抽象运算。 数据抽象是概念设计中非常重要的一步。通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。 5.13 什么是ER图?构成ER图的基本要素是什么? ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性和联系的方法。 构成ER图的基本要素是实体、属性和联系。 5.14 试述采用ER方法的数据库概念设计的过程.利用ER方法进行数据库的概念设计,可分成三步进行: 首先设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式,最后对全局ER模式进行优化,得到最终的ER模式,即概念模式。 5.15 逻辑设计的目的是什么?试述逻辑设计过程的输入和输出 环境。 逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。 逻辑设计过程中的输入信息有: (1)独立于DBMS的概念模式,即概念设计阶段产生的所有局部和全局概念模式; (2)处理需求,即需求分析阶段产生的业务活动分析结果; (3)约束条件,即完整性、一致性、安全性要求及响应时间要求等; (4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序语法的形式规则。 逻辑设计过程输出的信息有: (1)DBMS可处理的模式; (2)子模式; (3)应用程序设计指南; (4)物理设计指南。 5.16 试述逻辑设计阶段的主要内容。 逻辑设计主要是把概念模式转换成DBMS能处理的模式。转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。 逻辑设计的主要步骤包括: (1)初始模式的形成(2)子模式设计 (3)应用程序设计梗概 (4)模式评价 (5)修正模式。 5.17 规范化理论对数据库设计有什么指导意义? 在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准,在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。 5.18 什么是数据库结构的物理设计?试述其具体步骤。 数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。 物理设计的步骤为: (1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射; (2)确定数据存储安排; (3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力; (4)进行完整性和安全性的分析、设计; (5)程序设计。 5.19 数据实现阶段主要做哪几件事情? 数据库实现阶段的主要工作有以下几点: (1)建立实际数据库结构 (2)试运行 (3)装入数据 (具体解释参见教材p150) 5.20 什么是数据的再组织设计?试述其重要性。 对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。 数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变,增加新的数据类型,对原有的数据提出了新的使用要求,改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。 5.21 数据系 统投入运行后,有哪些维护工作? 数据系统投入运行后,主要维护工作有: (1)维护数据库的安全性与完整性控制及系统的转储和恢复; (2)性能的监督、分析与改进; (3)增加新功能; (4)发现错误,修改错误 6.1 名词解释 (1)事务:事务是指一个操作序列,这些操作要么什么都做,要么都不做,是一个不可分割的工作单位,是数据库环境中的逻辑工作单位,相当于操作系统环境下的“进程”概念。 (2)封锁:封锁就是事务可以向系统发出请求,对某个数据对象加锁,此事务对这个数据对象有一定控制,而其他事务则不能更新数据直到事务释放它的锁为止。 (3)X封锁:如果事务T对数据R实现X封锁,那么其他的事务要等T解除X封锁以后,才能对这个数据进行封锁。只有获准X封锁的事务,才能对被封锁的数据进行修改。 (4)PX协议:X封锁的规则称为PX协议,其内容为:任何企图更新记录R的事务必须先执行LOCK X(R)操作,以获得对该记录进行寻址的能力,并对它取得X封锁。如果未获得X封锁,那么这个事务进入等待状态,一直到获准X封锁,事务继续进行。 (5)PXC协议:它由PX协议及一条规则“X封锁必须保留到事务终点(COMMIT或ROLLBACK)”组成。(6)死锁:有两个或以上的事务处于等待状态,每个事务都在等待另一个事务解除封锁,它才能继续执行下去,结果任何一个事务都无法执行,这种现象就是死锁。 (7)串行调度:多个事务依次执行,称为串行调度。 (8)并发调度:利用分时的方法,同时处理多个事务,称为事务的并发调度。 (9)可串行化调度:如果某事务集的一个并发调度的结果与某个串行调度等价,则称此并发调度是是可串行化调度。 (10)不可串行化调度:某事务集的一个并发调度结果,如果与任一串行调度均不等价,则该并发调度是不可串行化调度。 (11)S封锁:共享型封锁。果事务T对某数据R加上S封锁,那么其它事务对数据R的X封锁便不能成功,而对数据R的S封锁请求可以成功。这就保证了其他事务可以读取R但不能修改R,直到事务T释放S封锁。 (12)PS协议: 任何要更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。如果未获准S封锁,那么这个事务进入等待状态,一直到获准S封锁,事务才继续进行下去。当事务获准对记录R的S封锁后,在记录R修改前必须把S封锁升级为X封锁。 (13)PSC协议:由PS协议和“将S封锁保持到事务终点”组成。任何更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。如果未获准S封锁,那么这个事务进入等待状态,一直到 获准S封锁,事务才继续进行下去。并将S封锁保持到事务终点。 (14)两段封锁协议:(1)在对任何数据进行读写操作之前,事务首先要获得对该数据的封锁;(2)在释放一个封锁之后,事务不再获得任何其他封锁。 6.2 试叙事务的四个性质,并解释每一个性质对DBS有什么益处? 事务的四个性质是:原子性、一致性、隔离性和持久性。 (1)原子性(具体含义见教材):事务中所有操作应视为整体,不可分割。 (2)一致性(具体含义见教材):一个事务独立执行的结果将保证数据库的一致性,即数据不会因事务的执行而遭受破坏。 (3)隔离性(具体含义见教材):隔离性要求在并发事务被执行时,系统应保证与这些事务先后单独执行时结果一样,使事务如同在单用户环境下执行一样。 (4)持久性(具体含义见教材):要求事务对数据库的所有更新应永久地反映在数据库中。 6.3 事务的COMMIT操作和ROLLBACK操作各做些什么事情? COMMIT操作表示事务成功地结束(提交),此时告诉系统,数据库要进入一个新的正确状态,该事务对数据库的所有更新都已交付实施。 ROLLBACK操作表示事务不成功地结束,此时告诉系统,已发生错误,数据库可能处在不正确的状态,该事务对数据库的更新必须被撤销,数据库应恢复该事务到初始状态。 6.4 UNDO操作和REDO操作各做些什么事情? UNDO操作是反向扫描“日志”文件,撤销对数据库的更新操作,使数据库恢复到更新前的状态; REDO操作正向扫描日志文件,重新做一次更新,使数据库恢复到更新后的状态。 6.5 DBS中有哪些类型的故障?哪些故障破坏了数据库? 哪些故障未破坏数据库,但其中某些数据变得不正确? 数据库系统故障有事务故障、系统故障、介质故障。 其中介质故障破坏数据库,事务故障、系统故障未破坏数据库但使其中某些数据变得不正确。 6.6 什么是“运行记录优先原则”?其作用是什么? 在数据库系统中,写一个修改到数据库中和写一个表示这个修改的登记记录到日志文件中是两个不同的操作,在这两个操作之间有可能发生故障。这时,如果先写了数据库修改,而在运行记录中没有登记这个修改,则以后就无法恢复这个修改,那么以后也就无法撤消这个修改。为了安全起见,采用“运行记录优先原则”。它包括两点: (1)至少要等相应运行记录已经写入“日志”文件后,才能允许事务往数据库中写记录。 (2)直至事务的所有运行记录都已写入运行“日志”文件后,才能允许事务完成“END TRANSACTION”处理。 采用“运行记录优先原则”,可以保证所做的操作都记录在日志中,便于故障处理,维护数据库的一致性。 6.7 什么是数据库的恢复?恢复的基本原则是什么,恢复如何实现? 数据库的恢复是指当数据库系统发生故障时,通过一些技术,使数据库从被破坏、不正确的状态恢复到最近一个正确的状态。 恢复的基本原则就是冗余,即数据的重复存储。恢复的常用方法有:(1)定期对整个数据库进行复制或转储;(2)建立日志文件;(3)恢复。用REDO或UNDO处理。 6.8 数据库的并发操作会带来哪些问题?如何解决? 数据库的并发操作会带来三类问题: (1)丢失更新问题;(具体内容见教材P158) (2)不一致分析问题 (3)“脏数据”的读出。 解决的办法通常是采用“封锁”技术。 6.9 有哪些“丢失更新”问题?如何处理? (1)并发调度引起的“丢失更新”问题。在并发调度中,如两个事务同时对某数据库进行更新操作,在操作中丢失了其中某个事务对某数据的更新操作。处理的办法就是对并发操作采用X封锁技术。 (2)由恢复引起的更新丢失现象。采用X封锁以后,先执行事务T1,再执行事务T2,此时,如果T2做ROLLBACK操作,就把事务T2的更新丢失了。处理方式是采用PXC协议,不允许事务T1执行解锁操作直到事务执行到终点(COMMIT或ROLLBACK)。 6.10 为什么DML只提供解除S封锁的操作,而不提供解除X封锁的操作? 为了防止由恢复引起的更新丢失现象,PXC协议规定:X封锁必须保留到事务终点(COMMIT或ROLLBACK)。因此在DML中,COMMIT或ROLLBACK的语义中包含了X封锁的解除,不用提供解除X封锁的操作。 而对于S封锁而言,它是一种共享型的封锁(读取但不能修改),其数据不可能是未提交的修改,封锁不必等提交后才能解除,因此可以由事务用UNLOCK解除各自对数据的封锁。 6.11 为什么有些封锁需保留到事务终点,而有些封锁可随时解除? 因为有的封锁需要更新数据,保留到终点才能确认是否提交或回退以避免脏数据的读出,所以这些封锁需要保留到事务终点。 而有些事务全部或部分操作只是读取数据,不涉及更新数据操作,因此这一部分操作的封锁可以随时解除。 6.12 死锁的发生是坏事还是好事?试说明理由。如何解除死锁状态? 死锁的发生即是坏事又是好事。 (1)使并发事务不能继续执行下去,造成时间开销却不产生结果。 (2)在某些时候我们要利用它来解决更新操作导致的数据库不一致状态。 解除死锁状态:抽出某个事务作为牺牲品,把它撤消,做回退操作,解除它的所有封锁,并恢复到初始状态。 6.13 试叙述“串行调度”与“可串行化调度”的区别。 串行调 度是多个事务按照一定的次序依次执行;在某一时刻只有一个事务在执行。 而可串行化调度是并发调度中的一个概念。在并发调度中,某一时刻有多个事务同时被处理。如果某事务集的一个并发调度的结果与某个串行调度等价,则称此并发调度是是可串行化调度。 (以上几题具体可参照书上p20-21) 6.14 什么是数据库的完整性? DBMS的完整性子系统的功能是什么? 数据库的完整性是指数据的正确性和相容性。DBMS完整性子系统的功能是: (1)监督事务的执行,并测试是否违反完整性规则; (2)如有违反,则采取恰当的操作,如拒绝、报告违反情况,改正错误等方法进行处理。 6.15 完整性规则由哪几个部分组成?关系数据库的完整性规则有哪几类? 完整性规则由三部分组成: 触发条件:即什么时候使用规则进行检查; 约束条件:即要检查什么样的错误; ELSE子句:即查出错误后该如何处理。 完整性规则有以下三类: 域完整性规则,用于定义属性的取值范围; 域联系的规则,定义一个或多个关系中,属性值间的联系、影响和约束。 关系完整性规则,定义更新操作对数据库中值的影响和限制。 6.16 试详述SQL中的完整性约束机制? SQL中的完整性约束规则有主键约束、外键约束、属性值约束和全局约束等多种形式。 △主键约束。它是数据中最重要的一种约束。在关系中主键值不允许空,也不允许出现重复,体现了关系要满足实体完整性规则。主键可用主键子句或主键短语进行定义。 △ 外键约束。根据参照完整性规则,依赖关系中外键或者为空值,或者是基本关系(参照关系)中的该键的某个值。外键用外键关系子句定义,并考虑删除基本关系元组或修改基本关系的主键值的影响,依赖关系可按需要采用RESTRICT、SET NULL、CASCADE方式。 △属性值约束。当要求某个属性的值不允许空值时,那么可以在属性定义后加上关键字:NOT NULL,这是非空值约束。还可以用CHECK子句对一个属性值加以限制以及使用域约束子句CREAT DOMAIN 定义新域并加以属性值检查。 △全局约束。在关系定义时,可以说明一些比较复杂的完整性约束,这些约束涉及到多个属性间的联系 或不同关系间的联系,称为全局约束。主要有基于元组的检查子句和断言。前者是对单个关系的元组值加以约束,后者则可对多个关系或聚合操作有关的完整性约束进行定义。 6.17 参照完整性规则在SQL可以用哪几种方式实现?删除基本关系的元组时,依赖关系可以采取的做法有哪三种?修改基本关系的主键值时,依赖关系可以采取的做法有哪三种? 参照完整性规 则要求“不引用不存在的实体”,参照完整性规则在SQL可用以下几种方式实现: (1)在SQL中采用外键子句定义外键,并考虑删除基本关系元组或修改基本关系的主键值,对依赖关系产生的影响; (2)在属性值上进行约束如基于属性的检查; (3)全局约束中的基于元组的检查子句等。 删除基本关系元组或修改基本关系的主键值时,依赖关系可以采用的做法有: △RESTRICT方式:只有当依赖关系中没有一个外键值与基本关系中要删除/修改的主键值相对应时,系统才能执行删除/修改操作,否则拒绝删除或修改。 △SET NULL方式:删除基本元组时,将依赖关系中所有与基本关系中被删除主键值相对应的外键值置为空值。修改基本关系的主键值时,将依赖关系中所有与基本关系中被修改主键值相对应的外键值置为空值。 △CASCADE方式:若删除则将依赖关系中所有外键值与基本关系中要删除的主键值相对应的元组一并删除,若修改则将依赖关系中所有与基本关系中要修改的主键值相对应的外键值一并修改为新值。 6.18 试对SQL2中的基于属性的检查约束、基于元组的检查约束和断言 三种完整性约束进行比较:各说明什么对象?何时激活?能保证数据库的一致性吗? 约束形式 说明对象 激活条件 是否保证一致性 基于属性的检查 只对一个属性值加以约束 插入或修改属性值时 不一定 基于元组的检查 对单个关系的元组值加以约束 在插入或修改元组时 不一定 断言 多个关系或聚合操作 任何变动 保证 6.19 设教学数据库的模式如下: S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE) C(C#,CNAME,TEACHER) 试用多种方式定义下列完整性约束: (1)在关系S中插入学生年龄值应在16~25岁之间 (2)在关系SC中插入元组时,其S#值和C#值必须分别在S和C中出现。 (3)在关系SC中修改GRADE值时,必须仍在0~100之间。 (4)在删除关系C中一个元组时,首先要把关系SC中具有同样C#的元组全部删去。 (5)在关系S中把某个S#值修改为新值时,必须同时把关系SC中那些同样的S#值也修改为新值。 (1)定义S时采用检查子句: CREAT TABLE S(S# CHAR(4),SNAME char(10)NOT NULL ,AGE SMALLINT ,PRIMARY key(S#),CHECK(AGE>=16 and AGE<=25)) (2)采用外键子句约束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)REFERENCE C(C#)) (3)采用元组检查 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)RE FERENCE C(C#),CHECK(GRADE>=0 and AGE<=100)) (4)采用外键约束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)REFERENCE C(C#)) 若改为:在删除关系C中一个元组时,同时把关系SC中具有同样C#的元组全部删去,则为: ......FOREIGN key(C#)REFERENCE C(C#)ON DELETE CASCADE ......(5)采用外键约束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#)ON UPDATE CASCADE ,FOREIGN key(C#)REFERENCE C(C#)) 6.20 在教学数据库的关系S、SC、C中,试用SQL2的断言机制定义下列两个完整性约束:(1)学生必须在选修Maths课后,才能选修其他课程。(2)每个男学生最多选修20门课程 (1) CREAT ASSERTION ASSE1 CHECK (NOT EXISTS (SELECT S FROM SC WHERE C# IN (SELECT C# FROM C WHERE CNAME<>'MATHS') AND S# NOT IN (SELECT S# FROM SC WHERE C# IN (SELECT C# FROM C WHERE CNAME='MATHS')));(2) CREAT ASSERTION ASSE2 CHECK (ALL(SELECT COUNT(SC.C#) FROM S,SC WHERE S.S#=SC.S AND SEX='M' GROUP BY S#)<=20); 6.21 什么是数据库的安全性?有哪些安全措施? 数据库的安全性是指保护数据库防止不合法的使用,以免数据的泄漏、非法更改和破坏。 可以从以下方面设置数据库的安全措施:环境级、职员级、OS级、网络级和数据库系统级。 (具体可参见教材P173) 6.22 对银行的数据库系统应采取哪些安全措施?分别属于哪一级? 答案基本同上一题。 6.23 什么是“权限”?用户访问数据库可以有哪些权限?对数据库模式有哪些修改权限? 用户使用数据库的方式称为权限。 用户访问数库的权限有:读权限、插入权限、修改权限、删除权限。 用户修改数据库模式的权限有索引权限、资源权限、修改权限、撤销权限。 6.24 试解释权限的转授与回收。 在数据库系统中,为了保证数据的安全性,用户对数据的操作必须首先从DBA处获得权限,才能进行对数据的操作。同时数据库系统也允许用户将获得的权限转授给其他用户,也允许把已授给其他用户的权限再回收上来。但应保证转授出去的权限能收得回来。 6.25 SQL 语言中的视图机制有哪些优点? 视图机制使系统具有三个优点:数据安全性、数据独立性和操作简便性。 6.26 SQL2中用户权限有哪几类?并作必要的解释。 SQL2中定义了六类用户权限,分别是: (1)SELECT :允许用户对关系或视图执行SELECT操作。 (2)INSERT :允许用户对关系或视图执行INSERT操作,如果还说明了一个属性表,那么表示只能插入这些属性的值,关系中其他属性值将置为缺省值或为空值。 (3)DELETE:允许用户对关系或视图执行DELETE操作。 (4)UPDATE:允许用户对关系或视图执行UPDATE操作,如果还说明了一个属性表,那么表示只能修改这些属性的值,否则表示可以修改关系中任一属性值。 (5)REFERENCES:允许用户定义新关系时,引用其他关系的主键作为外键。 (6)USAGE:允许用户使用定义的域。 6.27 数据加密法有些什么优点?如何实现? 数据加密可以更好地保证数据的完全性。加密采用一定的加密算法给把源文变为密文来实现。 常用的加密算法有“替换方法”和明键加密法。 7.1 名词解释 (1)集中式DBS:是指数据库中的数据集中存储在一台计算机上,数据的处理集中在一台计算机上完成。 (2)分布式DBS:是指数据存放在计算机网络的不同场地的计算机中,每一场地都有自治处理能力并完成局部应用;而每一场地也参与(至少一种)全局应用程序的执行,全局应用程序可通过网络通信访问系统中的多个场地的数据。 (3)分布式DB:分布式数据库,是指计算机网络环境中各场地上数据库的逻辑集合。 (4)分布式DBMS:分布式数据库管理系统。是指分布式数据库系统中的一组软件,它负责管理分布环境下逻辑集成数据的存取、一致性、有效性和完备性。同时,由于数据的分布性,在管理机制还必须具有计算机网络通信协议上的分布管理特性。 (5)局部自治性:是指有独立处理能力并能完成的局部应用。 (6)数据分配(数据分布):是指数据计算机网络各场地上的分配策略。 (7)数据复制:是指数据在每个场地重复存储。 (8)数据分片:是指分布式数据库中的数据可以被分割和复制在网络场地的各个物理数据库中。一般数据存放的单位不是关系而是片段,一个片段是关系的一部分。数据分片是通过关系代数的基本运算实现的。 (9)水平分片:是指按一定条件把全局关系的所有元组划分成若干不相交的子集,每个 子集为关系的一个片段。 (10)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。 (11)分布透明性:指用户不必关系数据的逻辑分片,不必关系数据物理位置的细节,也不必关心各个场地上的数据库的数据模型。 (12)分片透明性:分片透明性是最高层次的分布透明性,是指用户或应用程序只对全局关系进行操作而不必考虑数据的分片。 (13)位置透明性:位置透明性位于分片视图与分配视图之间。是指用户或应用程序应当了解分片情况,但不必了解片段的存储场地。 (14)局部数据模型透明性:这个透明性位于分配视图与局部概念视图之间,指用户或应用程序要了解分片及各片段存储的场地,但不必了解局部场地上使用的是何种数据模型。 (15)复制透明性:即用户不必关心数据库在网络中各个结点的数据库复制情况,更新操作引起的波及由系统去处理。 7.2 试叙数据从集中存储、分散存储到分布存储的演变过程。 早期的数据库系统都是属于集中式数据库系统,数据集中存储在一台计算机上。该方式有一定优点,比如,价格合理,易于管理,数据冗余少等等。但是,随着数据库应用的不断发展,数据库规模不断扩大,如采用集中存储的数据库,其系统的设计和操作都比较复杂,系统显得不灵活而且安全性 也较差。因此采用了数据分散存储的办法,将数据库分成多个,建立在多台计算机上,此时的各个数据库的管理和应用程序均是分开并独立的。它们之间不存在数据通信联系。随着计算机网络通信的发展,有可能把分散在各处的数据库系统通过网络通信连接起来,这样形成的系统称为分布式的数据库系统,这时的数据库虽然分别存在各地的计算机上,但它们之间通过分布式数据管理系统可以进行联系。 7.3 与集中式DBS、分散式DBS相比,分布式DBS有哪些特点? 与集中式DBS相比,分布式DBS中数据库的存储是分布性的,即数据不是存储在同一场地,而是分布存储在多个场地。与分散式DBS相比,分布式DBS中数据库具有“逻辑整体性”,即表面上看,分布式数据的数据库分散在各个场地,但这些数据在逻辑上却是一个整 体,如同一个集中式数据库。 7.4 试解释下列术语:同构同质型DDBS,同构异质型DDBS,异构DDBS。 (1)同构同质型DDBS:是指各个场地都采用同一类型的数据模型,并且是同一型号数据库管理系统。 (2)同构异质型DDBS:是指各个场地都采用同一类型的数据模型,但是数据库管理系统是不同型号的。 (3)异构型DDBS:是指各个场地的数据模型是不同的类型。 7.5 分布式数据库系统有哪些优点和缺点? 分布式数据库系统的优点: (1)具有灵活的体系结构 (2)适应分布式的管理和控制机构 (3)经济性能优越 (4)系统的可靠性高、可用性好 (5)局部应用的响应速度快 (6)可扩展性好,易于集成现有系统 分布式数据库系统的缺点: (1)系统开销大,主要花在通信部分; (2)复杂的存取结构,原来在集中式系统中有效存取数据的技术,在分布式系统中都不再适用; (3)数据的安全生和保密性较难处理。 7.6 分布式数据库中,“数据分配”有哪些策略?“数据分片”有哪些策略? 数据分片的准则是什么? 数据分配是指数据在计算机网络各场地上的分配策略。包括: (1)集中式:所有数据均安排在同一个场地上。 (2)分割式:所有数据只有一份,分别被安置在若干个场地。 (3)全复制式:数据在每个场地重复存储。 (4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是每一场地未必保存全部数据。 数据分片的方式有以下三种: (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。 (2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。 (3)混合型分片:将水平分片与垂直分片方式综合使用则为混合型分片。 数据分片应遵循的准则为: (1)完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许发生属于全局关系的某个数据不属于任何一个片段。 (2)重构条件:划分所采用的方法必须确保能够由各个片段重建全局关系。 (3)不相交条件:要求一个全局关系被划分后得到的各个数据片段互相不重 叠。 7.7 试叙述分布式DBS的体系结构,它有什么特征? 分布式DBS的体系结构分为四级:全局外模式、全局概念模式、分片模式和分配模式。 (1)全局外模式:它们是全局应用的用户视图,是全局概念模式的子集。 (2)全局概念模式:全局概念模式定义了分布式数据库中所有数据的逻辑结构。 (3)分片模式:分片模式定义片段以及定义全局关系与片段之间的映象。这种映象是一对多的,即每个片段来自一个全局关系,而一个全局关系可分成多个片段。 (4)分配模式:片段是全局关系的逻辑部分,一个片段在物理上可以分配到网络的不同场地上。分配模式根据数据分配策略的选择定义片段的存放场地。 分布式DBS的分层体系结构有三个特征: (1)数据分片和数据分配概念的分离,形成了“数据分布独立性”概念。 (2)数据冗余的显式控制。 (3)局部DBMS的独立性。 7.8 试叙述分布式DBMS的功能及组成。 主要功能有: (1)接受用户请求,并判定把它送到哪里,或必须访问哪些计算机才能满足该请求。 (2)访问网络数据字典,或者至少了解如何请求和使用其中的信息。 (3)如果目标数据存储于系统的多个计算机上,就必须进行分布式处理。 (4)通信接口功能,在用户、局部DBMS和其他计算机的DBMS之间进行协调。 (5)在一个异构型分布式处理环境中,还需提供数据和进程移植的支持。这里的异构型是指各个场地的硬件、软件之间存在一定差别。 DDBMS组成——应包括以下四个子系统: (1)查询子系统 (2)完整性子系统 (3)调度子系统 (4)可靠性子系统 7.9 分布式系统中影响查询的主要因素是什么? 分布式系统中,影响查询的主要因素数据经网络的传输时间,数据传输量是衡量查询时间的一个主要指标,不同场地间的联接操作和并操作是影响数据传输量的主要原因。 7.10 基于半联接的查询优化策略的基本思想是什么? 数据在网络中传输时,如果以整个关系传输,则传输数据量大,是一种冗余的做法,而实际上,在联接时并非每个数据都参与操作或有用。因此,考虑到不参与操作的值或无用的值不必经网络来回传输,则可以减少传输的数据量。 一.ER图作成及向关系模式转化 1.学校中有若干系,每个系有若干班级和教研室,每个教研室有若干教员,其中有的教授和副教授每人各带若干研究生;每个班有若干学生,每个学生选修若干课程,每门课可由若干学生选修。请用 E 一 R 图画出此学校的概念模型。 2.某学生宿舍管理系统,涉及的部分信息如下:(1)学生:学号,姓名,性别,专业,班级。(2)寝室:寝室号,房间电话。 (3)管理员:员工号,姓名,联系电话。 其中:每个寝室可同时住宿多名学生,每名学生只分配一个寝室;每个寝室指定其中一名学生担当寝室长;每个管理员同时管理多个寝室,但每个寝室只有一名管理员。(1)建立一个反映上述局部应用的ER模型,要求标注联系类型。 (2)根据转换规则,将ER模型转换为关系模型。要求标注每个关系模型的主键和外键(如果存在)。(1) (2) 学生(学号,姓名,性别,专业,班级)主键:学号 住宿(寝室号,学号)主键:学号 寝室号是外键;学号也是外键 学生管理寝室(寝室号,寝室长学号)主键:寝室号或者寝室长学号 寝室号是外键;寝室长学号也是外键 寝室(寝室号,房间电话)主键:寝室号 管理(寝室号,员工号)主键:寝室号 寝室号是外键;员工号是外键 管理员(员工号,姓名,联系电话)主键:员工号 合并后的答案: 学生(学号,姓名,性别,专业,班级,寝室号)主键:学号 寝室号是外键 寝室(寝室号,房间电话,寝室长学号,员工号)主键:寝室号或者寝室长学号 员工号是外键;寝室长学号是外键 管理员(员工号,姓名,联系电话)主键:员工号 3设某工厂数据库中有四个实体集。 一是“仓库”实体集,属性有仓库号、仓库面积等; 二是“零件”实体集,属性有零件号、零件名、规格、单价等; 三是“供应商”实体集,属性有供应商号、供应商名、地址等; 四是“保管员”实体集,属性有职工号、姓名等。 设仓库与零件之间有“存放”联系,每个仓库可存放多种零件,每种零件可存放于若干仓库中,每个仓库存放每种零件要记录库存量;供应商与零件之间有“供应”联系,一个供应商可供应多种零件,每种零件也可由多个供应商提供,每个供应商每提供一种零件要记录供应量;仓库与保管员之间有“工作”联系,一个仓库可以有多名保管员,但一名保管员只能在一个仓库工作。 (1)试为该工厂的数据库设计一个ER模型,要求标注联系类型。 (2)根据转换规则,将ER模型转换成关系模型,要求标明每个关系模式的主键和外键。 (2) 仓库(仓库号,仓库面积)主键:仓库号 存放(仓库号,零件号,库存量)主键:仓库号,零件号 仓库号是外键,零件好也是外键。 零件(零件号,零件名,规格,单价)主键:零件号 供应(零件号,供应商号,供应量)主键:零件号,供应商号 零件号是外键,供应商号是外键 供应商(供应商号,供应商名,地址)主键:供应商号 工作(职工号,仓库号)主键:职工号 职工号是外键,仓库号是外键 保管员(职工号、姓名)主键:职工号 合并后的答案: 仓库(仓库号,仓库面积)主键:仓库号 存放(仓库号,零件号,库存量)主键:仓库号,零件号 仓库号是外键,零件好也是外键。 零件(零件号,零件名,规格,单价)主键:零件号 供应(零件号,供应商号,供应量)主键:零件号,供应商号 零件号是外键,供应商号是外键 供应商(供应商号,供应商名,地址)主键:供应商号 保管员(职工号,姓名,仓库号)主键:职工号 仓库号是外键 二. 函数依赖识别以及规范到3NF 1.设某人才市场数据库中有一个记录应聘人员信息的关系模式: R(人员编号,姓名,性别,职位编号,职位名称,考试成绩) 如果规定:每人可应聘多个职位,每个职位可由多人应聘且必须参加相关考试,考试成绩由人员编号和职位编号确定。 姓名可以重复。职位名称不可重复。 (1)根据上述规定,写出模式R的基本FD和关键码。(2)R最高属于第几范式。(3)将R规范到3NF。答案: (1)根据上述规定,写出模式R的基本FD和关键码。人员编号→姓名 人员编号→性别 职位编号→职位名称 职位名称→职位编号 (人员编号,职位编号)→考试成绩 候选码:(人员编号,职位编号)(2)R最高属于第几范式。 R最高属于第一范式。因为非主属性姓名,性别部分依赖于码,不属于第二范式。(3)将R规范到3NF。 人员(人员编号,姓名,性别)职位(职位编号,职位名称) 应聘(人员编号,职位编号,考试成绩)2.设有一个反映教师参加科研项目的关系模式: R(教师号,教师名称,项目名称,科研工作量,项目类别,项目金额,负责人) 如果规定:每个项目可有多人参加,每名教师每参加一个项目有一个科研工作量;每个项目只属于一种类别,只有一名负责人。教师名称可以重复。(1)根据上述规定,写出模式R的基本FD和关键码。(2)说明R不是2NF的理由。(3)将R规范到3NF。答案:(1)根据上述规定,写出模式R的基本FD和关键码。教师号→教师名称 项目名称→项目类别 项目名称→项目金额 项目名称→负责人 (教师号,项目名称)→科研工作量 主键:(教师号,项目名称)(2)说明R不是2NF的理由。 非主属性教师名称,项目类别,项目金额,负责人部分依赖码。(3)将R规范到3NF。教师(教师号,教师名称) 项目(项目名称,项目类别,项目金额,负责人)项目开发(教师号,项目名称,科研工作量)3.设有一个记录学生毕业设计情况的关系模式: R(学号,学生名,班级,教师号,教师名,职称,毕业设计题目,成绩) 如果规定:每名学生只有一位毕业设计指导教师,每位教师可指导多名学生;学生的毕业设计题目可能重复。 (1)根据上述规定,写出模式R的基本FD和关键码。(2)R最高属于几范式。(3)将R规范到3NF。 三. SQL语句 1.零件、供应商、采购 设有以下关系模式 PART(PNO, PNAME, PMODEL)零件号、零件名称、零件型号 BUY(PNO, SNO, BDATE, BPRICE, BNUM)零件号、供应商号、采购日期、采购价格、采购数量 SUPPLIER(SNO, SNAME, SADDRESS)供应商号,供应商名称,供应商地址 要求写出符合下列题目要求的SQL语句 (1)查询供应商名称为‟创新零件‟的所有零件购买记录(零件号、零件名称、零件型号、供应商号、供应商名称、采购日期、采购价格、采购数量)。 查询供应商名称为‟创新零件‟的所有零件购买记录(零件号、零件名称、零件型号、供应商号、供应商名称、采购日期、采购价格、采购数量)。 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND SUPPLIER.SNAME = '创新零件';(2)查询零件‟O性密封圈‟并且型号为‟5*5‟的零件购买记录。 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND PART.PNAME = 'O型密封圈' AND PART.PMODEL = '5*5';(3)查询2011年5月份的零件购买记录 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND BUY.BDATE BETWEEN TO_DATE(‘2011-05-01', 'YYYY-MM-DD')AND TO_DATE('2011-05-31', 'YYYY-MM-DD');(4)查询2011采购价格1000元以上的零件购买记录 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND BUY.BPRICE >= 1000 AND BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD');(5)查询2011各零件的购买总数量和总金额,按零件号排列 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM PART, BUY WHERE PART.PNO = BUY.PNO AND BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD')GROUP BY PART.PNO, PART.PNAME, PART.PMODEL ORDER BY PART.PNO;(6)查询各供应商2011的零件供应总数量和总金额,按总金额逆序排列 SELECT SUPPLIER.SNO, SUPPLIER.SNAME, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM SUPPLIER, BUY WHERE BUY.SNO = SUPPLIER.SNO AND BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD') GROUP BY SUPPLIER.SNO, SUPPLIER.SNAME ORDER BY AMOUNT DESC;(7)查询供应商‟创新零件‟2011的零件供应总数量和总金额 SELECT SUPPLIER.SNO, SUPPLIER.SNAME, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM SUPPLIER, BUY WHERE BUY.SNO = SUPPLIER.SNO AND SUPPLIER.SNAME = '创新零件' AND BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD') GROUP BY SUPPLIER.SNO, SUPPLIER.SNAME;(8)查询符合下列条件的零件购买记录 零件号‟PART01‟ 非‟创新零件‟供应商 零件采购价格低于‟创新零件‟且零件号为‟PART01‟的最低价格 SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND PART.PNO = 'PART01' AND SUPPLIER.SNAME <> '创新零件' AND BUY.BPRICE <(SELECT MIN(BUY.BPRICE)FROM BUY, SUPPLIER WHERE BUY.SNO = SUPPLIER.SNO AND BUY.PNO = 'PART01' AND SUPPLIER.SNAME = '创新零件');(9)在零件表中插入记录(„PART06‟, „轮胎‟, „225/55 R17‟)INSERT INTO PART VALUES('PART06', '轮胎', '225/55 R17');(10)在零件表中删除零件规格为„225/55 R17‟的记录 DELETE FROM PART WHERE PART.PMODEL = '225/55 R17'; (11)更新供应商‟创新零件‟的地址为‟杭州市‟ UPDATE SUPPLIER SET SUPPLIER.SADDRESS ='杭州市' WHERE SUPPLIER.SNAME = '创新零件';(12)生成一个视图ANNUALBUY显示2011所有零件购买记录,按照供应商号排序,一个供应商内按照零件号排序 CREATE VIEW ANNUALBUY AS SELECT SUPPLIER.SNO, SUPPLIER.SNAME, PART.PNO, PART.PNAME, PART.PMODEL, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND BUY.SNO = SUPPLIER.SNO AND BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD') ORDER BY SUPPLIER.SNO, PART.PNO; (13)赋予用户张小明对零件表有SELECT权利,对购买表的采购数量字段有更新权限。GRANT SELECT ON PART, UPDATE(BNUM)ON BUY TO 张小明;(14)收回用户张小明对零件表有SELECT权利。REVOKE SELECT ON PART FROM 张小明;2.试用SQL语言查询项目金额在20000元~30000元(包括20000元和30000元)之间并且项目名称以‟银行‟开头的项目名称,项目类别,项目金额。SELECT PNAME,PCATOGERY,AMOUNT FROM PROJECT WHERE AMOUNT BETWEEN 20000 AND 30000 AND PNAME LIKE ‘银行%’; 3.试用SQL语言查询参加项目名称为“网上书城”的教师姓名。 SELECT TNAME FROM TEACHER, DELIVERY,PROJECT WHERE TEACHER.TNO=DELIVERY.TNO AND DELIVERY.PNO=PROJECT.PNO AND PROJECT.PNAME=‘网上书城’; 数据库重点习题总结:(标注颜色的是我考到的简答题).试述数据、数据库、数据库系统、数据库管理系统的概念。 (l)数据:描述事物的符号记录称为数据。数据的种类有数字、文字、图形、图像、声音、正文等。 (2)数据库:数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 (3)数据库系统:数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。 (4)数据库管理系统:数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。 2.关系的完整性约束条件三大类:实体完整性,参照完整性,用户定义的完整性。3.试述数据模型的概念、数据模型的作用和数据模型的三个要素。 数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式构架。数据模型通常由数据结构、数据操作和完整性约束三部分组成。(l)数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。 (2)数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。 (3)数据的约束条件:是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。 4.试述数据库系统三级模式结构,这种结构的优点是什么? 数据库系统的三级模式结构由外模式、模式和内模式组成。外模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式描述的是数据的全局逻辑结构。外模式涉及的是数据的局部逻辑结构,通常是模式的子集。内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给 DBMs 管理,使用户能逻辑抽象地处理数据,而不必关心数据在计算机中的表示和存储。为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。5.试述数据库系统的特点。 (l)数据结构化数据库系统实现整体数据的结构化 (2)数据的共享性高,冗余度低,易扩充数据库的数据不再面向某个应用而是面向整个系统,因此可以被多个用户、多个应用以多种不同的语言共享使用。 (3)数据独立性高数据独立性包括数据的物理独立性和数据的逻辑独立性。 (4)数据由 DBMS 统一管理和控制数据库的共享是并发的共享,即多个用户可以同时存 6.授权与回收 GRAND INSERT ON TABLE Student TO PUBLIC WITH GRAND OPTION REVOKE INSERT ON TABLE Student FROM SC 7.针对习题 3 中的四个表试用 SQL 语言完成以下各项操作:(1)找出所有供应商的姓名和所在城市。SELECT SNAME,CITY FROM S(2)找出所有零件的名称、颜色、重量。SELECT PNAME,COLOR,WEIGHT FROM P(3)找出使用供应商 S1 所供应零件的工程号码。SELECT DIST JNO FROM SPJ WHERE SNO='S1'(4)找出工程项目 J2 使用的各种零件的名称及其数量。SELECT PNAME,QTY FROM SPJ,P WHERE P.PNO=SPJ.PNO AND SPJ.JNO='J2'(5)找出上海厂商供应的所有零件号码。SELECT PNO FROM SPJ,S WHERE S.SNO=SPJ.SNO AND CITY='上海'(6)出使用上海产的零件的工程名称。SELECT JNAME FROM SPJ,S,J WHERE S.SNO=SPJ.SNO AND S.CITY='上海' AND J.JNO=SPJ.JNO(7)找出没有使用天津产的零件的工程号码。 注意: SELECT DISP JNO FROM SPJ WHERE JNO NOT IN(SELECT DIST JNO FROM SPJ,S WHERE S.SNO=SPJ.SNO AND S.CITY='天津')适用于 JNO 是唯一或不唯一的情况.注意: SELECT DIST JNO FROM SPJ,S WHERE S.SNO=SPJ.SNO AND S.CITY<>'天津'适用于 JNO 是唯一的情况 (8)把全部红色零件的颜色改成蓝色。UPDATE P SET COLOR='蓝' WHERE COLOR='红'(9)由 S5 供给 J4 的零件 P6 改为由 S3 供应。UPDATE SPJ SET SNO='S3' WHERE SNO='S5' AND JNO='J4' AND PNO='P6'(10)从供应商关系中删除供应商号是 S2 的记录,并从供应情况关系中删除相应的记录。A、DELETE FROM S WHERE SNO=’S2’ B、DELETE FROM SPJ WHERE SNO=‘S2’(11)请将(S2,J6,P4,200)插入供应情况关系。INSERT INTO SPJ VALUES(‘S2’,‘J6’,‘P4’,200) 8.试述数据库设计过程。 答:数据库设计过程的六个阶段:(l)需求分析;(2)概念结构设计;(3)逻辑结构设计;(4)数据库物理设计;(5)数据库实施;(6)数据库运行和维 9.什么是基本表?什么是视图?两者的区别和联系是什么?视图的优点。所有的视图是否都可以更新 基本表是本身独立存在的表,在 sQL 中一个关系就对应一个表。视图是从一个或几个基本表导出的表。视图本身不独立存储在数据库中,是一个虚表。即数据库中只存放视图的定义而不存放视图对应的数据,这些数据仍存放在导出视图的基本表中。视图在概念上与基本表等同,用户可以如同基本表那样使用视图,可以在视图上再定义视图。 (l)视图能够简化用户的操作;(2)视图使用户能以多种角度看待同一数据;(3)视图对重构数据库提供了一定程度的逻辑独立性;(4)视图能够对机密数据提供安全保护。不是。视图是不实际存储数据的虚表,因此对视图的更新,最终要转换为对基本表的更新。因为有些视图的更新不能惟一有意义地转换成对相应基本表的更新,所以,并不是所有的视图都是可更新的.10.哪类视图是可以更新的?哪类视图是不可更新的?各举一例说明。 答:基本表的行列子集视图一般是可更新的。若视图的属性来自集函数、表达式,则该视图 肯定是不可以更新的。 9.登记日志文件的基本原则:1)登记的次序严格按并发事物执行的时间次序 2)必须先写日志文件后写数据库 11.事物具有四个特性: 原子性:事物是数据库的逻辑基本工作单位。 一致性:事物执行的结果必须是使数据库从一个一致性状态编导另一个一致性状态。隔离性:一个事物的执行不能被其他事物干扰 持续性:一个事物一旦提交,他对数据库中数据的改变就应该是永久性的! 12.并发操作可能会产生哪几类数据不一致?用什么方法能避免各种不一致的情况? 答:包括三类:丢失修改、不可重复读和读“脏’夕数据。 (l)丢失修改两个事务 Tl 和 T2 读入同一数据并修改,T2 提交的结果破坏了(覆盖了)Tl 提交的结果,导致 Tl 的修改被丢失。(2)不可重复读不可重复读是指事务 Tl 读取数据后,事务几执行更新操作,使 Tl 无法再现前一次读取结果。(3)读“脏”数据读“脏’夕数据是指事务 Tl 修改某一数据,并将其写回磁盘,事务几读取同一数据后,Tl 由于某种原因被撤销,这时Tl 已修改过的数据恢复原值,几读到的数据就与数据库中的数据不一致,则几读到的数据就为“脏”数据,即不正确的数据。避免不一致性的方法和技术就是并发控制。最常用的技术是封锁技术。也可以用其他技术,例如在分布式数据库系统中可以采用时间戳方法来进行并发控制。 13.什么是封锁?基本的封锁类型有几种?试述它们的含义。 答:封锁就是事务 T 在对某个数据对象例如表、记录等操作之前,先向系统发出请求,对其加锁。加锁后事务 T 就对该数据对象有了一定的控制,在事务 T 释放它的锁之前,其他的事务不能更新此数据对象。封锁是实现并发控制的一个非常重要的技术。 基本的封锁类型有两种:排它锁和共享锁。排它锁又称为写锁。若事务 T 对数据对象 A 加上 X 锁,则只允许 T读取和修改 A,其他任何事务都不能再对 A 加任何类型的锁,直到 T 释放 A 上的锁。这就保证了其他事务在 T 释放 A 上的锁之前不能再读取和修改 A。共享锁又称为读锁。若事务 T 对数据对象 A 加上 S 锁,则事务 T 可以读 A 但不能修改 A,其他事务只能再对A 加 S 锁,而不能加 X 锁,直到 T 释放 A 上的 S 锁。这就保证了其他事务可以读 A,但在 T 释放 A 上的 S 锁之前不能对 A 做任何修改。14.如何用封锁机制保证数据的一致性? 答: DBMS 在对数据进行读、写操作之前首先对该数据执行封锁操作,例如下图中事务Tl 在对 A 进行修改之前先对 A 执行 xock(A),即对 A 加 x 锁。这样,当几请求对 A 加x 锁时就被拒绝,几只能等待 Tl 释放 A 上的锁后才能获得对 A 的 x 锁,这时它读到的A 是 Tl 更新后的值,再按此新的 A 值进行运算。这样就不会丢失 Tl 的更新。 Three schema architecture of dbs 1.外模式:也称子模式或用户模式,他是数据用户能够看见和使用的局部的数据结构和特征的描述,是数据库用户的数据视图,且与某一应用有关的数据逻辑表示。 2.模式:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。他是数据库系统模式结构的中间层,既不涉及数据的物理存储细节和硬件环境,也与具体的应用程序、所使用的应用开发工具及高级程序设计语言无关。综合的考虑了所有用户的需求。 3.内模式:也称存储模式,一个数据库只有一个内模式,他是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。Independence of data 1.逻辑独立性:1它通过外模式/模式映像表现出来。2模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。3对同一模式可以有多个外模式,对于一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系;当模式改变时,由数据库管理员对各个外模式的映像作用相应改变可以使外模式保持不变。 2.物理独立性:1它通过模式/内模式反映出来。2模式/内模式映像是唯一的,它定义了数据全局逻辑结构和存储结构之间的对应关系。3当数据库的存储结构改变了,由数据库管理员对模式/内模式映像作相应改变,而应用程序不用改变。 Main factors of the data model 1.数据结构:指所研究数据集合及数据间的联系,是对系统静态特性的描述 2.数据操作:对数据库中各类数据允许执行的操作及有关的操作规则,检索、更新(包括插入、删除、修改),是对系统动态特性的描述 3数据的约束条件:一组数据及其联系所具有的制约规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容 Design strategies for conceptual design 1自顶向下:首先定义全局概念结构的框架,然后逐步细化。 2自底向下:首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构。 3逐步扩张:首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构。 4混合策略:将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。 Translation Rules 一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码。对实体间的联系:一个1:1联系可以转换为一个独立的关系模式,也可以与任意对应的关系模式合并;一个1:n联系可以转换为一个独立的关系模式,它的码为n端实体的码;也可以与n端对应的关系模式合并;一个m:n联系转换为一个关系模式,码为两端实体码的组合;三个或三个以上实体间的一个多元联系可以转换为一个关系模式;具有相同码的关系模式可以合并。 The Phases of Database Design 1需求分析:通过详细调查显示世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。 2概念设计:将需求分析得到的用户需求抽象为信息结构即概念模型。 3逻辑结构设计:把概念结构设计阶段设计好的基本E-R图转换为与选用dbms产品所支持的数据模型相符合的逻辑结构。 4物理结构设计为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程。5数据库实施:用rdbms提供的数据定义语言和其他实用程序将数据库逻辑设计和物理设计结果严格描述出来,成为dbms可以接受的源代码,再经过调试产生目标模式,然后组织数据入库。 6数据库运行和维护:对数据库设计进行评价、调整、修改、等维护工作。第三篇:数据库期末
第四篇:数据库考试试题总结
第五篇:数据库考试