数据库期末

第一篇：数据库期末

一．ＥＲ图作成及向关系模式转化

1.学校中有若干系，每个系有若干班级和教研室，每个教研室有若干教员，其中有的教授和副教授每人各带若干研究生；每个班有若干学生，每个学生选修若干课程，每门课可由若干学生选修。请用 E 一 R 图画出此学校的概念模型。

2.某学生宿舍管理系统，涉及的部分信息如下：(1)学生：学号，姓名，性别，专业，班级。(2)寝室：寝室号，房间电话。

(3)管理员：员工号，姓名，联系电话。

其中：每个寝室可同时住宿多名学生，每名学生只分配一个寝室；每个寝室指定其中一名学生担当寝室长；每个管理员同时管理多个寝室，但每个寝室只有一名管理员。(1)建立一个反映上述局部应用的ER模型，要求标注联系类型。

(2)根据转换规则，将ER模型转换为关系模型。要求标注每个关系模型的主键和外键（如果存在）。（1）

（2）

 学生（学号，姓名，性别，专业，班级）主键：学号

 住宿（寝室号，学号）主键：学号

寝室号是外键；学号也是外键

 学生管理寝室（寝室号，寝室长学号）主键：寝室号或者寝室长学号

寝室号是外键；寝室长学号也是外键

 寝室（寝室号，房间电话）主键：寝室号

 管理（寝室号，员工号）主键：寝室号

寝室号是外键；员工号是外键

 管理员（员工号，姓名，联系电话）主键：员工号

合并后的答案：

 学生（学号，姓名，性别，专业，班级，寝室号）主键：学号寝室号是外键

 寝室（寝室号，房间电话，寝室长学号，员工号）主键：寝室号或者寝室长学号员工号是外键；寝室长学号是外键

 管理员（员工号，姓名，联系电话）主键：员工号

3设某工厂数据库中有四个实体集。

一是“仓库”实体集，属性有仓库号、仓库面积等；二是“零件”实体集，属性有零件号、零件名、规格、单价等；三是“供应商”实体集，属性有供应商号、供应商名、地址等；四是“保管员”实体集，属性有职工号、姓名等。

设仓库与零件之间有“存放”联系，每个仓库可存放多种零件，每种零件可存放于若干仓库中，每个仓库存放每种零件要记录库存量；供应商与零件之间有“供应”联系，一个供应商可供应多种零件，每种零件也可由多个供应商提供，每个供应商每提供一种零件要记录供应量；仓库与保管员之间有“工作”联系，一个仓库可以有多名保管员，但一名保管员只能在一个仓库工作。

(1)试为该工厂的数据库设计一个ER模型，要求标注联系类型。

(2)根据转换规则，将ER模型转换成关系模型，要求标明每个关系模式的主键和外键。

（2）

 仓库（仓库号，仓库面积）主键：仓库号

 存放（仓库号，零件号，库存量）主键：仓库号，零件号

仓库号是外键，零件好也是外键。

 零件（零件号，零件名，规格，单价）主键：零件号

 供应（零件号，供应商号，供应量）主键：零件号，供应商号

零件号是外键，供应商号是外键

 供应商（供应商号，供应商名，地址）主键：供应商号

 工作（职工号，仓库号）主键：职工号

职工号是外键，仓库号是外键

 保管员（职工号、姓名）主键：职工号

合并后的答案：

 仓库（仓库号，仓库面积）主键：仓库号

 存放（仓库号，零件号，库存量）主键：仓库号，零件号

仓库号是外键，零件好也是外键。

 零件（零件号，零件名，规格，单价）主键：零件号

 供应（零件号，供应商号，供应量）主键：零件号，供应商号

零件号是外键，供应商号是外键

 供应商（供应商号，供应商名，地址）主键：供应商号

 保管员（职工号，姓名，仓库号）主键：职工号仓库号是外键

二．函数依赖识别以及规范到3NF 1.设某人才市场数据库中有一个记录应聘人员信息的关系模式： R（人员编号，姓名，性别，职位编号，职位名称，考试成绩）

如果规定：每人可应聘多个职位，每个职位可由多人应聘且必须参加相关考试，考试成绩由人员编号和职位编号确定。

姓名可以重复。职位名称不可重复。

（1）根据上述规定，写出模式R的基本FD和关键码。（2）R最高属于第几范式。（3）将R规范到3NF。答案：

（1）根据上述规定，写出模式R的基本FD和关键码。人员编号→姓名人员编号→性别职位编号→职位名称职位名称→职位编号

（人员编号，职位编号）→考试成绩候选码：（人员编号，职位编号）（2）R最高属于第几范式。

R最高属于第一范式。因为非主属性姓名，性别部分依赖于码，不属于第二范式。（3）将R规范到3NF。

人员（人员编号，姓名，性别）职位（职位编号，职位名称）

应聘（人员编号，职位编号，考试成绩）2.设有一个反映教师参加科研项目的关系模式：

R（教师号，教师名称，项目名称，科研工作量，项目类别，项目金额，负责人）

如果规定：每个项目可有多人参加，每名教师每参加一个项目有一个科研工作量；每个项目只属于一种类别，只有一名负责人。教师名称可以重复。（1）根据上述规定，写出模式R的基本FD和关键码。（2）说明R不是2NF的理由。（3）将R规范到3NF。答案：（1）根据上述规定，写出模式R的基本FD和关键码。教师号→教师名称项目名称→项目类别项目名称→项目金额项目名称→负责人

（教师号，项目名称）→科研工作量主键：（教师号，项目名称）（2）说明R不是2NF的理由。

非主属性教师名称，项目类别，项目金额，负责人部分依赖码。（3）将R规范到3NF。教师（教师号，教师名称）

项目（项目名称，项目类别，项目金额，负责人）项目开发（教师号，项目名称，科研工作量）3.设有一个记录学生毕业设计情况的关系模式：

R（学号，学生名，班级，教师号，教师名，职称，毕业设计题目，成绩）

如果规定：每名学生只有一位毕业设计指导教师，每位教师可指导多名学生；学生的毕业设计题目可能重复。

（1）根据上述规定，写出模式R的基本FD和关键码。（2）R最高属于几范式。（3）将R规范到3NF。

三． SQL语句

1.零件、供应商、采购  设有以下关系模式

PART(PNO, PNAME, PMODEL)零件号、零件名称、零件型号

BUY(PNO, SNO, BDATE, BPRICE, BNUM)零件号、供应商号、采购日期、采购价格、采购数量

SUPPLIER(SNO, SNAME, SADDRESS)供应商号，供应商名称，供应商地址

 要求写出符合下列题目要求的SQL语句

（1）查询供应商名称为‟创新零件‟的所有零件购买记录（零件号、零件名称、零件型号、供应商号、供应商名称、采购日期、采购价格、采购数量）。

查询供应商名称为‟创新零件‟的所有零件购买记录（零件号、零件名称、零件型号、供应商号、供应商名称、采购日期、采购价格、采购数量）。

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

SUPPLIER.SNAME = '创新零件';（2）查询零件‟O性密封圈‟并且型号为‟5*5‟的零件购买记录。

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

PART.PNAME = 'O型密封圈' AND

PART.PMODEL = '5*5';（3）查询2011年5月份的零件购买记录

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

BUY.BDATE BETWEEN TO_DATE(‘2011-05-01', 'YYYY-MM-DD')AND TO_DATE('2011-05-31', 'YYYY-MM-DD');（4）查询2011年度采购价格1000元以上的零件购买记录

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY

WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

BUY.BPRICE >= 1000 AND

BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD');（5）查询2011年度各零件的购买总数量和总金额，按零件号排列

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM PART, BUY WHERE PART.PNO = BUY.PNO AND

BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD')GROUP BY PART.PNO, PART.PNAME, PART.PMODEL ORDER BY PART.PNO;（6）查询各供应商2011年度的零件供应总数量和总金额，按总金额逆序排列

SELECT SUPPLIER.SNO, SUPPLIER.SNAME, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM SUPPLIER, BUY WHERE BUY.SNO = SUPPLIER.SNO AND

BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD')

GROUP BY SUPPLIER.SNO, SUPPLIER.SNAME ORDER BY AMOUNT DESC;（7）查询供应商‟创新零件‟2011年度的零件供应总数量和总金额

SELECT SUPPLIER.SNO, SUPPLIER.SNAME, SUM(BUY.BNUM)AS CNT, SUM(BUY.BPRICE * BUY.BNUM)AS AMOUNT FROM SUPPLIER, BUY WHERE BUY.SNO = SUPPLIER.SNO AND

SUPPLIER.SNAME = '创新零件' AND

BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD')

GROUP BY SUPPLIER.SNO, SUPPLIER.SNAME；（8）查询符合下列条件的零件购买记录零件号‟PART01‟ 非‟创新零件‟供应商

零件采购价格低于‟创新零件‟且零件号为‟PART01‟的最低价格

SELECT PART.PNO, PART.PNAME, PART.PMODEL, SUPPLIER.SNO, SUPPLIER.SNAME, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

PART.PNO = 'PART01' AND

SUPPLIER.SNAME <> '创新零件' AND

BUY.BPRICE <(SELECT MIN(BUY.BPRICE)FROM BUY, SUPPLIER WHERE BUY.SNO = SUPPLIER.SNO AND BUY.PNO = 'PART01' AND SUPPLIER.SNAME = '创新零件');（9）在零件表中插入记录(„PART06‟, „轮胎‟, „225/55 R17‟)INSERT INTO PART

VALUES('PART06', '轮胎', '225/55 R17');（10）在零件表中删除零件规格为„225/55 R17‟的记录 DELETE FROM PART

WHERE PART.PMODEL = '225/55 R17';

（11）更新供应商‟创新零件‟的地址为‟杭州市‟ UPDATE SUPPLIER SET SUPPLIER.SADDRESS ='杭州市' WHERE SUPPLIER.SNAME = '创新零件';（12）生成一个视图ANNUALBUY显示2011年度所有零件购买记录，按照供应商号排序，一个供应商内按照零件号排序 CREATE VIEW ANNUALBUY AS SELECT SUPPLIER.SNO, SUPPLIER.SNAME, PART.PNO, PART.PNAME, PART.PMODEL, BUY.BDATE, BUY.BPRICE, BUY.BNUM FROM PART, SUPPLIER, BUY WHERE PART.PNO = BUY.PNO AND

BUY.SNO = SUPPLIER.SNO AND

BUY.BDATE BETWEEN TO_DATE('2011-1-1', 'YYYY-MM-DD')AND TO_DATE('2011-12-31', 'YYYY-MM-DD')

ORDER BY SUPPLIER.SNO, PART.PNO;

（13）赋予用户张小明对零件表有SELECT权利，对购买表的采购数量字段有更新权限。GRANT SELECT ON PART, UPDATE(BNUM)ON BUY TO 张小明;（14）收回用户张小明对零件表有SELECT权利。REVOKE SELECT ON PART FROM 张小明;2.试用SQL语言查询项目金额在20000元~30000元（包括20000元和30000元）之间并且项目名称以‟银行‟开头的项目名称，项目类别，项目金额。SELECT PNAME,PCATOGERY,AMOUNT FROM PROJECT WHERE AMOUNT BETWEEN 20000 AND 30000 AND PNAME LIKE ‘银行%’;

3.试用SQL语言查询参加项目名称为“网上书城”的教师姓名。

SELECT TNAME FROM TEACHER, DELIVERY,PROJECT WHERE TEACHER.TNO=DELIVERY.TNO AND DELIVERY.PNO=PROJECT.PNO AND PROJECT.PNAME=‘网上书城’;

第二篇：数据库考试期末总结

第1章数据库系统概述

1、基本概念

• 数据库、数据库管理系统、数据库系统 • 数据库系统的特点和功能 • 数据抽象

– 三种数据抽象能力 – 三种数据库模式 – 两种数据独立性

• 数据库系统的用户 • 数据模型、数据库语言 • 数据库管理系统的结构

2、重点

• 数据库、数据库管理系统、数据库系统 • 两种数据独立性

第2章关系数据库系统

1、知识点

• 关系数据模型

– 数据结构 – 完整性约束 – 操作

• 关系运算的安全性

• 关系代数、元组关系演算、域关系演算的等价性 • SQL – 交互式 – 嵌入式

2、基本概念

• 关系、属性、元组、关系模式、关系实例 • 关系的性质

• 候选键、主键、键属性、非键属性、外部键 • 实体完整性约束、关联完整性约束 • 关系代数操作的定义

• 关系代数的基本操作和附加操作 • 专门的关系运算 • SQL语言的子语言

• 每个SQL语句的功能及语法格式

3、重点

• 关系数据模型 • 关系代数 • SQL语句

第3章数据库的安全性与完整性

1、知识点 • 安全性

– 定义

– 需要解决的问题 – 解决的方法

• 完整性

– 定义 – 类型

– 定义和验证方法

2、基本概念 • 安全性的定义 • 完整性的定义 • 完整性的类型

第4章数据库设计概述与需求分析

1、基本概念 • DB设计的任务 • DB的生命周期 • DB的设计过程 • DB的需求分析的任务、目标、步骤

第5章概念数据库设计

1、知识点

• 实体联系模型（ER模型）• 实体、实体型

• 实体的属性、实体的属性值、复合属性、单值属性、多值属性、导出属性、空值

• 键、简单键、复合键 • 实体间的联系

• 实体对应约束（1:

1、1:n、m:n）、实体关联约束（全域关联约束、部分关联约束）

• 弱实体型、弱实体、识别实体型、识别联系 • 弱实体型的部分键 • ER图

2、基本概念

• 复合属性、多值属性、导出属性 • 1:

1、1:n、m:n联系 • 概念数据库设计的任务 • 概念数据库设计的目标 • 概念数据库设计的步骤

• 概念数据库设计的方法、视图综合设计方法 • 概念数据库设计的策略

3、重点 • ER图

第6章逻辑数据库设计

1、知识点

• 形成初始关系模式

– 普通实体、弱实体、多值属性、各种联系

• 函数依赖、完全函数依赖、部分函数依赖、传递函数依赖 • 给定关系实例，求函数依赖集 • Armstrong公理系统、三条推理规则 • 求属性闭包、求候选键

• 两个函数依赖集等价的判定、求最小函数依赖集 • 关系模式的规范形式

– 1NF、2NF、3NF、BCNF • 关系模式的规范化方法

– 无损连接性、函数依赖保持性、判别方法 – 关系模式的分解算法

2、基本概念

• 逻辑数据库设计的任务 • 逻辑数据库设计的目标 • 逻辑数据库设计的步骤 • 初始关系模式可能存在的问题

• 函数依赖、完全函数依赖、部分函数依赖、传递函数依赖 • Armstrong公理系统、三条推理规则 • 1NF、2NF、3NF、BCNF •

3、重点

• 形成初始关系模式，并指出每个关系模式的主键和外键 • 给定关系实例，求函数依赖集 • 求属性闭包、求候选键 • 判断两个函数依赖集等价

• 求与给定函数依赖集等价的最小函数依赖集 • 判断一个关系模式最高属于几范式 • 判断给定的分解是否具有无损连接性 • 关系模式的3NF、BCNF分解算法

第7章物理数据库设计

1、知识点 • 物理数据库设计的任务 • 物理数据库设计的步骤

第8章物理存储结构

1、知识点

• 物理存储设备

– 磁盘的存储特性和访问特性

• 磁盘冗余技术 • 文件和文件记录

• 各种文件结构的存储空间和查询时间的计算 • 各种索引的存储空间和查询时间的计算

2、基本概念 • 记录

• 定长记录文件、边长记录文件 • 跨块记录、非跨块记录 • 无序文件、有序文件 • 索引域、索引文件、索引记录 • 稀疏索引、稠密索引 • 主索引、辅助索引、聚集索引 • B树、B+树

3、重点

• 各种文件和索引占用的空间计算 • 利用各种文件和索引的查询时间的计算

第9章数据库管理系统的数据字典

1、重点

• 数据字典的概念 • 数据字典中存储的信息

• 把数据字典作为普通关系处理具有两个优点

第10章关系代数操作的实现算法

1、重点

• 查询处理的过程

• 各个关系代数操作的算法及代价分析

第11章查询优化技术

1、知识点

• 关系代数的等价变换规律 • 启发式代数优化规则 • 初始关系代数表达式

• 关系代数表达式到查询树的转换 • 启发式关系代数优化算法 • 基于复杂性估计的查询优化算法 • 语义查询优化方法

2、重点

• 关系代数的等价变换规律 • 启发式代数优化规则 • 初始关系代数表达式

• 关系代数表达式到查询树的转换 • 启发式关系代数优化算法

第12章并发控制技术

1、知识点 • 事务

• 不对并发事务进行控制导致的问题 • 事务的性质

• 事务的调度、串行调度、并行调度 • 可串行的调度 • 冲突 • 冲突等价 • 冲突可串行

• 冲突可串行的测试方法 • 两段锁协议

2、基本概念

• 事务处理包括哪两方面的内容 • 不对并发事务进行控制导致的问题

• 事务、事务的状态、事务的性质、事务的原子性 • 调度、串行调度、并行调度、可串行调度 • 冲突、冲突等价、冲突可串行

3、重点 • 基本概念

• 冲突可串行的测试方法

• 两段锁协议

第13章数据库恢复技术

1、知识点 • 日志 • 日志的内容 • 日志的产生过程

• 使用日志进行系统恢复的方法

2、重点

• 使用推迟更新技术（REDO日志技术）和即时更新技术（UNDO/REDO日志）进行系统恢复的方法，包括恢复时所做的操作以及恢复后数据库中数据项的值。

第三篇：数据库期末复习总结

数据库原理综合习题答案

1.1 名词解释

(1)DB：即数据库（Database),是统一管理的相关数据的集合。DB能为各种用户共享，具有最小冗余度，数据间联系密切，而又有较高的数据独立性。

(2)DBMS：即数据库管理系统（Database Management System)，是位于用户与操作系统之间的一层数据管理软件，为用户或应用程序提供访问DB的方法，包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型，可以分为层次型、网状型、关系型、面向对象型DBMS。

(3)DBS：即数据库系统（Database System),是实现有组织地、动态地存储大量关联数据，方便多用户访问的计算机软件、硬件和数据资源组成的系统，即采用了数据库技术的计算机系统。

(4)1：1联系：如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系，反之亦然，那么实体集E1对E2的联系称为“一对一联系”，记为“1：1”。

(5)1：N联系：如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，而E2中每个实体至多和E1中的一个实体有联系，那么E1对E2的联系是“一对多联系”，记为“1：N”。

(6)M：N联系：如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，反之亦然，那么E1对E2的联系是“多对多联系”，记为“M：N”。

(7)数据模型：模型是对现实世界的抽象。在数据库技术中，表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型：概念数据模型和结构数据模型。

(6)概念数据模型：是独门于计算机系统的模型，完全不涉及信息在系统中的表示，只是用来描述某个特定组织所关心的信息结构。

(9)结构数据模型：是直接面向数据库的逻辑结构，是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统，所以称为“结构数据模型”。结构数据模型应包含：数据结构、数据操作、数据完整性约束三部分。它主要有：层次、网状、关系三种模型。

(10)层次模型：用树型结构表示实体类型及实体间联系的数据模型。

(11)网状模型：用有向图结构表示实体类型及实体间联系的数据模型。

(12)关系模型：是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集，用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。

(13)概念模式：是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型，还要描述记录间的联系、操作、数据的完整性、安全性等要求。

(14)外模式：是用户与数据库系统的接口，是用户用到的那部

分数据的描述。

(15)内模式：是数据库在物理存储方面的描述，定义所有的内部记录类型、索引和文件的组成方式，以及数据控制方面的细节。

(16)模式/内模式映象：这个映象存在于概念级和内部级之间，用于定义概念模式和内模式间的对应性，即概念记录和内部记录间的对应性。此映象一般在内模式中描述。

(17)外模式/模式映象：这人映象存在于外部级和概念级之间，用于定义外模式和概念模式间的对应性，即外部记录和内部记录间的对应性。此映象都是在外模式中描述。

(18)数据独立性：在数据库技术中，数据独立性是指应用程序和数据之间相互独立，不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。

(19)物理数据独立性：如果数据库的内模式要进行修改，即数据库的存储设备和存储方法有所变化，那么模式/内模式映象也要进行相应的修改，使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

(20)逻辑数据独立性：如果数据库的概念模式要进行修改（如增加记录类型或增加数据项），那么外模式/模式映象也要进行相应的修改，使外模式尽可能保持不变。也就是对概念模式的修改尽量不影响外模式和应用程序。

(21)宿主语言：在数据库技术中，编写应用程序的语言仍然是一些高级程序设计语言，这些语言称为宿主语言（host language),简称主语言。

(22)DDL：数据定义语言（Data Definition Language),用于定义数据库的三级结构，包括外模式、概念模式、内模式及其相互之间的映象，定义数据的完整性、安全控制等约束。

(23)DML：数据操纵语言（Data Manipulation Language),由DBMS提供，用于让用户或程序员使用，实现对数据库中数据的操作。DML分成交互型DML和嵌入型DML两类。依据语言的级别，DML又可分成过程性DML和非过程性DML两种。

(24)交互型DML：如果DML自成系统，可在终端上直接对数据库进行操作，这种DML称为交互型DML。

(25)嵌入型DML：如果DML嵌入在主语言中使用，此时主语言是经过扩充能处理DML语句的语言，这种DML称为嵌入型DML。

(26)过程性DML：用户编程时，不仅需要指出“做什么”（需要什么样的数据），还需要指出“怎么做”（怎么获得数据）。层状、网状的DML属于过程性语言。

(27)非过程性DML：用户编程时，只需要指出“做什么”，不需要指出“怎么做”。

Notice:以上关于DML的各个概念单独出现时，首先要解释DML的含义。

(28)DD：数据字典（Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。对数据库的操作都要通过访问DD才能实现。

(29)DD系统：管理DD的实用程序称为“DD系统”。

1.2 文件系统阶段的数据管理有些什么缺陷？试举例说明。

文件系统有三个缺陷：

（1）数据冗余性（redundancy)。由于文件之间缺乏联系，造成每个应用程序都有对应的文件，有可能同样的数据在多个文件中重复存储。

（2）数据不一致性（inconsistency)。这往往是由数据冗余造成的，在进行更新操作时，稍不谨慎，就可能使同样的数据在不同的文件中不一样。

（3）数据联系弱(poor data relationship)。这是由文件之间相互独立，缺乏联系造成的。

1.3 数据库阶段的数据管理有些什么特点？

(1)采用复杂的数据模型表示数据结构

(2)有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级)

(3)数据库系统为用户提供方便的用户接口，可以使用查询语言、终端命令或程序方式操作数据，也可以用程序方式操作数据库。

(4)系统提供了四个方面的数据控制功能：数据库的恢复、并发控制、数据完整性和数据安全性，以保证数据库中数据是安全的、正确的和可靠的。

(5)对数据的操作不一定以记录为单位，还可以数据项为单位，增加了系统的灵活性。

1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别？试举例说明。

实体（entity)：是指客观存在可以相互区别的事物。实体可以是具体的对象，如：一个学生，一辆汽车等；也可以是抽象的事件，如：一次借书、一场足球赛等。

属性（attribute):实体有很多特性，每一个特性称为属性。每个属性有一个值域，其类型可以是整数型、实数型、字符串型。比如，学生（实体）有学号、姓名、年龄、性别等属性，相应值域为字符、字符串、整数和字符串型。

字段（field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位，所以又称为数据元素或初等项。字段的命名往往和属性名相同，比如，学生有学号、姓名、年龄、性别等字段。

记录（record):字段的有序集合称为记录。一般用一个记录描述一个实体，所以记录又可以定义为能完整地描述一个实体的字段集。如：一个学生记录，由有序的字段集（学号、姓名、年龄、性别等）组成。

1.5 逻辑记录与物理记录，逻辑文件与物理文件有些什么联系和区别？

联系：

(1)逻辑记录与物理记录都是记录，是字段的有序集合；

(2)逻辑文件与物理文件都是文件，是同一类记录的汇集。

区别：

(1)逻辑记录与逻辑文件是逻辑数据描述，物理记录与物理文件是物理数据描述。

(2)物理数据描述是指数据在存储设备上的存储方式，物理记录、物理文件（还有物理联系、物理结构等术语），都是用来描述实际存储设备上的数据。

(3)逻辑数据描述是指程序员或用户用以操作的数据形式，是抽象的概念化数据。逻辑记录、逻辑文件（还有逻辑联系、逻辑结构等术语），都是用户观点的数据描述。

1.6 为某百货公司设计一个ER模型。

百货管辖若干个连锁商店，每家商店经营若干商品，每家商店有若干职工，但每个职工只能服务于一家商店。实体类型“商店”的属性有：商店编号，店名，店址，店经理。实体类型“商品”的属性有：商品编号，商品名，单价，产地。实体类型“职工”的属性有：职工编号，职工名，性别，工资。在联系中应反映出职工参加某商店工作的开始时间，商店销售商品的月销售量。

试画出反映商店、商品、职工实体类型及联系类型的ER图，并将其转换成关系模式集。

实体：商店（商店编号，店名，店址，店经理）

商品（商品编号，商品名，单价，产地）

职工（职工编号，职工名，性别，工资）

联系：SC(商店—商品之间1：N的联系，联系属性为“职工参加商店工作的开始时间”。

SE(商店—职工之间1：N的联系)，联系属性为“月销售量”。

关系模式集：商店模式（商店编号，店名，店址，店经理）

商品模式（商品编号，商品名，单价，产地，商店编号，月销售量）

职工模式（职工编号，职工名，性别，工资，商店编号，开始时间）

1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。

ER模型的主要特点：

（1）优点：接近于人的思维，容易理解；与计算机无关，用户容易接受。

（2）缺点：只能说明实体间语义的联系，不能进一步说明详细的数据结构。

层次模型的特点：

（1）优点：记录之间的联系通过指针实现，查询效率较高。

（2）缺点：只能表示1：N联系，实现M:N结构较复杂；由于层次顺序的严格和复杂，引起数据的查询和更新操作也很复杂。

网状模型的特点：

（1）优点：记录之间联系通过指针实现，M：N联系也容易实现（每个M：N联系可拆成两个1：N联系），查询效率较高。

（2）缺点：编写应用程序比较复杂，程序员必须熟悉数据库的逻辑结构。

关系模型的特点：

用关鍵码而不是用指针导航数据，表格简单，用户易懂，编程时并不涉及存储结构、访问技术等细节。

1.8 试述概念模式在数据库结构中的重要地位。

概念模式是数据库中

全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型，还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户，按内模式的描述存储在磁盘中，而概念模式提供了连接这两级的相对稳定的中间观点，并使得两级的任何一级的改变都不受另一级的牵制。

1.9 数据独立性与数据联系这两个概念有什么区别？

数据独立性是指应用程序与数据之间相互独立，不受影响。

数据联系是指同一记录内部各字段间的联系，以及记录之间的联系。

1.10 试述DBMS在用户访问数据库过程中所起的作用.用户对数据库进行操作，DBMS把操作从应用程序带到外部级、概念级、再导向内部级，进而操作存储器中的数据。

（结合P22“用户访问数据的过程”来理解）

1.11 试述DBMS的主要功能。

DBMS的主要功能有：

（1）数据库的定义功能

（2）数据库的操纵功能

（3）数据库的保护功能

（4）数据库的存储管理

（5）数据库的维护功能

（6）数据字典

1.12 试叙DBMS对数据库的保护功能。

DBMS对数据库的保护主要通过四个方面实现：

（1）数据库的恢复。

（2）数据库的并发控制。

（3）数据库的完整性控制。

（4）数据库的安全性控制。

1.13 试叙DBMS对数据库的维护功能。

DBMS中有一些程序提供给数据库管理员运行数据库系统时使用，这些程序起着数据库维护的功能。

主要有四个实用程序：

（1）数据装载程序(loading)

（2）备份程序(backup)

（3）文件重组织程序

（4）性能监控程序

1.14 从模块结构看，DBMS由哪些部分组成？

从模块结构看，DBMS由两大部分组成：查询处理器和存储管理器

（1）查询处理器有四个主要成分：DDL编译器，DML编译器，嵌入型DML的预编译器，查询运行核心程序

（2）存储管理器有四个主要成分：授权和完整性管理器，事务管理器，文件管理器，缓冲区管理器

（以上几题具体可参照书上p20-21)

1.15 DBS由哪几个部分组成？

DBS由四部分组成：数据库、硬件、软件、数据库管理员。

1.16 什么样的人是DBA？DBA应具有什么素质？DBA的职责是什么？

DBA是控制数据整体结构的人，负责DBS的正常运行。DBA可以是一个人，在大型系统中也可以是由几个人组成的小组。DBA承担创建、监控和维护整个数据库结构的责任。

DBA应具有下列素质：

（1）熟悉企

业全部数据的性质和用途；

（2）对用户的需求有充分的了解；

（3）对系统的性能非常熟悉。

DBA的主要职责有五点：

（1）概念模式定义

（2）内模式定义

（3）根据要求修改数据库的概念模式和内模式

（4）对数据库访问的授权

（5）完整性约束的说明

1.17 试对DBS的全局结构作详细解释。

参照教材p24-25。

1.18 使用DBS的用户有哪几类？使用DBS的用户有四类：

1）DBA

2）专业用户

3）应用程序员

4）最终用户

1.19 DBMS的查询处理器有哪些功能？

DBMS的查询处理器可分成四个成分：

1）DML编译器

2）嵌入型DML的预编译器

3）DDL编译器

4）查询运行核心程序

（各成分功能参照P24）

1.20 DBMS的存储处理器有哪些功能？

DBMS的存储处理器提供了应用程序访问数据库中数据的界面，可分成四个成分：

1）授权和完整性管理器

2）事务管理器

3）文件管理器

4）缓冲区管理器

（各成分功能参照P25）

1.21 磁盘存储器中有哪四类主要的数据结构？

数据文件:存储了数据库中的数据；

数据字典（DD）：存储三级结构的描述；

索引文件：为提高查询速度而设置的逻辑排序手段；

统计数据组织：存储DBS运行时统计分析数据。

(1)关系模型：用二维表格结构表示实体集，外键表示实体间联系的数据模型称为关系模型。

(2)关系模式：关系模式实际上就是记录类型。它的定义包括：模式名，属性名，值域名以及模式的主键。关系模式不涉及到物理存储方面的描述，仅仅是对数据特性的描述。

(3)关系实例：元组的集合称为关系和实例，一个关系即一张二维表格。

(4)属性：实体的一个特征。在关系模型中，字段称为属性。

(5)域：在关系中，每一个属性都有一个取值范围，称为属性的值域，简称域。

(6)元组：在关系中，记录称为元组。元组对应表中的一行；表示一个实体。

(7)超键：在关系中能唯一标识元组的属性集称为关系模式的超键。

(8)候选键：不含有多余属性的超键称为候选键。

(9)主键：用户选作元组标识的一个候选键为主键。（单独出现，要先解释“候选键”）

(10)外键：某个关系的主键相应的属性在另一关系中出现，此时该主键在就是另一关系的外键，如有两个关系S和SC,其中S#是关系S的主键，相应的属性S#在关系SC中也出现，此时S#就是关系SC的外键。

(11)实体完整性规则：这条

规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值，那么主键值就起不了唯一标识元组的作用。

(12)参照完整性规则：这条规则要求“不引用不存在的实体”。其形式定义如下：如果属性集K是关系模式R1的主键，K也是关系模式R2的外键，那么R2的关系中，K的取值只允许有两种可能，或者为空值，或者等于R1关系中某个主键值。这条规则在使用时有三点应注意： 1)外键和相应的主键可以不同名，只要定义在相同值域上即可。2)R1和R2也可以是同一个关系模式，表示了属性之间的联系。3)外键值是否允许空应视具体问题而定。

(13)过程性语言：在编程时必须给出获得结果的操作步骤，即“干什么”和“怎么干”。如Pascal和C语言等。

(14)非过程性语言：编程时只须指出需要什么信息，不必给出具体的操作步骤。各种关系查询语言均属于非过程性语言。

(15)无限关系：当一个关系中存在无穷多个元组时，此关系为无限关系。如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合，这是一个无限关系。

(16)无穷验证：在验证公式时需对无穷多个元组进行验证就是无穷验证。如验证公式(u)(P(u))的真假时需对所有的元组u进行验证，这是一个无穷验证的问题。

2.2 为什么关系中的元组没有先后顺序?

因为关系是一个元组的集合，而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序，即没有行序。

2.3 为什么关系中不允许有重复元组?

因为关系是一个元组的集合，而集合中的元素不允许重复出现，因此在关系模型中对关系作了限制，关系中的元组不能重复，可以用键来标识唯一的元组。

2.4 关系与普通的表格、文件有什么区别?

关系是一种规范化了的二维表格，在关系模型中，对关系作了下列规范性限制：

1)关系中每一个属性值都是不可分解的。

2)关系中不允许出现相同的元组(没有重复元组)。

3)由于关系是一个集合，因此不考虑元组间的顺序，即没有行序。

4)元组中，属性在理论上也是无序的，但在使用时按习惯考虑列的顺序。

2.5 笛卡尔积、等值联接、自然联接三者之间有什么区别?

笛卡尔积对两个关系R和S进行乘操作，产生的关系中元组个数为两个关系中元组个数之积。

等值联接则是在笛卡尔积的结果上再进行选择操作，从关系R和S的笛卡儿积中选择对应属性值相等的元组；

自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作，并去掉重复的公共属性列。当两个关系没有公共属性时，自然连接就转化我笛卡尔积。

2.8 如果R是二元关

系，那么下列元组表达式的结果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}

这个表达式的意思是：从关系R中选择元组，该元组满足：第1分量值或第2分量值至少有一个不等于其他某元组。由于R是二元关系，只有两个分量，由于没有重复元组，上述条件显然满足。所以，这个表达式结果就是关系R。

2.9 假设R和S分别是三元和二元关系，试把表达式π1,5(σ2=4∨3=4(R×S))转换成等价的：(1)汉语查询句子；(2)元组表达式；(3)域表达式。

(1)汉语表达式：

从R×S关系中选择满足下列条件的元组：

第2分量（R中第2分量）与第4分量（S中第1分量）值相等，或第3分量（R中第3分量）与第4分量（S中第1分量）值相等；并取第1列与第5列组成的新关系。

(2)元组表达式：{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])}(3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))}

2.10 假设R和S都是二元关系，试把元组表达式{t|R(t)∧(u)(S(u)∧u[1]≠t[2])}转换成等价的：(1)汉语查询句子；(2)域表达式：(3)关系代数表达式。

(1)汉语表达式：选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。

(2)域表达式:{xy|(u)(v)(R(xy)∧S(uv)∧(u≠y))}(3)关系代数表达式：π1,2(σ2≠3(R×S))

2.11 试把域表达式{ab|R(ab)∧R(ba)}转换成等价的：

(1)汉语查询句子；(2)关系代数表达式；(3)元组表达式。

(1)汉语查询句子：选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。

(2)关系代数表达式：π1，2(σ1=4∧2=3(R×R))；

(3)元组表达式：{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])}

试用关系代数表达式表示下列查询语句。(见下一题）

2.14 试用元组表达式表示上题中各个查询语句。

(1)检索LIU老师所授课程的课程号、课程名。

πC#,CNAME(σTEACHER='LIU'(C))

{t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])}

(2)检索年龄大于23岁的男学生的学号与姓名。

πS#,SNAME(σAGE＞'23'∧SEX='男'(S))

{t|(u)(S(u)∧u[3]＞'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])}

(3)检索学号为S3学生所学课程的课程名与任课教师名。πCNAME,TEACHER(σS#='S3'(SCC))

{t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])}

(4)检索至少选修LIU老

师所授课程中一门课程的女学生的姓名。

πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC))

{t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])}

(5)检索WANG同学不学的课程号。

πC#(C)-πC#(σSNAME='WANG'(SSC))

或者，πC#(SC)-πC#(σSNAME='WANG'(SSC))(全部课程号减去WANG同学所学的课程号){t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])}

(从C中选择满足条件的元组：SC中的所有元组,如果学号与C中所选元组相同的话，其在S中对应的姓名肯定不是'wang'。)

Notice:“p1=>p2”的含义是：如果p1为真，则p2为真。

(6)检索至少选修两门课程的学生学号。

πS#(σ1=4∧2≠5(SC×SC))

SC自乘之后，再选择（同一个学号中两个课程号不同的元组)，投影。

{t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]}

(7)检索全部学生都选修的课程的课程号与课程名。

πC#,CNAME(C(πS#,C#(SC)÷πS#(S)))(涉及到全部值时，应用除法，“除数”是“全部”){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])}

(8)检索选修课程包含LIU老师所授课程的学生学号。

πS#(σTEACHER='LIU'(SCC))

{t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])}

如果LIU老师有多门课程，则选修课程包含LIU老师所授全部课程的学生学号为：

πS#,C#(SC)÷πC#(σTEACHER='LIU'(C))

2.15 在教学数据库S、SC、C中，用户有一查询语句：检索女同学选修课程的课程名和任课教师名。(1)试写出该查询的关系代数表达式；(2)试写出查询优化的关系代数表达式。

(1)πCNAME,TEACHER(σSEX='女'(SSCC))

(2)优化为：πCNAME，TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S))))

(基本思路：尽量提前做选择操作；在每个操作后，应做个投影操作，去掉不用的属性值。

2.16 在2.15题中，(1)画出该查询初始的关系代数表达式的语法树。

(2)使用2.4.4节的优化算法，对语法树进行优化，并画出优化后的语法树。

该查询初始的关系代数表达式的语法树

优化后的语法树

2.17 为什么要对关系代数表达式进行优化?

在关系代数运算中，各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤，直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化，可以提高系统的操作效率，达到执行过程即省时间又省空间的目的。

3.1 名词解释

(1)SQL模式：SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。

(2)SQL数据库：SQL(Structured Query Language)，即‘结构

式查询语言’，采用英语单词表示和结构式的语法规则。一个SQL数据库是表的汇集，它用一个或多个SQL模式定义。

(3)基本表：在SQL中，把传统的关系模型中的关系模式称为基本表(Base Table)。基本表是实际存储在数据库中的表，对应一个关系。

(4)存储文件：在SQL中，把传统的关系模型中的存储模式称为存储文件(Stored File)。每个存储文件与外部存储器上一个物理文件对应。

(5)视图：在SQL中，把传统的关系模型中的子模式称为视图(View)，视图是从若干基本表和（或）其他视图构造出来的表。

(6)行：在SQL中，把传统的关系模型中的元组称为行(row)。

(7)列：在SQL中，把传统的关系模型中的属性称为列(coloumn)。

(8)实表：基本表被称为“实表”，它是实际存放在数据库中的表。

(9)虚表：视图被称为“虚表”，创建一个视图时，只把视图的定义存储在数据词典中，而不存储视图所对应的数据。

(10)相关子查询：在嵌套查询中出现的符合以下特征的子查询：子查询中查询条件依赖于外层查询中的某个值，所以子查询的处理不只一次，要反复求值，以供外层查询使用。

(11)联接查询：查询时先对表进行笛卡尔积操作，然后再做等值联接、选择、投影等操作。联接查询的效率比嵌套查询低。

(12)交互式SQL：在终端交互方式下使用的SQL语言称为交互式SQL。

(13)嵌入式SQL：嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。

(14)共享变量：SQL和宿主语言的接口。共享变量有宿主语言程序定义，再用SQL的DECLARE语句说明，SQL语句就可引用这些变量传递数据库信息。

(15)游标：游标是与某一查询结果相联系的符号名，用于把集合操作转换成单记录处理方式。

(16)卷游标：为了克服游标在推进时不能返回的不便，SQL2提供了卷游标技术。卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进，也能一行行返回。

3.2 对于教学数据库的三个基本表

学生 S(S#,SNAME,AGE,SEX)

学习SC(S#,C#,GRADE)

课程 C(C#,CNAME,TEACHER)

试用SQL的查询语句表达下列查询：

（1）检索LIU老师所授课程的课程号和课程名。

SELECT C#，CNAME

FROM C

WHERE TEACHER=‘LIU’

（2）检索年龄大于23岁的男学生的学号和姓名。

SELECT S#，SNAME

FROM S

WHERE(AGE>23)AND(SEX=‘M’)

（3）检索至少选修LIU老师所授课程中一门课程的女学生姓名。

SELECT SNAME

FROM S

WHERE SEX=‘F’ AND S# IN

(SELECT S#

FROM SC

WHERE C# IN

(SELECT C#

OM C

WHERE TEACHER=‘LIU’)

NOTICE：有多种写法，比如联接查询写法：

SELECT SNAME

FROM S,SC,C

WHERE SEX=‘F’ AND SC.S#=S.S#

AND SC.C#=C.C#

AND TEACHER='LIU' 但上一种写法更好一些。

（4）检索WANG同学不学的课程的课程号。

SELECT C#

FROM C

WHERE C# NOT IN

(SELECT C#

FROM SC

WHERE S# IN

(SELECT S#

FROM S

WHERE SNAME='WANG'))

（5）检索至少选修两门课程的学生学号。

SELECT DISTINCT X.SNO

FROM SC X,SC Y

WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:对表SC进行自连接，X，Y是SC的两个别名。

（6）检索全部学生都选修的课程的课程号与课程名。

SELECT C#,CNAME

FROM C

WHERE NOT EXISTS

(SELECT *

FROM S

WHERE S# NOT IN

(SELECT *

FROM SC

WHERE SC.C#=C.C#))

要从语义上分解：（1）选择课程的课程号与课程名，不存在不选这门课的同学。

其中，“不选这门课的同学”可以表示为：

SELECT *

FROM S

WHERE S# NOT IN

（SELECT *

FROM SC

WHERE SC.C#=C.C#)

或者

SELECT *

FROM S

WHERE

NOT EXISTS

（SELECT *

FROM SC

WHERE S.S#=C.S# AND

SC.C#=C.C#)

（7）检索选修课程包含LIU老师所授课的学生学号。

SELECT DISTINCT S#

FROM SC

WHERE C# IN

(SELECT C#

FROM C

WHERE TEACHER='LIU'))

3.3 设有两个基本表R（A，B，C）和S（D，E，F），试用SQL查询语句表达下列关系代数表达式：

（1）πA(R)

(2)σB='17'(R)

(3)R×S

(4))πA,F(σC=D(R×S))(1)SELECT A FROM R

(2)SELECT * FROM R WHERE B='17'(3)SELECT A,B,C,D,E,F FROM R,S

(4)SELECT A,F FROM R,S WHERE R.C=S.D

3.4 3.4 设有两个基本表R（A，B，C）和S（A，B，C）试用SQL查询语句表达下列关系代数表达式：

（1）R∪S

（2）R∩S

（3）R－S

（4）πA,B(R)πB,C(S)

(1)SELECT A,B,C

FROM R

UNION

SELECT A,B,C

FROM S

(2)SELECT A,B,C

FROM R

INTERSECT

SELECT A,B,C

FROM S

(3)SELECT A,B,C

FROM R

WHERE NOT EXISTS

(SELECT A,B,C

FROM S

WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)

(4)SELECT R.A,R.B,S.C

FROM R,S

WHE

RE R.B=S.B

3.5 试叙述SQL语言的关系代数特点和元组演算特点。

（P61-62）

3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询：

（1）统计有学生选修的课程门数。

SELECT COUNT(DISTINCT C#)FROM SC

（2）求选修C4课程的学生的平均年龄。

SELECT AVG(AGE)

FROM S

WHERE S# IN

(SELECT S#

FROM SC

WHERE C#='C4')或者，SELECT AVG(AGE)

FROM S，SC

WHERE S.S#=SC.S# AND C#='004'

（3）求LIU老师所授课程的每门课程的学生平均成绩。

SELECT CNAME,AVG(GRADE)

FROM SC ,C

WHERE SC.C#=C.C# AND TEACHER='LIU'

GROUP BY C#

（4）统计每门课程的学生选修人数（超过10人的课程才统计）。要求输出课程号和选修人数，查询结果按人数降序排列，若人数相同，按课程号升序排列。

SELECT DISTINCT C#,COUNT(S#)

FROM SC

GROUP BY C#

HAVING COUNT(S#)>10

ORDER BY 2 DESC, C# ASC

（5）检索学号比WANG同学大，而年龄比他小的学生姓名。

SELECT X.SNAME

FROM S AS X, S AS Y

WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE

（6）检索姓名以WANG打头的所有学生的姓名和年龄。

SELECT SNAME,AGE

FROM S

WHERE SNAME LIKE 'WANG%'

（7）在SC中检索成绩为空值的学生学号和课程号。

SELECT S#,C#

FROM SC

WHERE GRADE IS NULL

（8）求年龄大于女同学平均年龄的男学生姓名和年龄。

SELECT SNAME,AGE

FROM S AS X

WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE)FROM S AS Y WHERE Y.SEX='女')

（9）求年龄大于所有女同学年龄的男学生姓名和年龄。

SELECT SNAME,AGE

FROM S AS X

WHERE X.SEX='男' AND X.AGE>ALL(SELECT AGE FROM S AS Y WHERE Y.SEX='女')

3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作：

（1）往基本表S中插入一个学生元组（‘S9’，‘WU’，18）。

INSERT INTO S(S#,SNAME,AGE)VALUES('59','WU',18)

（2）在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别，并把检索到的值送往另一个已存在的基本表STUDENT（S＃，SANME，SEX）。

INSERT INTO STUDENT(S#,SNAME,SEX)

SELECT S#,SNAME,SEX

FROM S WHERE NOT EXISTS

(SELECT * FROM SC WHERE

GRADE<80 AND S.S#=SC.S#)

（3）在基本表SC中删除尚无成绩的选课元组。

DELETE FROM SC

WHERE GRADE IS NULL（4）把WANG同学的学习选课和成绩全部删去。

DELE

TE FROM SC

WHERE S# IN

(SELECT S#

FROM S

WHERE SNAME='WANG')

（5）把选修MATHS课不及格的成绩全改为空值。

UPDATE SC

SET GRADE=NULL

WHERE GRADE<60 AND C# IN

(SELECT C#

FROM C

WHERE CNAME='MATHS')

（6）把低于总平均成绩的女同学成绩提高5%。

UPDATE SC

SET GRADE=GRADE*1.05

WHERE GRADE<(SELECT AVG(GRADE)FROM SC)AND S# IN(SELECT S# FROM S WHERE SEX='F')

（7）在基本表SC中修改C4课程的成绩，若成绩小于等于75分时提高5%，若成绩大于75分时提高4%（用两个UPDATE语句实现）。

UPDATE SC

SET GRADE=GRADE*1.05

WHERE C#='C4' AND GRADE<=75

UPDATE SC

SET GRADE=GRADE*1.04

WHERE C#='C4' AND GRADE>75

3.8 在第1章例1.4中提到“仓库管理”关系模型有五个关系模式：

零件 PART（P＃，PNAME，COLOR，WEIGHT）

项目 PROJECT（J＃，JNAME，DATE）

供应商 SUPPLIER（S＃，SNAME，SADDR）

供应 P＿P（J＃，P＃，TOTOAL）

采购 P＿S（P＃，S＃，QUANTITY）

（1）试用SQL DDL语句定义上述五个基本表，并说明主键和外键。

CREATE TABLE PART

(P# CHAR(4)NOT NULL,PNAME CHAR(12)NOT NULL，COLOR CHAR(10),WEIGHT REAL，PRIMARY KEY(P#))

CREATE TABLE PROJECT

(J# CHAR(4)NOT NULL,JNAME CHAR(12)NOT NULL，DATE DATE，PRIMARY KEY(J#))

CREATE TABLE SUPLIER

(S# CHAR(4)NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20)，PRIMARY KEY(S#))

CREATE TABLE P_P

(J# CHAR(4),P# CHAR(4),TOTAL INTEGER，PRIMARY KEY(J#,P#)，FOREIGN KEY(J#)REFERENCE PROJECT(J#)，FOREIGN KEY(P#)REFERENCE PART(P#))

CREATE TABLE P_S

(P# CHAR(4),S# CHAR(4),QUANTITY INTEGER，PRIMARY KEY(P#,S#)，FOREIGN KEY(P#)REFERENCE PART(P#)，FOREIGN KEY(S#)REFERENCE SUPLIER(S#))

（2）试将PROGECT、P＿P、PART三个基本表的自然联接定义为一个视图VIEW1，PART、P＿S、SUPPLIER 三个基本表的自然联接定义为一个视图VIEW2。

CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL)

AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL

FROM PROJECT,PART,P_P

WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J

#CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY)

AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUA

NTITY

FROM PART,P_S,SUPPLIER

WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S#

（3）试在上述两个视图的基础上进行数据查询：

1）检索上海的供应商所供应的零件的编号和名字。

SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI'

2）检索项目J4所用零件的供应商编号和名字。

SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4')

3.9 对于教学数据库中基本表SC，已建立下列视图：

CREATE VIEW S＿GRADE（S＃，C＿NUM，AVG＿GRADE）

AS SELECT S＃，COUNT(C＃)，AVG（GRADE）

FROM SC

GROUP BY S＃

试判断下列查询和更新是否允许执行。若允许，写出转换到基本表SC上的相应操作。

（1）SELECT *

FROM S＿GRADE

允许

SELECT S#,COUNT(C#),AVG(GRADE)FROM SC GROUP BY S#

（2）SELECT S＃，C＿NUM

FROM S＿GRADE

WHERE AVG＿GRADE＞80

允许

SELECT S#,COUNT(C#)FROM SC WHERE AVG(GRADE)>80

（3）SELECT S＃，AVG＿GRADE

FROM S＿GRADE

WHERE C＿NUM＞(SELECT C＿NUM

FROM S＿GRADE

WHERE S＃＝‘S4’)

允许

SELECT S#,AVG(GRADE)

FROM SC AS X

WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#)FROM SC AS Y WHERE Y.S#='S4')

GROUP BY S#

（4）UPDATE S＿GRADE

SET C＿NUM＝C＿NUM＋1

WHERE S＃＝‘S4’

不允许

（5）DELETE FROM S＿GRADE

WHERE C＿NUM＞4

不允许

3.10 预处理方式对于嵌入式SQL的实现有什么重要意义？

预处理方式是先用预处理程序对源程序进行扫描，识别出SQL语句，并处理成宿主语言的函数调用形式；然后再用宿主语言的编译程序把源程序编译成目标程序。这样，不用扩充宿主语言的编译程序，就能处理SQL语句。

3.11 在宿主语言的程序中使用SQL语句有哪些规定？

在宿主语言的程序中使用SLQ语句有以下规定：

（1）在程序中要区分SQL语句与宿主语言语句

（2）允许嵌入的SQL语句引用宿主语言的程序变量（称为共享变量），但有两条规定：

1）引用时，这些变量前必须加“：”作为前缀标识，以示与数据库中变量有区别。

2）这些变量由宿主语言的程序定义，并用SQL的DECLARE语句说明。

（3）SQL的集合处理方式与宿主语言单记录处理方式之间要协调。需要采用

游标机制，把集合操作转换成单记录处理方式。

3.12 SQL的集合处理方式与宿主语言单记录处理方式之间如何协调？

由于SQL语句处理的是记录集合，而宿主语言语句一次只能处理一个记录，因此需要用游标(cousor)机制，把集合操作转换成单记录处理方式。

2.13 嵌入式SQL语句何时不必涉及到游标？何时必须涉及到游标？

(1)INSERT、DELETE、UPDATE语句，查询结果肯定是单元组时的SELECT语句，都可直接嵌入在主程序中使用，不必涉及到游标。

(2)当SELECT语句查询结果是多个元组时，此时宿主语言程序无法使用，一定要用游标机制把多个元组一次一个地传送给宿主语言处理。

4.1 名词解释

(1)函数依赖：FD(function dependency)，设有关系模式R(U)，X，Y是U的子集，r是R的任一具体关系，如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X，记为X→Y。X→Y为模式R的一个函数依赖。

(2)函数依赖的逻辑蕴涵：设F是关系模式R的一个函数依赖集，X，Y是R的属性子集，如果从F中的函数依赖能够推出X→Y，则称F逻辑蕴涵X→Y,记为F|=X→Y。

(3)部分函数依赖：即局部依赖，对于一个函数依赖W→A，如果存在XW(X包含于W)有X→A成立，那么称W→A是局部依赖，否则称W→A为完全依赖。

(4)完全函数依赖：见上。

(5)传递依赖：在关系模式中，如果Y→X，X→A，且XY（X不决定Y），AX（A不属于X）,那么称Y→A是传递依赖。

(6)函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合，称为F的闭包(closure),记为F+。

(7)1NF：第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的，则称该数据库存模式属于第一范式的数据库模式。第一范式的模式要求属性值不可再分裂成更小部分，即属性项不能是属性组合和组属性组成。

(8)2NF：第二范式。如果关系模式R为第一范式，并且R中每一个非主属性完全函数依赖于R的某个候选键，则称是第二范式模式；如果某个数据库模式中每个关系模式都是第二范式的，则称该数据库模式属于第二范式的数据库模式。(注：如果A是关系模式R的候选键的一个属性，则称A是R的主属性，否则称A是R的非主属性。)

(9)3NF：第三范式。如果关系模式R是第二范式，且每个非主属性都不传递依赖于R的候选键，则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式，则称为3NF的数据库模式。

(10)BCNF：BC范式。如果关系模式R是第一范式，且每个属性都不传递依赖于R的候选键，那么称R

是BCNF的模式。

(11)4NF：第四范式。设R是一个关系模式，D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时，X必是R的超键，那么称R是第四范式的模式。

(12)推理规则的正确性和完备性：正确性是指，如果X→Y是从推理规则推出的，那么X→Y在F+中。完备性是指，不能从F使用推理规则导出的函数依赖不在F+中。

(13)依赖集的覆盖和等价：关系模式R(U)上的两个函数依赖集F和G，如果满足F+=G+，则称F和G是等价的。如果F和G等价，则可称F覆盖G或G覆盖F。

(14)最小依赖集：如果函数集合F满足以下三个条件：(1)F中每个函数依赖的右部都是单属性；(2)F中的任一函数依赖X→A，其F-{X→A}与F是不等价的；(3)F中的任一函数依赖X→A，Z为X的子集，（F-{X→A}）∪{Z→A}与F 不等价。则称F为最小函数依赖集合，记为Fmin。

(15)无损联接：设R是一关系模式，分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是“无损联接分解”。

(16)保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变，即关系模式R到ρ={R1,R2,...,Rk}的分解，使函数依赖集F被F这些Ri上的投影蕴涵。

(17)多值依赖：设R(U)是属性集U上的一个关系模式，X，Y，Z是U的子集，并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y，Z的值，只要r是R的关系，r中存在元组(x,y1,z1)和(x,y2,z2)时，就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD)X→→Y在关系模式R中成立。

4.2 关系模式R有n个属性，在模式R上可能成立的函数依赖有多少个? 其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个?

(要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言，本题没多大意义）

所有属性相互依赖时，函数依赖最多。

平凡的函数依赖：对于函数依赖X→Y，如果YX，那么称X→Y是一个“平凡的函数依赖”。

4.3 建立关于系、学生、班级、社团等信息的一个关系数据库，一个系有若干个专业，每个专业每年只招一个班，每个班有若干个学生，一个系的学生住在同一宿舍区，每个学生可以参加若干个社团，每个社团有若干学生。

描述学生的属性有：学号、姓名、出生年月、系名、班级号、宿舍区。

描述班级的属性有：班级号、专业名、系名、人数、入校年份。

描述系的属性有：系名、系号、系办公地点、人数。

描述社团的属性有：社团名、成立年份、地点、人数、学生参加某社团的年份。

请给出关系模式，写出每个关系模式的最小函数依赖集，指出是否存在传递函数依赖，对于函数依赖左部是多属性的情况，讨论函数依赖是完全函数依赖还是部分函数依赖。指出各关系的候选键、外部键，有没有全键存在?

各关系模式如下：

学生(学号,姓名,出生年月,系名,班级号,宿舍区)

班级(班级号,专业名,系名,人数,入校年份)

系(系名,系号,系办公地点,人数)

社团(社团名,成立年份,地点,人数）

加入社团（社团名，学号，学生参加社团的年份）

学生(学号,姓名,出生年月,系名,班级号,宿舍区)

●“学生”关系的最小函数依赖集为：

Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名，系名→宿舍区} ●以上关系模式中存在传递函数依赖，如:学号→系名，系名→宿舍区

●候选键是学号,外部键是班级号,系名。

notice: 在关系模式中，如果Y→X，X→A，且XY（X不决定Y），A不属于X,那么称Y→A是传递依赖。

班级(班级号,专业名,系名,人数,入校年份)

●“班级”关系的最小函数依赖集为：

Fmin={(系名,专业名)→班级号,班级号→人数，班级号→入校年份，班级号→系名，班级号→专业名}

(假设没有相同的系，不同系中专业名可以相同)●以上关系模式中不存在传递函数依赖。

●“(系名,专业名)→班级号”是完全函数依赖。

●候选键是(系名,专业名),班级号，外部键是系名。

系(系名,系号,系办公地点,人数)

●“系”关系的最小函数依赖集为： Fmin={系号→系名,系名→系办公地点,系名→人数，系名→系号}

●以上关系模式中不存在传递函数依赖

●候选键是系名,系号

社团(社团名,成立年份,地点,人数）

●“社团”关系的最小函数依赖集为： Fmin={社团名→成立年份,社团名→地点,社团名→人数)

●以上关系模式中不存在传递函数依赖。

●候选键是社团名

加入社团（社团名，学号，学生参加社团的年份）

●“加入社团”关系的最小函数依赖集为： Fmin={（社团名，学号）→学生参加社团的年份)●“（社团名，学号）→学生参加社团的年份”是完全函数依赖。

●以上关系模式中不存在传递函数依赖。

●候选键是（社团名，学号）。

4.4 对函数依赖X→Y的定义加以扩充，X和Y可以为空属性集，用φ表示，那么X→φ，φ→Y，φ→φ的含义是什么?

根据函数依赖的定义，以上三个表达式的含义为：

(1)一个关系模式R(U)中，X，Y是U的子集，r是R的任一具体关系，如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。

(2)φ→Y表示Y函数依赖于空属性。由此可

知该关系中所有元组中Y属性的值均相同。

(3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。

4.5 已知关系模式R(ABC)，F={A→C，B→C},求F+。

可以直接通过自反律、增广律、传递律加以推广：

F+={φ→φ，A→φ，B→φ，C→φ，A→C，B→C，AB→φ，AB→A，AB→B，AB→C，AB→BC，AB→AB，AB→ABC，BC→φ，BC→C，BC→B，BC→BC，AC→φ，AC→C，AC→A，AC→AC，ABC→φ，ABC→A，ABC→B，ABC→C，ABC→BC，ABC→AB，ABC→ABC}

4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点：

(1)设R(ABC)，F1={A→B} 在R上成立，ρ1={AB,AC}。

首先，检查是否具有无损联接特点：

第1种解法--算法4.2:

(1)构造表

(2)根据A→B进行处理

结果第二行全是a行，因此分解是无损联接分解。

第2种解法:(定理4.8)设 R1=AB，R2=AC

R1∩R2=A

R2-R1=B

∵A→B,∴该分解是无损联接分解。

然后，检查分解是否保持函数依赖

πR1（F1）={A→B，以及按自反率推出的一些函数依赖}

πR2（F1）={按自反率推出的一些函数依赖}

F1被πR1（F1）所蕴涵，∴所以该分解保持函数依赖。

(2)设R(ABC)，F2={A→C，B→C}在R上成立，ρ2={AB,AC}

首先，检查是否具有无损联接特点：

第1种解法（略）

第2种解法:(定理4.8)设 R1=AB，R2=AC

R1∩R2=A

R2-R1=C

∵A→C,∴该分解是无损联接分解。

然后，检查分解是否保持函数依赖

πR1（F2）={按自反率推出的一些函数依赖}

πR2（F2）={A→C，以及按自反率推出的一些函数依赖} ∵F1中的B→C没有被蕴涵，所以该分解没有保持函数依赖。

(3)设R(ABC)，F3={A→B},在R上成立,ρ3={AB,BC}.首先，检查是否具有无损联接特点：

第1种解法：

(1)构造表

(2)根据A→B进行处理

没有一行全是a行。因此这个分解不具有无损联接特性。

第2种解法:(定理4.8)

设 R1=AB，R2=BC

R1∩R2=B

R2-R1=C，R1-R2=A

∵B→C,B→A不在F3中 ∴该分解不具有无损联接特性。

然后，检查分解是否保持函数依赖

πR1（F3）={A→B，以及按自反率推出的一些函数依赖}

πR2（F3）={按自反率推出的一些函数依赖}

F1被πR1（F3）所蕴涵，所以该分解保持函数依赖。

(4)设R(ABC)，F4={A→B，B→C}在R上成立，ρ4={AC,BC}

首先，检查是否具有无损联接特点：

第1种解法（略）

第2种解法:(定理4.8)

设 R1=AC，R2=BC

R1(AC)∩R2(BC)=C

R2-R1=B，R1-R2=A

∵C→B,C→A不在F4中 ∴该分解不具有无损联接特性。

然后，检查分解是否保持函数依赖

πR1（F2）={按自反率推出的一些函数依赖}

πR2（F2）={B→C，以及按自反率推出的一些函数依赖}

∵F1中的A→B没有被蕴涵，所以该分解没有保持函数依赖。

4.7 设R=ABCD,R上的函数依赖集F={A→B，B→C，A→D，D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗?(1)

πAB(F)={A→B，及按自反律所推导出的一些平凡函数依赖} πAC(F)={A→C，及按自反律所推导出的一些平凡函数依赖} πAD(F)={A→D，及按自反律所推导出的一些平凡函数依赖}(2)

(1)构造表

(2)根据A→B，B→C，A→D，D→C进行处理

每一行都是a，ρ相对于F是无损联接分解。

(3)πAB(F)∪πAC(F)∪πAD(F)={A→B，A→C，A→D}, 没有满足B→C，D→C函数依赖，因此ρ相对于F的这个分解不保持函数依赖。

4.8 设R=ABCD,R上的F={A→C，D→C，BD→A}, 试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。

根据算法4.2

(1)构造表

(2)根据A→C，D→C，BD→A进行处理

没有一行都是a，所以，ρ相对于F不是无损联接分解。

4.9 设R=ABCD,R上的F={A→B,B→C，D→B}，把R分解成BCNF模式集。

(1)若首先把R分解成{ACD,BD}，试求F在这两个模式上的投影。

(2)ACD和BD是BCNF吗?如果不是，请进一步分解。

(1)πACD(F)={A→C}

πBD(F)={D→B}

(2)因为根据BCNF的定义，要求关系模式是第一范式，且每个属性都不传递依赖于R的侯选键。BCD中（A，D）为候选键，可是（A,D)→A, A→C,所以它不是BCNF模式。

它可进一步分解为：{AC,DC},此时AC，DC均为BCNF模式。

BD是BCNF，因为R2(BD)是第一范式，且每个属性都不传递依赖于D(候选键)，所以它是BCNF模式。

4.10 设R=ABCD,ρ={AB,BC,CD}。F1={A→B，B→C}；F2={B→C，C→D}；

(1)如果F1是R上的函数依赖集，此时ρ是无损联接分解吗?若不是，试举出反例。

(2)如果F2是R上的函数依赖集呢?

(1)不是无损联接。可由算法4.2判断或由定理4.8判断。

根据算法4.2

(1)构造表

(2)根据A→B,B→C进行处理

结果没有出现一行全a的情况，所以它不是无损联接。举例如下：

设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)} 则有：r1=πAB(r)={(a1b1),(a2b2)}

r2=πBC(r)={(b1c1),(b2c1)}

r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={(a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a，所以ρ不是无损联接。

(2)如果F2是R上的函数依赖，则可以判断，ρ是无损联接。判断过程同上。

4.11 设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、选修课程的编号，成绩、任课教师地址等意义。如果规定，每个学生每学一门课只有一个成绩；每门课只有一个教师任教；每个教师只有一个地址(此处不允许教师同名同姓)。

(1)试写出关系模式R基本的函数依赖和候选键。

(2)试把R分解成2NF模式集并说明理由。

(3)试把R分解成3NF模式集，并说明理由。

(1)F={(S#,C#)→GRADE，C#→TNAME，TNAME→TADDR} 侯选键是（S#,C#）。

(2)在模式R中，TNAME不完全依赖于键(S#，C#),因此需进行分解，可分解为下列两个关系。

SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后，SC中，GRADE完全依赖于侯选键(S#,C#),在C中，主属性是C#，TNAME、TADDR均完全依赖于C#。因此，该分解符合2NF模式。

(3)3NF：若每个关系模式是2NF，则每个非主属性都不传递于R的候选键。

按上述已分好的两个模式，SC中已满足“每个非主属性都不传递于R的候选键”，已是3NF,而在C中，C#→TNAME，TNAME→TADDR，TADDR传递依赖于C#，因此还需分成两个模式：CT(C#,TNAME), T(TNAME,TADD)。

分解后，总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。

该分解符合3NF模式。

4.12 图4.6表示一个公司各部门的层次结构，对每个部门，数据库中包含部门号(唯一的)D#，预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。对每一个部门，还存有部门的全部职工，生产科研项目以及办公室的信息。

职工信息包括：职工号，他所参加的生产科研项目号(J#)，他所在办公室的电话号(PHONE#)。

生产科研项目包含：项目号(唯一的)，预算费。

办公室信息包含：办公室号(唯一的)，面积。

对每个职工，数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。

请给出你认为合理的数据依赖，把这个层次结构转换成一组规范化的关系。

提示：此题可分步完成，先转换成一组1NF的关系，然后逐步转换成2NF，3NF，...。

先得到一个泛关系的模式如下:

D={D#,Manager_E#,Budget，E#,J#,Phone#,Business,Sa_History,Office#,Area} D#:部门号, Manager_E#:部门领导人员的职工号, E#:职工号, J#:生产科研项目号, Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积

根据所给信息，给出下列数据依赖：

F={D#→Manager_E#，E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#，Office#→Area,Office→D#,#Phone#→Office#}（假设一个部门可能有多个办公室，有多个项目，一个办公室只属于一个部门，有多部电话，一个员工只参加一个项目，一个项目可能属于多个部门）

只要保证每个属性值不可分割，以上范式即为1NF。候选键为（E#,Business，Phone#)

转换成2NF关系(消除局部依赖）：

Em_Dep(E#,D#,Manager_E#,Office#,Area,J#，Budget)

对应 F={D#→Manager_E#，E#→Office#,J#→Budget,E#→J#，Office#→Area，Office→D#}

History(E#,Business,History)

对应 F={(E#,Business)→Sa_History} Phone(Phone#,Office#)

对应 F={Phone#→Office#}

转换成3NF关系(消除非主属性对侯选键的传递依赖）：

Department(D#,Manager_E#)Office(Office#,Area，D#)Emproee(E#,J#,Office#)

History(E#,Business,History)Phone(Phone#,Office#)Project(J#,Budget)

注意：由于对题意理解的不同，可能答案不唯一。

4.13 设关系模式R(ABC)上有一个多值依赖A→→B。如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组?

从多值依赖的定义可以得出，至少应存在下列元组：

(ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2)

5.1 名词解释

（1）数据库设计：数据库设计是指对于一个给定的应用环境，提供一个确定最优数据模型与处理模式的逻辑设计，以及一个确定数据库存储结构与存取方法的物理设计，建立起既能反映现实世界信息和信息联系，满足用户数据要求和加工要求，又能被某个数据库管理系统所接受，同时能实现系统目标，并有效存取数据的数据库。

（2）数据库工程：指数据库应用系统的开发，它是一项软件工程,但有数据库应用自身的特点。（3）评审：在数据库设计过程中，评审的目的是为了确认某一阶段的任务是否全部完成，避免重大的疏漏或错误，并在生存期的早期阶段给予纠正，以减少系统研制的成本。

（4）数据字典：是对系统中数据的详尽描述，它提供对数据库数据描述的集中管理。它的处理功能是存储和检索元数据，并且为数据库管理员提供有关的报告。对数据库设计来说，数据字典是进行详细的数据收集和数据分析所获得的主要成果。数据字典主要包括四个部分：数据项、数据结构、数据流、数据存储。

5.2 数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何?

分成七个阶段：规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。

数据库结构的设计在生存期中的地位很重要，数据库结构的设计包括逻辑设计、物理设计，逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构，而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。

5.3 什么是数据库设计?数据库设计过程的输入和输出有哪些内容?

数据库设计是指对于一个给定的应用环境，提供一个确定最优数据模型与处理模式的逻辑设计，以及一个确定数据库存储结构与存取方法的物理设计，建立起既能反映现实世界信息和信息联系，满足用户数据要求和加工要求，又能被某个数据库管理系统所接受，同时能实现系统目标，并有效存取数据的数据库。

数据库设计过程的输入包括四部分内容：1)总体信息需求；2)处理需求；(3)DBMS的特征；(4)硬件和OS(操作系统)特征。

数据库设计过程的输出包括两部分：

(1)完整的数据库结构，其中包括逻辑结构和物理结构；

(2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。

5.4 基于数据库系统生存期的数据库设计分成哪几个阶段?

分为5个阶段:简记为(规需概逻物)：规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。

5.5 什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容? 一个好的数据库设计方法应该能在合理的期限内，以合理的工作量产生一个有实用价值的数据库结构。

一种实用的数据库设计方法应包括以下内容：设计过程、设计技术、评价准则、信息需求、描述机制。

5.6 数据库设计的规划阶段应做哪些事情?

数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析，确定数据库系统在组织中和信息系统中的地位，以及各个数据库之间的联系。

5.7 数据库设计的需求分析阶段是如何实现的?目标是什么?

数据库设计的需求分析通过三步来完成：即需求信息的收集、分析整理和评审。

其目的在于对系统的应用情况作全面详细的调查，确定企业组织的目标，收集支持系统总的设计目标的基础数据和对这些数据的要求，确定用户的需求，并把这些要求写成用户和数据设计者都能够接受的文档。

5.8 评审在数据库设计中有什么重要作用?为什么允许设计过程中有多次的回溯与反复?

评审的作用在于确认某一阶段的任务是否全部完成，通过评审可以及早发现系统设计中的错误，并在生存期的早期阶段给予纠正，以减少系统研制的成本。

如果在数据库已经实现时再发现设计中的错误，那么代价比较大。因此应该允许设计过程的回溯与反复。设计过程需要根据评审意见修改所提交的阶段设计成果，有时修改甚至要回溯到前面的某一阶段，进行部分乃至全部重新设计。

5.9 数据字典的内容和作用是什么?

数据字典的内容一般包括：数据项、数据结构、数据流、数据存储和加工过程。

其作用是对系统中数据做出详尽的描述，提供对数据库数据的集中管理。

5.10 对概念模型有些什么要求? 对概念模型一般有以下要求：

（1）概念模型是对现实世界的抽象和概括，它应真实、充分地反映现实世界中事物和事物之间的联系，具有丰富的语义表达能力，能表达用户的各种需求，包括描述现实世界中各种对象及其复杂联系、用户对数据对象的处理要求和手段。

（2）概念模型应简洁、明晰，独立于机器、容易理解、方便数据库设计人员与应用人员交换意见，使用户能积极参与数据库的设计工作。

（3）概念模型应易于变动。当应用环境和应用要求改变时，容易对概念模型修改和补充。

（4）概念模型应很容易向关系、层次或网状等各种数据模型转换，易于从概念模式导出也DBMS有关的逻辑模式。

5.11 概念设计的具体步骤是什么? 概念设计的主要步骤为：

（1）进行数据抽象、设计局部概念模式；

（2）将局部概念模式综合成全局概念模式；

（3）评审。

(具体解释参见教材p131)

5.12 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用?

数据抽象是对人、物、事或概念的人为处理，它抽取人们关心的共同特性，忽略非本质的细节，并把这些特性用各种概念精确地加以描述，这些概念组成了某种模型。

数据抽象有两种形式：

（1）系统状态的抽象，即抽象对象；

（2）系统转换的抽象，即抽象运算。

数据抽象是概念设计中非常重要的一步。通过数据抽象，可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。

5.13 什么是ER图?构成ER图的基本要素是什么? ER图是用来表示数据库概念设计ER模型的工具，它提供了表示实体、属性和联系的方法。

构成ER图的基本要素是实体、属性和联系。

5.14 试述采用ER方法的数据库概念设计的过程.利用ER方法进行数据库的概念设计，可分成三步进行：首先设计局部ER模式，然后把各局部ER模式综合成一个全局ER模式，最后对全局ER模式进行优化，得到最终的ER模式，即概念模式。

5.15 逻辑设计的目的是什么?试述逻辑设计过程的输入和输出

环境。

逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构（包括数据库模式和外模式）。

逻辑设计过程中的输入信息有：

(1)独立于DBMS的概念模式，即概念设计阶段产生的所有局部和全局概念模式；

(2)处理需求,即需求分析阶段产生的业务活动分析结果；

(3)约束条件，即完整性、一致性、安全性要求及响应时间要求等；

(4)DBMS特性，即特定的DBMS特性，即特定的DBMS所支持的模式、子模式和程序语法的形式规则。

逻辑设计过程输出的信息有：

(1)DBMS可处理的模式；

(2)子模式；

(3)应用程序设计指南；

(4)物理设计指南。

5.16 试述逻辑设计阶段的主要内容。

逻辑设计主要是把概念模式转换成DBMS能处理的模式。转换过程中要对模式进行评价和性能测试，以便获得较好的模式设计。

逻辑设计的主要步骤包括：

(1)初始模式的形成(2)子模式设计

(3)应用程序设计梗概

(4)模式评价

(5)修正模式。

5.17 规范化理论对数据库设计有什么指导意义?

在概念设计阶段，已经把关系规范化的某些思想用作构造实体类型和联系类型的标准，在逻辑设计阶段，仍然要使用关系规范化的理论来设计模式和评价模式。规范化的目的是减少乃至消除关系模式中存在的各种异常，改善完整性，一致性和存储效率。

5.18 什么是数据库结构的物理设计?试述其具体步骤。

数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程，所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。

物理设计的步骤为：

(1)设计存储记录结构，包括记录的组成、数据项的类型和长度，以及逻辑记录到存储记录的映射；

(2)确定数据存储安排；

(3)设计访问方法，为存储在物理设备上的数据提供存储和检索的能力；

(4)进行完整性和安全性的分析、设计；

(5)程序设计。

5.19 数据实现阶段主要做哪几件事情? 数据库实现阶段的主要工作有以下几点：

（1）建立实际数据库结构

（2）试运行

（3）装入数据

(具体解释参见教材p150)

5.20 什么是数据的再组织设计?试述其重要性。

对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。

数据再组织，通常是由于环境，需求的变化或性能原因而进行的，如信息定义的改变，增加新的数据类型，对原有的数据提出了新的使用要求，改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。

5.21 数据系

统投入运行后，有哪些维护工作?

数据系统投入运行后，主要维护工作有：

(1)维护数据库的安全性与完整性控制及系统的转储和恢复；

(2)性能的监督、分析与改进；

(3)增加新功能；

(4)发现错误，修改错误 6.1 名词解释

(1)事务：事务是指一个操作序列，这些操作要么什么都做，要么都不做，是一个不可分割的工作单位，是数据库环境中的逻辑工作单位，相当于操作系统环境下的“进程”概念。

(2)封锁：封锁就是事务可以向系统发出请求，对某个数据对象加锁，此事务对这个数据对象有一定控制，而其他事务则不能更新数据直到事务释放它的锁为止。

(3)X封锁：如果事务T对数据R实现X封锁，那么其他的事务要等T解除X封锁以后，才能对这个数据进行封锁。只有获准X封锁的事务，才能对被封锁的数据进行修改。

(4)PX协议：X封锁的规则称为PX协议，其内容为：任何企图更新记录R的事务必须先执行LOCK X(R)操作，以获得对该记录进行寻址的能力，并对它取得X封锁。如果未获得X封锁，那么这个事务进入等待状态，一直到获准X封锁，事务继续进行。

(5)PXC协议：它由PX协议及一条规则“X封锁必须保留到事务终点(COMMIT或ROLLBACK)”组成。(6)死锁：有两个或以上的事务处于等待状态，每个事务都在等待另一个事务解除封锁，它才能继续执行下去，结果任何一个事务都无法执行，这种现象就是死锁。

(7)串行调度：多个事务依次执行，称为串行调度。

(8)并发调度：利用分时的方法，同时处理多个事务，称为事务的并发调度。

(9)可串行化调度：如果某事务集的一个并发调度的结果与某个串行调度等价，则称此并发调度是是可串行化调度。

(10)不可串行化调度：某事务集的一个并发调度结果，如果与任一串行调度均不等价，则该并发调度是不可串行化调度。

(11)S封锁：共享型封锁。果事务T对某数据R加上S封锁，那么其它事务对数据R的X封锁便不能成功，而对数据R的S封锁请求可以成功。这就保证了其他事务可以读取R但不能修改R，直到事务T释放S封锁。

(12)PS协议：任何要更新记录R的事务必须先执行LOCK S(R)操作，以获得对该记录寻址的能力并对它取得S封锁。如果未获准S封锁，那么这个事务进入等待状态，一直到获准S封锁，事务才继续进行下去。当事务获准对记录R的S封锁后，在记录R修改前必须把S封锁升级为X封锁。

(13)PSC协议：由PS协议和“将S封锁保持到事务终点”组成。任何更新记录R的事务必须先执行LOCK S(R)操作，以获得对该记录寻址的能力并对它取得S封锁。如果未获准S封锁，那么这个事务进入等待状态，一直到

获准S封锁，事务才继续进行下去。并将S封锁保持到事务终点。

(14)两段封锁协议：（1）在对任何数据进行读写操作之前，事务首先要获得对该数据的封锁；（2）在释放一个封锁之后，事务不再获得任何其他封锁。

6.2 试叙事务的四个性质，并解释每一个性质对DBS有什么益处? 事务的四个性质是：原子性、一致性、隔离性和持久性。

(1)原子性（具体含义见教材）：事务中所有操作应视为整体，不可分割。

(2)一致性（具体含义见教材）：一个事务独立执行的结果将保证数据库的一致性，即数据不会因事务的执行而遭受破坏。

(3)隔离性（具体含义见教材）：隔离性要求在并发事务被执行时，系统应保证与这些事务先后单独执行时结果一样，使事务如同在单用户环境下执行一样。

(4)持久性（具体含义见教材）：要求事务对数据库的所有更新应永久地反映在数据库中。

6.3 事务的COMMIT操作和ROLLBACK操作各做些什么事情? COMMIT操作表示事务成功地结束(提交)，此时告诉系统，数据库要进入一个新的正确状态，该事务对数据库的所有更新都已交付实施。

ROLLBACK操作表示事务不成功地结束，此时告诉系统，已发生错误，数据库可能处在不正确的状态，该事务对数据库的更新必须被撤销，数据库应恢复该事务到初始状态。

6.4 UNDO操作和REDO操作各做些什么事情? UNDO操作是反向扫描“日志”文件，撤销对数据库的更新操作，使数据库恢复到更新前的状态； REDO操作正向扫描日志文件，重新做一次更新，使数据库恢复到更新后的状态。

6.5 DBS中有哪些类型的故障?哪些故障破坏了数据库? 哪些故障未破坏数据库，但其中某些数据变得不正确? 数据库系统故障有事务故障、系统故障、介质故障。

其中介质故障破坏数据库，事务故障、系统故障未破坏数据库但使其中某些数据变得不正确。

6.6 什么是“运行记录优先原则”？其作用是什么？

在数据库系统中，写一个修改到数据库中和写一个表示这个修改的登记记录到日志文件中是两个不同的操作，在这两个操作之间有可能发生故障。这时，如果先写了数据库修改，而在运行记录中没有登记这个修改，则以后就无法恢复这个修改，那么以后也就无法撤消这个修改。为了安全起见，采用“运行记录优先原则”。它包括两点：

（1）至少要等相应运行记录已经写入“日志”文件后，才能允许事务往数据库中写记录。

（2）直至事务的所有运行记录都已写入运行“日志”文件后，才能允许事务完成“END TRANSACTION”处理。

采用“运行记录优先原则”，可以保证所做的操作都记录在日志中，便于故障处理，维护数据库的一致性。

6.7 什么是数据库的恢复？恢复的基本原则是什么，恢复如何实现？

数据库的恢复是指当数据库系统发生故障时，通过一些技术，使数据库从被破坏、不正确的状态恢复到最近一个正确的状态。

恢复的基本原则就是冗余，即数据的重复存储。恢复的常用方法有：（1）定期对整个数据库进行复制或转储；（2）建立日志文件；（3）恢复。用REDO或UNDO处理。

6.8 数据库的并发操作会带来哪些问题？如何解决？

数据库的并发操作会带来三类问题：

（1）丢失更新问题；（具体内容见教材P158）

（2）不一致分析问题

（3）“脏数据”的读出。

解决的办法通常是采用“封锁”技术。

6.9 有哪些“丢失更新”问题？如何处理？

（1）并发调度引起的“丢失更新”问题。在并发调度中，如两个事务同时对某数据库进行更新操作，在操作中丢失了其中某个事务对某数据的更新操作。处理的办法就是对并发操作采用X封锁技术。

（2）由恢复引起的更新丢失现象。采用X封锁以后，先执行事务T1，再执行事务T2，此时，如果T2做ROLLBACK操作，就把事务T2的更新丢失了。处理方式是采用PXC协议，不允许事务T1执行解锁操作直到事务执行到终点（COMMIT或ROLLBACK）。

6.10 为什么DML只提供解除S封锁的操作，而不提供解除X封锁的操作？

为了防止由恢复引起的更新丢失现象，PXC协议规定：X封锁必须保留到事务终点（COMMIT或ROLLBACK）。因此在DML中，COMMIT或ROLLBACK的语义中包含了X封锁的解除，不用提供解除X封锁的操作。

而对于S封锁而言，它是一种共享型的封锁（读取但不能修改），其数据不可能是未提交的修改，封锁不必等提交后才能解除，因此可以由事务用UNLOCK解除各自对数据的封锁。

6.11 为什么有些封锁需保留到事务终点，而有些封锁可随时解除？因为有的封锁需要更新数据，保留到终点才能确认是否提交或回退以避免脏数据的读出，所以这些封锁需要保留到事务终点。

而有些事务全部或部分操作只是读取数据，不涉及更新数据操作，因此这一部分操作的封锁可以随时解除。

6.12 死锁的发生是坏事还是好事?试说明理由。如何解除死锁状态? 死锁的发生即是坏事又是好事。

（1）使并发事务不能继续执行下去，造成时间开销却不产生结果。

（2）在某些时候我们要利用它来解决更新操作导致的数据库不一致状态。

解除死锁状态：抽出某个事务作为牺牲品，把它撤消，做回退操作，解除它的所有封锁，并恢复到初始状态。

6.13 试叙述“串行调度”与“可串行化调度”的区别。

串行调

度是多个事务按照一定的次序依次执行；在某一时刻只有一个事务在执行。

而可串行化调度是并发调度中的一个概念。在并发调度中，某一时刻有多个事务同时被处理。如果某事务集的一个并发调度的结果与某个串行调度等价，则称此并发调度是是可串行化调度。

（以上几题具体可参照书上p20-21)

6.14 什么是数据库的完整性? DBMS的完整性子系统的功能是什么?

数据库的完整性是指数据的正确性和相容性。DBMS完整性子系统的功能是：

(1)监督事务的执行，并测试是否违反完整性规则；

(2)如有违反，则采取恰当的操作，如拒绝、报告违反情况，改正错误等方法进行处理。

6.15 完整性规则由哪几个部分组成?关系数据库的完整性规则有哪几类? 完整性规则由三部分组成：

触发条件：即什么时候使用规则进行检查；

约束条件：即要检查什么样的错误；

ELSE子句：即查出错误后该如何处理。

完整性规则有以下三类：

域完整性规则，用于定义属性的取值范围；

域联系的规则，定义一个或多个关系中，属性值间的联系、影响和约束。

关系完整性规则，定义更新操作对数据库中值的影响和限制。

6.16 试详述SQL中的完整性约束机制？

SQL中的完整性约束规则有主键约束、外键约束、属性值约束和全局约束等多种形式。

△主键约束。它是数据中最重要的一种约束。在关系中主键值不允许空，也不允许出现重复，体现了关系要满足实体完整性规则。主键可用主键子句或主键短语进行定义。

△ 外键约束。根据参照完整性规则，依赖关系中外键或者为空值，或者是基本关系（参照关系）中的该键的某个值。外键用外键关系子句定义，并考虑删除基本关系元组或修改基本关系的主键值的影响，依赖关系可按需要采用RESTRICT、SET NULL、CASCADE方式。

△属性值约束。当要求某个属性的值不允许空值时，那么可以在属性定义后加上关键字：NOT NULL，这是非空值约束。还可以用CHECK子句对一个属性值加以限制以及使用域约束子句CREAT DOMAIN 定义新域并加以属性值检查。

△全局约束。在关系定义时，可以说明一些比较复杂的完整性约束，这些约束涉及到多个属性间的联系或不同关系间的联系，称为全局约束。主要有基于元组的检查子句和断言。前者是对单个关系的元组值加以约束，后者则可对多个关系或聚合操作有关的完整性约束进行定义。

6.17 参照完整性规则在SQL可以用哪几种方式实现?删除基本关系的元组时，依赖关系可以采取的做法有哪三种?修改基本关系的主键值时，依赖关系可以采取的做法有哪三种? 参照完整性规

则要求“不引用不存在的实体”，参照完整性规则在SQL可用以下几种方式实现：

（1）在SQL中采用外键子句定义外键，并考虑删除基本关系元组或修改基本关系的主键值，对依赖关系产生的影响；

（2）在属性值上进行约束如基于属性的检查；

（3）全局约束中的基于元组的检查子句等。

删除基本关系元组或修改基本关系的主键值时，依赖关系可以采用的做法有：

△RESTRICT方式：只有当依赖关系中没有一个外键值与基本关系中要删除/修改的主键值相对应时，系统才能执行删除/修改操作，否则拒绝删除或修改。

△SET NULL方式：删除基本元组时，将依赖关系中所有与基本关系中被删除主键值相对应的外键值置为空值。修改基本关系的主键值时，将依赖关系中所有与基本关系中被修改主键值相对应的外键值置为空值。

△CASCADE方式：若删除则将依赖关系中所有外键值与基本关系中要删除的主键值相对应的元组一并删除，若修改则将依赖关系中所有与基本关系中要修改的主键值相对应的外键值一并修改为新值。

6.18 试对SQL2中的基于属性的检查约束、基于元组的检查约束和断言三种完整性约束进行比较：各说明什么对象?何时激活?能保证数据库的一致性吗?

约束形式

说明对象

激活条件

是否保证一致性

基于属性的检查

只对一个属性值加以约束

插入或修改属性值时

不一定

基于元组的检查

对单个关系的元组值加以约束

在插入或修改元组时不一定

断言

多个关系或聚合操作

任何变动

保证

6.19 设教学数据库的模式如下：

S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE)

C(C#,CNAME,TEACHER)

试用多种方式定义下列完整性约束：

(1)在关系S中插入学生年龄值应在16～25岁之间

(2)在关系SC中插入元组时，其S#值和C#值必须分别在S和C中出现。

(3)在关系SC中修改GRADE值时，必须仍在0～100之间。

(4)在删除关系C中一个元组时，首先要把关系SC中具有同样C#的元组全部删去。

(5)在关系S中把某个S#值修改为新值时，必须同时把关系SC中那些同样的S#值也修改为新值。

(1)定义S时采用检查子句：

CREAT TABLE S（S# CHAR(4)，SNAME char(10)NOT NULL ，AGE SMALLINT ，PRIMARY key(S#)，CHECK(AGE>=16 and AGE<=25))

(2)采用外键子句约束

CREAT TABLE SC（S# CHAR(4)，C# CHAR(4)，GRADE SMALLINT，FOREIGN key(S#)REFERENCE S(S#)，FOREIGN key(C#)REFERENCE C(C#))

(3)采用元组检查

CREAT TABLE SC（S# CHAR(4)，C# CHAR(4)，GRADE SMALLINT，FOREIGN key(S#)REFERENCE S(S#)，FOREIGN key(C#)RE

FERENCE C(C#)，CHECK(GRADE>=0 and AGE<=100))

(4)采用外键约束

CREAT TABLE SC（S# CHAR(4)，C# CHAR(4)，GRADE SMALLINT，FOREIGN key(S#)REFERENCE S(S#)，FOREIGN key(C#)REFERENCE C(C#))

若改为：在删除关系C中一个元组时，同时把关系SC中具有同样C#的元组全部删去，则为：

......FOREIGN key(C#)REFERENCE C(C#)ON DELETE CASCADE

......(5)采用外键约束

CREAT TABLE SC（S# CHAR(4)，C# CHAR(4)，GRADE SMALLINT，FOREIGN key(S#)REFERENCE S(S#)ON UPDATE CASCADE ，FOREIGN key(C#)REFERENCE C(C#))

6.20 在教学数据库的关系S、SC、C中，试用SQL2的断言机制定义下列两个完整性约束：(1)学生必须在选修Maths课后，才能选修其他课程。(2)每个男学生最多选修20门课程

(1)

CREAT ASSERTION ASSE1 CHECK

(NOT EXISTS

(SELECT S FROM SC

WHERE C# IN

(SELECT C#

FROM C

WHERE CNAME<>'MATHS')

AND S# NOT IN

(SELECT S# FROM SC

WHERE C# IN

(SELECT C#

FROM C

WHERE CNAME='MATHS')));(2)

CREAT ASSERTION ASSE2 CHECK

(ALL(SELECT COUNT(SC.C#)

FROM S,SC

WHERE S.S#=SC.S AND SEX='M'

GROUP BY S#)<=20);

6.21 什么是数据库的安全性?有哪些安全措施?

数据库的安全性是指保护数据库防止不合法的使用，以免数据的泄漏、非法更改和破坏。

可以从以下方面设置数据库的安全措施：环境级、职员级、OS级、网络级和数据库系统级。

(具体可参见教材P173)

6.22 对银行的数据库系统应采取哪些安全措施？分别属于哪一级？

答案基本同上一题。

6.23 什么是“权限”?用户访问数据库可以有哪些权限?对数据库模式有哪些修改权限? 用户使用数据库的方式称为权限。

用户访问数库的权限有：读权限、插入权限、修改权限、删除权限。

用户修改数据库模式的权限有索引权限、资源权限、修改权限、撤销权限。

6.24 试解释权限的转授与回收。

在数据库系统中,为了保证数据的安全性，用户对数据的操作必须首先从DBA处获得权限，才能进行对数据的操作。同时数据库系统也允许用户将获得的权限转授给其他用户，也允许把已授给其他用户的权限再回收上来。但应保证转授出去的权限能收得回来。

6.25 SQL 语言中的视图机制有哪些优点?

视图机制使系统具有三个优点：数据安全性、数据独立性和操作简便性。

6.26 SQL2中用户权限有哪几类?并作必要的解释。

SQL2中定义了六类用户权限，分别是：

(1)SELECT :允许用户对关系或视图执行SELECT操作。

(2)INSERT ：允许用户对关系或视图执行INSERT操作，如果还说明了一个属性表，那么表示只能插入这些属性的值，关系中其他属性值将置为缺省值或为空值。

(3)DELETE：允许用户对关系或视图执行DELETE操作。

(4)UPDATE：允许用户对关系或视图执行UPDATE操作，如果还说明了一个属性表，那么表示只能修改这些属性的值，否则表示可以修改关系中任一属性值。

(5)REFERENCES：允许用户定义新关系时，引用其他关系的主键作为外键。

(6)USAGE：允许用户使用定义的域。

6.27 数据加密法有些什么优点?如何实现?

数据加密可以更好地保证数据的完全性。加密采用一定的加密算法给把源文变为密文来实现。

常用的加密算法有“替换方法”和明键加密法。

7.1 名词解释

（1）集中式DBS：是指数据库中的数据集中存储在一台计算机上，数据的处理集中在一台计算机上完成。

（2）分布式DBS：是指数据存放在计算机网络的不同场地的计算机中，每一场地都有自治处理能力并完成局部应用；而每一场地也参与(至少一种)全局应用程序的执行，全局应用程序可通过网络通信访问系统中的多个场地的数据。

（3）分布式DB：分布式数据库，是指计算机网络环境中各场地上数据库的逻辑集合。

（4）分布式DBMS：分布式数据库管理系统。是指分布式数据库系统中的一组软件，它负责管理分布环境下逻辑集成数据的存取、一致性、有效性和完备性。同时，由于数据的分布性，在管理机制还必须具有计算机网络通信协议上的分布管理特性。

（5）局部自治性：是指有独立处理能力并能完成的局部应用。

（6）数据分配(数据分布)：是指数据计算机网络各场地上的分配策略。

（7）数据复制：是指数据在每个场地重复存储。

（8）数据分片：是指分布式数据库中的数据可以被分割和复制在网络场地的各个物理数据库中。一般数据存放的单位不是关系而是片段，一个片段是关系的一部分。数据分片是通过关系代数的基本运算实现的。

（9）水平分片：是指按一定条件把全局关系的所有元组划分成若干不相交的子集，每个

子集为关系的一个片段。

（10）垂直分片：把一个全局关系的属性集分成若干子集，并在这些子集上做投影运算，每个投影为垂直分片。

（11）分布透明性：指用户不必关系数据的逻辑分片，不必关系数据物理位置的细节，也不必关心各个场地上的数据库的数据模型。

（12）分片透明性：分片透明性是最高层次的分布透明性，是指用户或应用程序只对全局关系进行操作而不必考虑数据的分片。

（13）位置透明性：位置透明性位于分片视图与分配视图之间。是指用户或应用程序应当了解分片情况，但不必了解片段的存储场地。

（14）局部数据模型透明性：这个透明性位于分配视图与局部概念视图之间，指用户或应用程序要了解分片及各片段存储的场地，但不必了解局部场地上使用的是何种数据模型。

（15）复制透明性：即用户不必关心数据库在网络中各个结点的数据库复制情况，更新操作引起的波及由系统去处理。

7.2 试叙数据从集中存储、分散存储到分布存储的演变过程。

早期的数据库系统都是属于集中式数据库系统，数据集中存储在一台计算机上。该方式有一定优点，比如，价格合理，易于管理，数据冗余少等等。但是，随着数据库应用的不断发展，数据库规模不断扩大，如采用集中存储的数据库，其系统的设计和操作都比较复杂，系统显得不灵活而且安全性也较差。因此采用了数据分散存储的办法，将数据库分成多个，建立在多台计算机上，此时的各个数据库的管理和应用程序均是分开并独立的。它们之间不存在数据通信联系。随着计算机网络通信的发展，有可能把分散在各处的数据库系统通过网络通信连接起来，这样形成的系统称为分布式的数据库系统，这时的数据库虽然分别存在各地的计算机上，但它们之间通过分布式数据管理系统可以进行联系。

7.3 与集中式DBS、分散式DBS相比，分布式DBS有哪些特点?

与集中式DBS相比，分布式DBS中数据库的存储是分布性的，即数据不是存储在同一场地，而是分布存储在多个场地。与分散式DBS相比，分布式DBS中数据库具有“逻辑整体性”，即表面上看，分布式数据的数据库分散在各个场地，但这些数据在逻辑上却是一个整

体，如同一个集中式数据库。

7.4 试解释下列术语：同构同质型DDBS，同构异质型DDBS，异构DDBS。

（1）同构同质型DDBS：是指各个场地都采用同一类型的数据模型，并且是同一型号数据库管理系统。

（2）同构异质型DDBS：是指各个场地都采用同一类型的数据模型，但是数据库管理系统是不同型号的。

（3）异构型DDBS：是指各个场地的数据模型是不同的类型。

7.5 分布式数据库系统有哪些优点和缺点? 分布式数据库系统的优点：

(1)具有灵活的体系结构

(2)适应分布式的管理和控制机构

(3)经济性能优越

(4)系统的可靠性高、可用性好

(5)局部应用的响应速度快

(6)可扩展性好，易于集成现有系统

分布式数据库系统的缺点：

(1)系统开销大，主要花在通信部分；

(2)复杂的存取结构，原来在集中式系统中有效存取数据的技术，在分布式系统中都不再适用；

(3)数据的安全生和保密性较难处理。

7.6 分布式数据库中，“数据分配”有哪些策略?“数据分片”有哪些策略? 数据分片的准则是什么?

数据分配是指数据在计算机网络各场地上的分配策略。包括：

（1）集中式：所有数据均安排在同一个场地上。

（2）分割式：所有数据只有一份，分别被安置在若干个场地。

（3）全复制式：数据在每个场地重复存储。

（4）混合式：数据库分成若干可相交的子集，每一子集安置在一个或多个场地上，但是每一场地未必保存全部数据。

数据分片的方式有以下三种：

（1）水平分片：按一定的条件把全局关系的所有元组划分成若干不相交的子集，每个子集为关系的一个片段。

（2）垂直分片：把一个全局关系的属性集分成若干子集，并在这些子集上做投影运算，每个投影为垂直分片。

（3）混合型分片：将水平分片与垂直分片方式综合使用则为混合型分片。

数据分片应遵循的准则为：

(1)完备性条件：必须把全局关系的所有数据映射到各个片段中，绝不允许发生属于全局关系的某个数据不属于任何一个片段。

(2)重构条件：划分所采用的方法必须确保能够由各个片段重建全局关系。

(3)不相交条件：要求一个全局关系被划分后得到的各个数据片段互相不重

叠。

7.7 试叙述分布式DBS的体系结构，它有什么特征?

分布式DBS的体系结构分为四级：全局外模式、全局概念模式、分片模式和分配模式。

(1)全局外模式：它们是全局应用的用户视图，是全局概念模式的子集。

(2)全局概念模式：全局概念模式定义了分布式数据库中所有数据的逻辑结构。

(3)分片模式：分片模式定义片段以及定义全局关系与片段之间的映象。这种映象是一对多的，即每个片段来自一个全局关系，而一个全局关系可分成多个片段。

(4)分配模式：片段是全局关系的逻辑部分，一个片段在物理上可以分配到网络的不同场地上。分配模式根据数据分配策略的选择定义片段的存放场地。

分布式DBS的分层体系结构有三个特征：

(1)数据分片和数据分配概念的分离，形成了“数据分布独立性”概念。

(2)数据冗余的显式控制。

(3)局部DBMS的独立性。

7.8 试叙述分布式DBMS的功能及组成。

主要功能有：

(1)接受用户请求，并判定把它送到哪里，或必须访问哪些计算机才能满足该请求。

(2)访问网络数据字典，或者至少了解如何请求和使用其中的信息。

(3)如果目标数据存储于系统的多个计算机上，就必须进行分布式处理。

(4)通信接口功能，在用户、局部DBMS和其他计算机的DBMS之间进行协调。

(5)在一个异构型分布式处理环境中，还需提供数据和进程移植的支持。这里的异构型是指各个场地的硬件、软件之间存在一定差别。

DDBMS组成——应包括以下四个子系统：

（1）查询子系统

（2）完整性子系统

（3）调度子系统

（4）可靠性子系统

7.9 分布式系统中影响查询的主要因素是什么?

分布式系统中，影响查询的主要因素数据经网络的传输时间，数据传输量是衡量查询时间的一个主要指标，不同场地间的联接操作和并操作是影响数据传输量的主要原因。

7.10 基于半联接的查询优化策略的基本思想是什么?

数据在网络中传输时，如果以整个关系传输，则传输数据量大，是一种冗余的做法，而实际上，在联接时并非每个数据都参与操作或有用。因此，考虑到不参与操作的值或无用的值不必经网络来回传输，则可以减少传输的数据量。

第四篇：数据库期末考试题及答案

数据库系统概论习题集第一章绪论

一、选择题

1.DBS是采用了数据库技术的计算机系统，它是一个集合体，包含数据库、计算机硬件、软件和（）。

A.系统分析员

B.程序员 C.数据库管理员

D.操作员

2.数据库（DB），数据库系统（DBS）和数据库管理系统（DBMS）之间的关系是（）。

A.DBS包括DB和DBMS

B.DBMS包括DB和DBS

C.DB包括DBS和DBMS D.DBS就是DB，也就是DBMS

3.下面列出的数据库管理技术发展的三个阶段中，没有专门的软件对数据进行管理的是（）。

I．人工管理阶段

II．文件系统阶段

III．数据库阶段

A.I 和 II

B.只有 II C.II 和 III

D.只有 I

4.下列四项中，不属于数据库系统特点的是（）。

A.数据共享

B.数据完整性

C.数据冗余度高

D.数据独立性高

5.数据库系统的数据独立性体现在（）。

A.不会因为数据的变化而影响到应用程序

B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序

C.不会因为存储策略的变化而影响存储结构

D.不会因为某些存储结构的变化而影响其他的存储结构

6.描述数据库全体数据的全局逻辑结构和特性的是（）。

A.模式

B.内模式 C.外模式 D.用户模式

7.要保证数据库的数据独立性，需要修改的是（）。

A.模式与外模式

B.模式与内模式

C.三层之间的两种映射

D.三层模式

8.要保证数据库的逻辑数据独立性，需要修改的是（）。

A.模式与外模式的映射

B.模式与内模式之间的映射

C.模式

D.三层模式

9.用户或应用程序看到的那部分局部逻辑结构和特征的描述是（），它是模式的逻辑子集。

A.模式

B.物理模式

C.子模式 D.内模式

10.下述（）不是DBA数据库管理员的职责。

A.完整性约束说明 B.定义数据库模式

C.数据库安全 D.数据库管理系统设计

选择题参考答案：(1)C(2)A(3)D(4)C(5)B(6)A(7)C(8)A(9)C(10)D

二、简答题

１．试述数据、数据库、数据库系统、数据库管理系统的概念。

数据：描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。

*解析：在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算，处理的数据是整数、实数、浮点数等传统数学中的数据等。现在计算机能存储和处理的对象十分广泛，表示这些对象的数据也越来越复杂。

数据与其语义是不可分的。500这个数字可以表示一件物品的价格是500元，也可以表示一个学术会议参加的人数有500人。还可以表示一袋奶粉重500克。

数据库：数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存，具有较小的冗余度、较高的数据独立性和易扩展性，并可为各种用户共享。

*解析：简单地讲，数据数据库数据具有永久储存、有组织和可共享三个特点。

数据模型是数据库的核心概念。每个数据库中数据的都是按照某一种数据模型来组织的。

数据库系统：数据库系统（DBS）是指在计算机系统中引入数据库后的系统构成。数据库系统由数据库、数据库管理系统（及其开发工具）、应用系统、数据库管理员构成。

*解析：数据库系统和数据库是两个概念。数据库系统是一个人-机系统，数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把把数据库系统简称为数据库。希望读者能够从人们讲话或文章的上下文中区分“数据库系统”和“数据库”。不要引起混淆。

数据库管理系统：数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。用于科学地组织和存储数据、高效地获取和维护数据。DBMS主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。

*解析：DBMS是一个大型复杂的软件系统。是计算机中的基础软件。目前，专门研制DBMS的厂商及其研制的DBMS产品很多。著名的有美国IBM公司的DB2关系数据库管理系统、IMS层次数据库管理系统；美国ORACLE公司的ORACLE关系数据库管理系统；SYBASE公司的SYBASE关系数据库管理系统；美国微软公司的SQL SERVER关系数据库管理系统等等。

２．使用数据库系统有什么好处？

使用数据库系统的好处是由数据库管理系统的特点或优点决定的。

使用数据库系统的好处很多，例如可以大大提高应用开发的效率，方便用户的使用，减轻数据库系统管理人员维护的负担等。

使用数据库系统可以大大提高应用开发的效率。因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径，这些工作都由DBMS来完成。用一个通俗的比喻，使用了DBMS就如有了一个好参谋好助手，许多具体的技术工作都由这个助手来完成。开发人员就可以专注于应用逻辑的设计而不必为管理数据的许许多多复杂的细节操心。

还有，当应用逻辑改变，数据的逻辑结构需要改变时，由于数据库系统提供了数据与程序之间的独立性。数据逻辑结构的改变是DBA的责任，开发人员不必修改应用程序，或者只需要修改很少的应用程序。从而既简化了应用程序的编制，又大大减少了应用程序的维护和修改。

使用数据库系统可以减轻数据库系统管理人员维护系统的负担。因为DBMS在数据库建立、运用和维护时对数据库进行统一的管理和控制，包括数据的完整性、安全性，多用户并发控制，故障恢复等等都由DBMS执行。

总之，使用数据库系统的优点是很多的，既便于数据的集中管理，控制数据冗余，可以提高数据的利用率和一致性，又有利于应用程序的开发和维护。读者可以在自己今后的工作中结合具体应用，认真加以体会和总结。

３．试述文件系统与数据库系统的区别和联系。

文件系统与数据库系统的区别：文件系统面向某一应用程序，共享性差、冗余度大，独立性差，纪录内有结构、整体无结构，应用程序自己控制。

数据库系统面向现实世界，共享性高、冗余度小，具有高度的物理独立性和一定的逻辑独立性，整体结构化，用数据模型描述，由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力。

读者可以参考《概论》书中表1.1 中的有关内容。

文件系统与数据库系统的联系是：文件系统与数据库系统都是计算机系统中管理数据的软件。

*解析：

文件系统是操作系统的重要组成部分，而DBMS是独立于操作系统的软件。但是DBMS是在操作系统的基础上实现的。数据库中数据的组织和存储是通过操作系统中文件系统来实现的。

读者进一步学习数据库管理系统实现的有关课程后可以对本题有深入的理解和全面的解答。因为DBMS的实现与操作系统中的文件系统是紧密相关的。例如，数据库实现的基础是文件，对数据库的任何操作最终要转化为对文件的操作。所以在DBMS实现中数据库物理组织的基本问题是如何利用或如何选择操作系统提供的基本的文件组织方法。这里我们就不具体展开了。

４．举出适合用文件系统而不是数据库系统的例子；再举出适合用数据库系统的应用例子。

•适用于文件系统而不是数据库系统的应用例子

数据的备份，软件或应用程序使用过程中的临时数据存储一般使用文件比较合适。早期功能比较简单、比较固定的应用系统也适合用文件系统。

•适用于数据库系统而非文件系统的应用例子

目前，几乎所有企业或部门的信息系统都以数据库系统为基础，都使用数据库。如一个工厂的管理信息系统（其中会包括许多子系统，如库存管理系统、物资采购系统、作业调度系统、设备管理系统、人事管理系统等等），还比如学校的学生管理系统，人事管理系统，图书馆的图书管理系统等等都适合用数据库系统。希望同学们能举出自己了解的应用例子。

５．试述数据库系统的特点。

数据库系统的主要特点有：

一、数据结构化：数据库系统实现整体数据的结构化，这是数据库的主要特征之一，也是数据库系统与文件系统的本质区别。

*解析：注意这里“整体”两个字。在数据库系统中，数据不再针对某一个应用，而是面向全组织，具有整体的结构化。不仅数据是结构化的，而且数据的存取单位即一次可以存取数据的大小也很灵活。可以小到某一个数据项（如一个学生的姓名），大到一组记录（成千上万个学生记录）。而在文件系统中，数据的存取单位只有一个：记录。如一个学生的完整记录。

二、数据的共享性高，冗余度低，易扩充：数据库的数据不再面向某个应用而是面向整个系统，因此可以被多个用户、多个应用、用多种不同的语言共享使用。由于数据面向整个系统，是有结构的数据，不仅可以被多个应用共享使用，而且容易增加新的应用，这就使得数据库系统弹性大，易于扩充。

*解析：

数据共享可以大大减少数据冗余，节约存储空间，同时还能够避免数据之间的不相容性与不一致性。

所谓“数据面向某个应用”是指数据结构是针对某个应用设计的，只被这个应用程序或应用系统使用。可以说数据是某个应用的“私有资源”。

所谓“弹性大”是指系统容易扩充也容易收缩，即应用增加或减少时不必修改整个数据库的结构，或者只要做很少的修改。

我们可以取整体数据的各种子集用于不同的应用系统，当应用需求改变或增加时，只要重新选取不同的子集或加上一部分数据便可以满足新的需求。

三、数据独立性高：数据独立性包括数据的物理独立性和数据的逻辑独立性。数据库管理系统的模式结构和二级映象功能保证了数据库中的数据具有很高的物理独立性和逻辑独立性。

*解析：

所谓“独立性”即相互不依赖。数据独立性是指数据和程序相互不依赖。即数据的逻辑结构或物理结构改变了，程序不会跟着改变。数据与程序的独立，把数据的定义从程序中分离出去，加上数据的存取又由DBMS负责，简化了应用程序的编制，大大减少了应用程序的维护和修改。

四、数据由DBMS统一管理和控制：数据库的共享是并发的共享，即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。为此，DBMS必须提供统一的数据控制功能，包括数据的安全性保护，数据的完整性检查，并发控制和数据库恢复。

*解析：

DBMS数据控制功能包括四个方面：

数据的安全性保护：保护数据以防止不合法的使用造成的数据的泄密和破坏；

数据的完整性检查：将数据控制在有效的范围内或保证数据之间满足一定的关系；

并发控制：对多用户的并发操作加以控制和协调，保证并发操作的正确性；

数据库恢复：当计算机系统发生硬件故障、软件故障，或者由于操作员的失误以及故意的破坏影响数据库中数据的正确性，甚至造成数据库部分或全部数据的丢失时，能将数据库从错误状态恢复到某一已知的正确状态（亦称为完整状态或一致状态）。

下面我们可以得到“什么是数据库”的一个定义：

数据库是长期存储在计算机内有组织的大量的共享的数据集合。它可以供各种用户共享，具有最小冗余度和较高的数据独立性。DBMS在数据库建立、运用和维护时对数据库进行统一控制，以保证数据的完整性、安全性，并在多用户同时使用数据库时进行并发控制，在发生故障后对系统进行恢复。

数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。

６．数据库管理系统的主要功能有哪些？

①数据库定义功能；

②数据存取功能；

③数据库运行管理；

④数据库的建立和维护功能。

７．试述数据模型的概念、数据模型的作用和数据模型的三个要素。

数据模型是数据库中用来对现实世界进行抽象的工具，是数据库中用于提供信息表示和操作手段的形式构架。

一般地讲，数据模型是严格定义的概念的集合。这些概念精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。

①数据结构：是所研究的对象类型的集合，是对系统的静态特性的描述。

②数据操作：是指对数据库中各种对象（型）的实例（值）允许进行的操作的集合，包括操作及有关的操作规则，是对系统动态特性的描述。

③数据的约束条件：是完整性规则的集合，完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则，用以限定符合数据模型的数据库状态以及状态的变化，以保证数据的正确、有效、相容。

*解析：

数据模型是数据库系统中最重要的概念之一。同学们必须通过《概论》的学习真正掌握

数据模型的概念和作用。

数据模型是数据库系统的基础。任何一个DBMS都以某一个数据模型为基础，或者说支持某一个数据模型。

数据库系统中模型有不同的层次。根据模型应用的不同目的，可以将模型分成两类或说两个层次：一是概念模型，是按用户的观点来对数据和信息建模，用于信息世界的建模，强调语义表达能力，概念简单清晰；另一是数据模型，是按计算机系统的观点对数据建模，用于机器世界，人们可以用它定义、操纵数据库中的数据。一般需要有严格的形式化定义和一组严格定义了语法和语义的语言，并有一些规定和限制，便于在机器上实现。

８．试述概念模型的作用。

概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模，是现实世界到信息世界的第一层抽象，是数据库设计人员进行数据库设计的有力工具，也是数据库设计人员和用户之间进行交流的语言。

９．定义并解释概念模型中以下术语：

实体，实体型，实体集，属性，码，实体联系图（E-R图）

实体：客观存在并可以相互区分的事物叫实体。

实体型：具有相同属性的实体具有相同的特征和性质，用实体名及其属性名集合来抽象和刻画同类实体称为实体型。

实体集：同型实体的集合称为实体集。

属性：实体所具有的某一特性，一个实体可由若干个属性来刻画。

码：唯一标识实体的属性集称为码。

实体联系图：E-R图提供了表示实体型、属性和联系的方法：

• 实体型：用矩形表示，矩形框内写明实体名。

• 属性：用椭圆形表示，并用无向边将其与相应的实体连接起来。

•联系：用菱形表示，菱形框内写明联系名，并用无向边分别与有关实体连接起来，同时在无向边旁标上联系的类型（1 : 1，1 : n或m : n）。

10．试给出三个实际部门的E-R图，要求实体型之间具有一对一，一对多，多对多各种不同的联系。

关系数据库

一、选择题

1.下面的选项不是关系数据库基本特征的是（）。

A.不同的列应有不同的数据类型

B.不同的列应有不同的列名

C.与行的次序无关

D.与列的次序无关

2.一个关系只有一个（）。

A.候选码

B.外码

C.超码

D.主码

3.关系模型中，一个码是（）。

A.可以由多个任意属性组成 B.至多由一个属性组成

C.可有多个或者一个其值能够唯一表示该关系模式中任何元组的属性组成D.以上都不是

4.现有如下关系：

患者（患者编号，患者姓名，性别，出生日起，所在单位）

医疗（患者编号，患者姓名，医生编号，医生姓名，诊断日期，诊断结果）

其中，医疗关系中的外码是（）。

A.患者编号

B.患者姓名

C.患者编号和患者姓名

D.医生编号和患者编号

5.现有一个关系：借阅（书号，书名，库存数，读者号，借期，还期），假如同一本书允许一个读者多次借阅，但不能同时对一种书借多本，则该关系模式的外码是（）。

A.书号

B.读者号

C.书号+读者号

D.书号+读者号+借期

6.关系模型中实现实体间 N：M 联系是通过增加一个（）。

A.关系实现

B.属性实现

C.关系或一个属性实现

D.关系和一个属性实现

7.关系代数运算是以（）为基础的运算。

A.关系运算

B.谓词演算

C.集合运算

D.代数运算

8.关系数据库管理系统应能实现的专门关系运算包括（）。

A.排序、索引、统计

B.选择、投影、连接 C.关联、更新、排序

D.显示、打印、制表

9.五种基本关系代数运算是（）。

A.∪ － × σ π

B.∪ － σ π

C.∪ ∩ × σ π

D.∪ ∩ σ π

10.关系代数表达式的优化策略中，首先要做的是（）。

A.对文件进行预处理

B.尽早执行选择运算

C.执行笛卡尔积运算

D.投影运算

11.关系数据库中的投影操作是指从关系中（）。

A.抽出特定记录

B.抽出特定字段

C.建立相应的影像

D.建立相应的图形

12.从一个数据库文件中取出满足某个条件的所有记录形成一个新的数据库文件的操作是（）操作。

A.投影

B.联接

C.选择

D.复制

13.关系代数中的联接操作是由（）操作组合而成。

A.选择和投影 B.选择和笛卡尔积

C.投影、选择、笛卡尔积

D.投影和笛卡尔积

14.自然联接是构成新关系的有效方法。一般情况下，当对关系R和S是用自然联接时，要求R和S含有一个或者多个共有的（）。

A.记录

B.行

C.属性

D.元组

15.假设有关系R和S，在下列的关系运算中，（）运算不要求：“R和S具有相同的元数，且它们的对应属性的数据类型也相同”。

A.R∩S

B.R∪S

C.R－S

D.R×S

16.假设有关系R和S，关系代数表达式R－（R－S）表示的是（）。

A.R∩S

B.R∪S

C.R－S

D.R×S

17.下面列出的关系代数表达是中，那些式子能够成立（）。

ⅰ.σf1(σf2(E))= σf1∧f2(E)

ⅱ.E1∞E2 = E2∞E1

ⅲ.(E1∞E2)∞E3 = E1∞(E2∞E3)

ⅳ.σf1(σf2(E))=σf2(σf1(E))

A.全部

B.ⅱ和ⅲ C.没有

D.ⅰ和ⅳ

18.下面四个关系表达式是等价的，是判别它们的执行效率（）。

E1 =πA(σ B=C ∧ D=E′(R×S))

E2 =πA(σ B=C(R× σD=E′(S))

E3 =πA(R∞B=CσD=E′(S))

E3 =πA(σD=E′(R∞B=C S))

A.E3最快

B.E2最快 C.E4最快 D.E1最快

19.有关系SC（S_ID，C_ID，AGE，SCORE），查找年龄大于22岁的学生的学号和分数，正确的关系代数表达式是（）。

ⅰ.πS_ID，SCORE(σ age>22(SC))

ⅱ.σ age>22(πS_ID，SCORE(SC))

ⅲ.πS_ID，SCORE(σ age>22(πS_ID，SCORE，AGE(SC)))

A.ⅰ和 ⅱ

B.只有ⅱ正确

C.只有 ⅰ正确

D.ⅰ和ⅲ正确

选择题参考答案：(1)A(2)D(3)C(4)A(5)D(6)A(7)C(8)B(9)A(10)B

(11)B(12)C(13)B(14)C(15)D(16)A(17)C(18)A(19)D

二、简答题

1.试述关系模型的三个组成部分。

2.试述关系数据语言的特点和分类。

3.设有一个SPJ数据库，包括S，P，J，SPJ四个关系模式：

S(SNO，SNAME，STATUS，CITY)；

P(PNO，PNAME，COLOR，WEIGHT)；

J(JNO，JNAME，CITY)；

SPJ(SNO，PNO，JNO，QTY)；

供应商表S由供应商代码（SNO）、供应商姓名（SNAME）、供应商状态（STATUS）、供应商所在城市（CITY）组成；零件表P由零件代码（PNO）、零件名（PNAME）、颜色（COLOR）、重量（WEIGHT）组成；工程项目表J由工程项目代码（JNO）、工程项目名（JNAME）、工程项目所在城市（CITY）组成；供应情况表SPJ由供应商代码（SNO）、零件代码（PNO）、工程项目代码（JNO）、供应数量（QTY）组成，表示某供应商供应某种零件给某工程项目的数量为QTY。

试用关系代数完成如下查询：

（1）求供应工程J1零件的供应商号码SNO；

（2）求供应工程J1零件P1的供应商号码SNO；

（3）求供应工程J1零件为红色的供应商号码SNO；

（4）求没有使用天津供应商生产的红色零件的工程号JNO；

（5）求至少用了供应商S1所供应的全部零件的工程号JNO。

4.定义并理解下列术语，说明它们之间的联系与区别:

（1）域，笛卡尔积，关系，元组，属性

（2）主码，候选码，外码

（3）关系模式，关系，关系数据库

5.试述关系模型的完整性规则。在参照完整性中，为什么外码属性的值有时也可以为空？什么情况下才可以为空？

6.试述等值连接与自然连接的区别和联系。

7.关系代数的基本运算有哪些？

8.试用关系代数的基本运算来表示其他运算。

SQL语言

一、选择题

1.SQL语言是（）的语言，容易学习。

A.过程化

B.非过程化

C.格式化

D.导航式

2.SQL语言的数据操纵语句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的，也是使用最频繁的语句是（）。

A.SELECT B.INSERT

C.UPDATE D.DELETE

3.在视图上不能完成的操作是（）。

A.更新视图

B.查询

C.在视图上定义新的表

D.在视图上定义新的视图

4.SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体，其中，CREATE、DROP、ALTER语句是实现哪种功能（）。

A.数据查询

B.数据操纵

C.数据定义 D.数据控制

5.SQL语言中，删除一个视图的命令是（）。

A.DELETE

B.DROP

C.CLEAR

D.REMOVE

6.在SQL语言中的视图VIEW是数据库的（）。

A.外模式

B.模式

C.内模式

D.存储模式

7.下列的SQL语句中，（）不是数据定义语句。

A.CREATE TABLE B.DROP VIEW

C.CREATE VIEW D.GRANT

8.若要撤销数据库中已经存在的表S，可用（）。

A.DELETE TABLE S B.DELETE S

C.DROP TABLE S D.DROP S

9.若要在基本表S中增加一列CN（课程名），可用（）。

A.ADD TABLE S（CN CHAR（８））

B.ADD TABLE S ALTER（CN CHAR（８））

C.ALTER TABLE S ADD（CN CHAR（８））D.ALTER TABLE S（ADD CN CHAR（８））

10.学生关系模式 S（S＃，Sname，Sex，Age），S的属性分别表示学生的学号、姓名、性别、年龄。要在表S中删除一个属性“年龄”，可选用的SQL语句是（）。

A.DELETE Age from S B.ALTER TABLE S DROP Age

C.UPDATE S Age D.ALTER TABLE S ‘Age’

11.有关系S（S＃，SNAME，SAGE），C（C＃，CNAME），SC（S＃，C＃，GRADE）。其中S＃是学生号，SNAME是学生姓名，SAGE是学生年龄，C＃是课程号，CNAME是课程名称。要查询选修“ACCESS”课的年龄不小于20的全体学生姓名的SQL语句是SELECT SNAME FROM S，C，SC WHERE子句。这里的WHERE子句的内容是（）。

A.S.S# = SC.S# and C.C# = SC.C# and SAGE>=20 and CNAME=‘ACCESS’

B.S.S# = SC.S# and C.C# = SC.C# and SAGE in>=20 and CNAME in ‘ACCESS’

C.SAGE in>=20 and CNAME in ‘ACCESS’

D.SAGE>=20 and CNAME=’ ACCESS’

12.设关系数据库中一个表S的结构为S（SN，CN，grade），其中SN为学生名，CN为课程名，二者均为字符型；grade为成绩，数值型，取值范围0－100。若要把“张二的化学成绩80分”插入S中，则可用（）。

A.ADD INTO S VALUES（’张二’，’化学’，’80’）

B.INSERT INTO S VALUES（’张二’，’化学’，’80’）

C.ADD

INTO S VALUES（’张二’，’化学’，80）D.INSERT INTO S VALUES（’张二’，’化学’，80）

13.设关系数据库中一个表S的结构为：S（SN，CN，grade），其中SN为学生名，CN为课程名，二者均为字符型；grade为成绩，数值型，取值范围0－100。若要更正王二的化学成绩为85分，则可用（）。

A.UPDATE S SET grade＝85 WHERE SN＝’王二’ AND CN＝’化学’

B.UPDATE S SET grade＝’85’WHERE SN＝’王二’ AND CN＝’化学’

C.UPDATE grade＝85 WHERE SN＝’王二’ AND CN＝’化学’

D.UPDATE grade＝’85’WHERE SN＝’王二’ AND CN＝’化学’

14.在SQL语言中，子查询是（）。

A.返回单表中数据子集的查询语言

B.选取多表中字段子集的查询语句

C.选取单表中字段子集的查询语句

D.嵌入到另一个查询语句之中的查询语句

15.SQL是一种（）语言。

A.高级算法

B.人工智能

C.关系数据库 D.函数型

16.有关系S（S＃，SNAME，SEX），C（C＃，CNAME），SC（S＃，C＃，GRADE）。其中S＃是学生号，SNAME是学生姓名，SEX是性别，C＃是课程号，CNAME是课程名称。要查询选修“数据库”课的全体男生姓名的SQL语句是SELECT SNAME FROM S，C，SC WHERE子句。这里的WHERE子句的内容是（）。

A.S.S# = SC.S# and C.C# = SC.C# and SEX=’男’ and CNAME=’数据库’

B.S.S# = SC.S# and C.C# = SC.C# and SEX in’男’and CNAME in’数据库’

C.SEX ’男’ and CNAME ’ 数据库’

D.S.SEX=’男’ and CNAME=’ 数据库’

17.若用如下的SQL语句创建了一个表SC：

CREATE TABLE SC（S# CHAR（6）NOT NULL，C# CHAR（3）NOT NULL，SCORE INTEGER，NOTE CHAR（20））；向SC表插入如下行时，（）行可以被插入。

A.（’201009’，’111’，60，必修）

B.（’200823’，’101’，NULL，NULL）

C.（NULL，’103’，80，’选修’）

D.（’201132’，NULL，86，’ ’）

18.假设学生关系S（S＃，SNAME，SEX），课程关系C（C＃，CNAME），学生选课关系SC（S＃，C＃，GRADE）。要查询选修“Computer”课的男生姓名，将涉及到关系（）。

A.S B.S，SC C.C，SC D.S，C，SC

选择题参考答案：(1)B(2)A(3)C(4)C(5)B(6)A(7)D(8)C(9)C(10)B

(11)A(12)D(13)A(14)D(15)C(16)A(17)B(18)D

二、简答题

1.试述SQL语言的特点。

答：（1）综合统一。SQL语言集数据定义语言DDL、数据操纵语言DML、数据控制语言DCL的功能于一体。

（2）高度非过程化。用SQL语言进行数据操作，只要提出“做什么”，而无须指明“怎么做”，因此无需了解存取路径，存取路径的选择以及SQL语句的操作过程由系统自动完成。

（3）面向集合的操作方式。SQL语言采用集合操作方式，不仅操作对象、查找结果可以是元组的集合，而且一次插入、删除、更新操作的对象也可以是元组的集合。

（4）以同一种语法结构提供两种使用方式。SQL语言既是自含式语言，又是嵌入式语言。作为自含式语言，它能够独立地用于联机交互的使用方式，也能够嵌入到高级语言程序中，供程序员设计程序时使用。

（5）语言简捷，易学易用。

2.试述SQL的定义功能。

答： SQL的数据定义功能包括定义表、定义视图和定义索引。

SQL语言使用CREATE TABLE语句定义建立基本表，；ALTER TABLE语句修改基本表定义，DROP TABLE语句删除基本表；建立索引使用CREATE INDEX语句建立索引，DROP INDEX语句删除索引表；SQL语言使用CREATE VIEW命令建立视图，DROP VIEW语句删除视图。

3.用SQL语句建立第3章习题3中的四个表。

答：对于S表：S(SNO，SNAME，STATUS，CITY)；

建S表：CREATE TABLE S(SNO CHAR(3)，SNAME CHAR(10)，STATUS CHAR(2)，CITY CHAR(10))；

P(PNO，PNAME，COLOR，WEIGHT)；

建P表：CREATE TABLE P(PNO CHAR(3)，PNAME CHAR(10)，COLOR CHAR(4)，WEIGHT INT)；

J(JNO，JNAME，CITY)；

建J表：CREATE TABLE J(JNO CHAR(3)，JNAME CHAR(10)，CITY CHAR(10))；

SPJ(SNO，PNO，JNO，QTY)；

建SPJ表：CREATE TABLE SPJ(SNO CHAR(3)，PNO CHAR(3)，JNO CHAR(3)，QTY INT)；

4.针对上题中建立的四个表试用SQL语言完成第3章习题3中的查询。

答：（1）求供应工程J1零件的供应商号码SNO；

SELECT SNO

FROM SPJ

WHERE JNO=‘J1’；

（2）求供应工程J1零件P1的供应商号码SNO；

SELECT SNO

FROM SPJ

WHERE JNO=‘J1’

AND PNO=‘P1’；

（3）求供应工程J1零件为红色的供应商号码SNO；

SELECT SNO

FROM SPJ

WHERE JNO=‘J1’

AND PNO IN

(SELECT PNO

FROM P

WHERE COLOR=‘红’)；

或

SELECT SNO

FROM SPJ，P

WHERE JNO=‘J1’

AND SPJ.PNO=P.PNO

AND COLOR=‘红’；

（4）求没有使用天津供应商生产的红色零件的工程号JNO；

解析：

用SQL语言表示如下：

SELECT JNO

FROM J

WHERE NOT EXISTS

(SELECT *

FROM SPJ

WHERE SPJ.JNO=J.JNO

AND SNO IN

(SELECT SNO

FROM S

WHERE CITY=‘天津’)

AND PNO IN

(SELECT PNO

FROM P

WHERE COLOR=‘红’))；

或

SELECT JNO

FROM J

WHERE NOT EXISTS

(SELECT *1

FROM SPJ, S, P

WHERE SPJ.JNO=J.JNO

AND SPJ.SNO=S.SNO

AND SPJ.PNO=P.PNO

AND S.CITY=‘天津’

AND P.COLOR=‘红’)；

注意：从 J 表入手，以包含那些尚未使用任何零件的工程号。

（5）求至少用了供应商S1所供应的全部零件的工程号JNO。

解析：

用SQL语言表示如下：

SELECT DISTINCT JNO

FROM SPJ SPJZ

WHERE NOT EXISTS

(SELECT *

FROM SPJ SPJX

WHERE SNO='S1'

AND NOT EXISTS

(SELECT *

FROM SPJ SPJY

WHERE SPJY.PNO=SPJX.PNO

AND SPJY.JNON=SPJZ.JNO

AND SPJY.SNO=’S1’））；

AND SPJY.SNO='S1'))；

5.针对习题3中的四个表试用SQL语言完成以下各项操作：

（1）找出所有供应商的姓名和所在城市。

（2）找出所有零件的名称、颜色、重量。

（3）找出使用供应商S1所供应零件的工程号码。

（4）找出工程项目J2使用的各种零件的名称及其数量。

（5）找出上海厂商供应的所有零件号码。

（6）找出使用上海产的零件的工程名称。

（7）找出没有使用天津产的零件的工程号码。

（8）把全部红色零件的颜色改成蓝色。

（9）由S5供给J4的零件P6改为由S3供应，请作必要的修改。

（10）从供应商关系中删除S2的记录，并从供应情况关系中删除相应的记录。

（11）请将(S2，J6，P4，200)插入供应情况关系。

答：

(1)找出所有供应商的姓名和所在城市。

SELECT SNAME, CITY

FROM S;

(2)找出所有零件的名称、颜色、重量。

SELECT PNAME, COLOR, WEIGHT

FROM P;

(3)找出使用供应商S1所供应零件的工程号码。

SELECT JNO

FROM SPJ

WHERE SNO=‘S1’;

(4)找出工程项目J2使用的各种零件的名称及其数量。

SELECT P.PNAME, SPJ.QTY

FROM P, SPJ

WHERE P.PNO=SPJ.PNO

AND SPJ.JNO='J2';

(5)找出上海厂商供应的所有零件号码。

SELECT DISTINCT PNO

FROM SPJ

WHERE SNO IN

（SELECT SNO

FROM S

WHERE CITY='上海'）;

(6)找出使用上海产的零件的工程名称。

SELECT JNAME

FROM J, SPJ, S

WHERE J.JNO=SPJ.JNO

AND SPJ.SNO=S.SNO

AND S.CITY='上海';

或

SELECT JNAME

FROM J

WHERE JNO IN

(SELECT JNO

FROM SPJ, S

WHERE SPJ.SNO=S.SNO

AND S.CITY='上海');

(7)找出没有使用天津产的零件的工程号码。

SELECT JNO

FROM J

WHERE NOT EXISTS

(SELECT *

FROM SPJ

WHERE SPJ.JNO=J.JNO AND SNO IN

(SELECT SNO

FROM S

WHERE CITY=‘天津’))；

或

SELECT JNO

FROM J

WHERE NOT EXISTS

(SELECT *1

FROM SPJ, S

WHERE SPJ.JNO=J.JNO AND SPJ.SNO=S.SNO AND S.CITY=‘天津’)；

(8)把全部红色零件的颜色改成蓝色。

UPDATE P

SET COLOR='蓝'

WHERE COLOR='红';

(9)由S5供给J4的零件P6改为由S3供应，请作必要的修改。

UPDATE SPJ

SET SNO='S3'

WHERE SNO='S5' AND JNO='J4' AND PNO='P6';

(10)从供应商关系中删除S2的记录，并从供应情况关系中删除相应的记录。

DELETE

FROM SPJ

WHERE SNO='S2';

或

DELETE

FROM S

WHERE SNO='S2';

解析：注意删除顺序，应该先从SPJ表中删除供应商S2所供应零件的记录，然后从从S表中删除S2。

(11)请将(S2，J6，P4，200)插入供应情况关系。

INSERT INTO SPJ(SNO, JNO, PNO, QTY)

VALUES(S2，J6，P4，200);

或

INSERT INTO SPJ

VALUES(S2，P4，J6，200);

6.什么是基本表？什么是视图？两者的区别和联系是什么？

答：基本表是本身独立存在的表，在SQL中一个关系就对应一个表。

视图是从一个或几个基本表导出的表。视图本身不独立存储在数据库中，是一个虚表。即数据库中只存放视图的定义而不存放视图对应的数据，这些数据仍存放在导出视图的基本表中。视图在概念上与基本表等同，用户可以如同基本表那样使用视图，可以在视图上再定义视图。

7.试述视图的优点。

答：(1)视图能够简化用户的操作。

(2)视图使用户能以多种角度看待同一数据。

(3)视图对重构数据库提供了一定程度的逻辑独立性。

(4)视图能够对机密数据提供安全保护。

8.所有的视图是否都可以更新？为什么？

答：不是。视图是不实际存储数据的虚表，因此对视图的更新，最终要转换为对基本表的更新。因为有些视图的更新不能唯一地有意义地转换成对相应基本表的更新，所以，并不是所有的视图都是可更新的。如《概论》3.5.1中的视图S_G（学生的学号及他的平均成绩）

CREAT VIEW S_G(Sno，Gavg)

AS SELECT Sno，AVG(Grade)

FROM SC

GROUP BY Sno；

要修改平均成绩，必须修改各科成绩，而我们无法知道哪些课程成绩的变化导致了平均成绩的变化。

9.哪类视图是可以更新的，哪类视图是不可更新的？各举一例说明。

答：基本表的行列子集视图一般是可更新的。如《概论》3.5.3中的例1。

若视图的属性来自集函数、表达式，则该视图肯定是不可以更新的。

如《概论》3.5.3中的S_G视图。

10.试述某个你熟悉的实际系统中对视图更新的规定。

答：（略）

解析：不同的系统对视图更新的规定是不同的，读者必须了解你所用系统对视图更新的规定。

11.请为三建工程项目建立一个供应情况的视图，包括供应商代码（SNO）、零件

代码（PNO）、供应数量（QTY）。针对该视图完成下列查询：

（1）找出三建工程项目使用的各种零件代码及其数量。

（2）找出供应商S1的供应情况。

答：建视图：

CREATE VIEW V_SPJ AS

SELECT SNO, PNO, QTY

FROM SPJ

WHERE JNO=

（SELECT JNO

FROM J

WHERE JNAME='三建'）;

对该视图查询：

(1)找出三建工程项目使用的各种零件代码及其数量。

SELECT PNO, QTY

FROM V_SPJ;

(2)找出供应商S1的供应情况。

SELECT PNO, QTY /* S1供应三建工程的零件号和对应的数量*/

FROM V_SPJ

WHERE SNO='S1';

关系系统及其优化

一、选择题

1.概念模型是现实世界的第一层抽象，这一类最著名的模型是（）。

A.层次模型 B.关系模型 C.网状模型 D.实体-关系模型

2.区分不同实体的依据是（）。

A.名称 B.属性 C.对象 D.概念

3.关系数据模型是目前最重要的一种数据模型，它的三个要素分别为（）。

A.实体完整、参照完整、用户自定义完整

B.数据结构、关系操作、完整性约束

C.数据增加、数据修改、数据查询

D.外模式、模式、内模式

4.在（）中一个结点可以有多个双亲，节点之间可以有多种联系。

A.网状模型 B.关系模型

C.层次模型 D.以上都有

5.（）的存取路径对用户透明，从而具有更高的数据独立性、更好的安全保密性，也简化了程序员的工作和数据库开发建立的工作。

A.网状模型 B.关系模型

D.层次模型 D.以上都有

6.在关系数据库中，要求基本关系中所有的主属性上不能有空值，其遵守的约束规则是（）。

A.数据依赖完整性规则 B.用户定义完整性规则

C.实体完整性规则 D.域完整性规则

选择题参考答案：(1)D(2)B(3)B(4)A(5)B(6)C

二、简答题

1.试述关系模型的三个组成部分。

答：关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。

2.试述关系数据语言的特点和分类。

答：关系数据语言可以分为三类：

关系代数语言例如ISBL

关系演算语言（元组关系演算语言例如APLHA，QUEL 和域关系演算语言例如QBE）

具有关系代数和关系演算双重特点的语言例如SQL

这些关系数据语言的共同特点是，具有完备的表达能力，是非过程化的集合操作语言，功能强，能够嵌入高级语言中使用。

3.定义并理解下列术语，说明它们之间的联系与区别:

（1）域，关系，元组，属性

答：域：域是一组具有相同数据类型的值的集合。

关系：在域D1，D2，„，Dn上笛卡尔积D1×D2×„×Dn的子集称为关系，表示为

R（D1，D2，„，Dn）

元组：关系中的每个元素是关系中的元组。

属性：关系也是一个二维表，表的每行对应一个元组，表的每列对应一个域。由于域可

以相同，为了加以区分，必须对每列起一个名字，称为属性（Attribute）。

（2）主码，候选码，外部码

答：候选码：若关系中的某一属性组的值能唯一地标识一个元组，则称该属性组为候选码（Candidate key）。

主码：若一个关系有多个候选码，则选定其中一个为主码（Primary key）。

外部码：设F是基本关系R的一个或一组属性，但不是关系R的码，如果F与基本关系S的主码Ks相对应，则称F是基本关系R的外部码（Foreign key），简称外码。

基本关系R称为参照关系（Referencing relation），基本关系S称为被参照关系（Referenced relation）或目标关系（Target relation）。关系R和S可以是相同的关系。

(3)关系模式，关系，关系数据库

关系模式：关系的描述称为关系模式（Relation Schema）。它可以形式化地表示为：

R（U，D，dom，F）

其中R为关系名，U为组成该关系的属性名集合，D为属性组U中属性所来自的域，dom为属性向域的映象集合，F为属性间数据的依赖关系集合。

关系：在域D1，D2，„，Dn上笛卡尔积D1×D2×„×Dn的子集称为关系，表示为

R（D1，D2，„，Dn）

关系是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的，而关系是动态的、随时间不断变化的，因为关系操作在不断地更新着数据库中的数据。

关系数据库：关系数据库也有型和值之分。关系数据库的型也称为关系数据库模式，是对关系数据库的描述，它包括若干域的定义以及在这些域上定义的若干关系模式。关系数据库的值是这些关系模式在某一时刻对应的关系的集合，通常就称为关系数据库。

4.试述关系模型的完整性规则。在参照完整性中，为什么外部码属性的值也可以为空？什么情况下才可以为空？

答：关系模型的完整性规则是对关系的某种约束条件。关系模型中可以有三类完整性约束：实体完整性、参照完整性和用户定义的完整性。

其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件，被称作是关系的两个不变性，应该由关系系统自动支持。

1)实体完整性规则：若属性A是基本关系R的主属性，则属性A不能取空值。

2)参照完整性规则：若属性（或属性组）F是基本关系R的外码，它与基本关系S的主码Ks相对应（基本关系R和S不一定是不同的关系），则对于R中每个元组在F上的值必

须为： • 或者取空值（F的每个属性值均为空值）；

• 或者等于S中某个元组的主码值。

3)用户定义的完整性是针对某一具体关系数据库的约束条件。它反映某一具体应用所涉及的数据必须满足的语义要求。

在参照完整性中，外部码属性的值可以为空，它表示该属性的值尚未确定。但前提条件是该外部码属性不是其所在关系的主属性。

例如，在下面的“学生”表中，“专业号”是一个外部码，不是学生表的主属性，可以为空。其语义是，该学生的专业尚未确定。

学生（学号，姓名，性别，专业号，年龄）

专业（专业号，专业名）

而在下面的“选修”表中的“课程号”虽然也是一个外部码属性，但它又是“选修”表的主属性，所以不能为空。因为关系模型必须满足实体完整性。

课程（课程号，课程名，学分）

选修（学号，课程号，成绩）

5．等值连接与自然连接的区别是什么？

答：连接运算中有两种最为重要也最为常用的连接，一种是等值连接（equi-join），另一种是自然连接（Natural join）。

θ为“＝”的连接运算称为等值连接。

它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。即等值连接为：

R A=B S = { tｒ tｓ| tｒ∈R ∧ tｓ∈S ∧ tｒ[A] = tｓ[B] }

自然连接（Natural join）是一种特殊的等值连接，它要求两个关系中进行比较的分量必须是相同的属性组，并且要在结果中把重复的属性去掉。即若R和S具有相同的属性组B，则自然连接可记作：

R S = { tｒ tｓ| tｒ∈R ∧ tｓ∈S ∧ tｒ[B] = tｓ[B] }

关系数据理论

一、选择题

1.为了设计出性能较优的关系模式，必须进行规范化，规范化主要的理论依据是（）。

A.关系规范化理论 B.关系代数理论

C．数理逻辑 D.关系运算理论

2.规范化理论是关系数据库进行逻辑设计的理论依据，根据这个理论，关系数据库中的关系必须满足：每一个属性都是（）。

A.长度不变的 B.不可分解的 C．互相关联的 D.互不相关的

3.已知关系模式R（A，B，C，D，E）及其上的函数相关性集合F＝{A→D，B→C，E→A }，该关系模式的候选关键字是（）。

A.AB B.BE

C.CD D.DE

4.设学生关系S（SNO，SNAME，SSEX，SAGE，SDPART）的主键为SNO，学生选课关系SC（SNO，CNO，SCORE）的主键为SNO和CNO，则关系R（SNO，CNO，SSEX，SAGE，SDPART，SCORE）的主键为SNO和CNO，其满足（）。

A.1NF B.2NF C.3NF D.BCNF

5.设有关系模式W（C，P，S，G，T，R），其中各属性的含义是：C表示课程，P表示教师，S表示学生，G表示成绩，T表示时间，R表示教室，根据语义有如下数据依赖集：D={ C→P，（S，C）→G，（T，R）→C，（T，P）→R，（T，S）→R }，关系模式W的一个关键字是（）。

A.（S，C）B.（T，R）

C.（T，P）D.（T，S）

6.关系模式中，满足2NF的模式（）。

A.可能是1NF B.必定是1NF

C.必定是3NF

D.必定是BCNF

7.关系模式R中的属性全是主属性，则R的最高范式必定是（）。

A.1NF B.2NF

C.3NF D.BCNF

8.消除了部分函数依赖的1NF的关系模式，必定是（）。

A.1NF B.2NF

C.3NF D.BCNF

9.如果A－>B ,那么属性A和属性B的联系是（）。

A.一对多

B.多对一

C．多对多 D.以上都不是

10.关系模式的候选关键字可以有1个或多个，而主关键字有（）。

A.多个

B.0个

C.1个

D.1个或多个

11.候选关键字的属性可以有（）。

A.多个

B.0个

C.1个

D.1个或多个

12.关系模式的任何属性（）。

A.不可再分

B.可以再分

C.命名在关系模式上可以不唯一

D.以上都不是

13.设有关系模式W（C，P，S，G，T，R），其中各属性的含义是：C表示课程，P表示教师，S表示学生，G表示成绩，T表示时间，R表示教室，根据语义有如下数据依赖集：D={ C→P，（S，C）→G，（T，R）→C，（T，P）→R，（T，S）→R }，若将关系模式W分解为三个关系模式W1（C，P），W2（S，C，G），W2（S，T，R，C），则W1的规范化程序最高达到（）。

A.1NF B.2NF

C.3NF D.BCNF

14.在关系数据库中，任何二元关系模式的最高范式必定是（）。

A.1NF B.2NF

C.3NF D.BCNF

15.在关系规范式中，分解关系的基本原则是（）。

I.实现无损连接

II.分解后的关系相互独立

III.保持原有的依赖关系

A.Ⅰ和Ⅱ

B.Ⅰ和Ⅲ

C.Ⅰ

D.Ⅱ

16.不能使一个关系从第一范式转化为第二范式的条件是（）。

A.每一个非属性都完全函数依赖主属性

B.每一个非属性都部分函数依赖主属性

C.在一个关系中没有非属性存在 D.主键由一个属性构成17.任何一个满足2NF但不满足3NF的关系模式都不存在（）。

A.主属性对键的部分依赖

B.非主属性对键的部分依赖

C.主属性对键的传递依赖

D.非主属性对键的传递依赖

18.设数据库关系模式R＝（A，B，C，D，E），有下列函数依赖：A→BC，D→E，C→D；下述对R的分解中，哪些分解是R的无损连接分解（）。

I.（A，B，C）（C，D，E）

II.（A，B）（A，C，D，E）

III.（A，C）（B，C，D，E）

IV.（A，B）（C，D，E）

A.只有Ⅳ

B.Ⅰ和Ⅱ C.Ⅰ、Ⅱ和Ⅲ

D.都不是

19.设U是所有属性的集合，X、Y、Z都是U的子集，且Z＝U－X－Y。下面关于多值依赖的叙述中，不正确的是（）。

A.若X→→Y，则X→→Z

B.若X→Y，则X→→Y C.若X→→Y，且Y′∈Y，则X→→Y′

D.若Z＝∮，则X→→Y

20.若关系模式R（U，F）属于3NF，则（）。

A.一定属于BCNF

B.消除了插入的删除异常

C.仍存在一定的插入和删除异常

D.属于BCNF且消除了插入和删除异常

21.下列说法不正确的是（）。

A.任何一个包含两个属性的关系模式一定满足3NF

B.任何一个包含两个属性的关系模式一定满足BCNF

C.任何一个包含三个属性的关系模式一定满足3NF

D.任何一个关系模式都一定有码

22.设关系模式R（A，B，C），F是R上成立的FD集，F＝{B→C}，则分解P＝{AB，BC}相对于F（）。

A.是无损联接，也是保持FD的分解

B.是无损联接，也不保持FD的分解

C.不是无损联接，但保持FD的分解

D.既不是无损联接，也不保持FD的分解

23.关系数据库规范化是为了解决关系数据库中（）的问题而引入的。

A.插入、删除和数据冗余

B.提高查询速度

C.减少数据操作的复杂性

D.保证数据的安全性和完整性

24.关系的规范化中，各个范式之间的关系是（）。

A.1NF∈2NF∈3NF

B.3NF∈2NF∈1NF

C.1NF=2NF=3NF

D.1NF∈2NF∈BCNF∈3NF

25.数据库中的冗余数据是指可（）的数据。

A.容易产生错误

B.容易产生冲突

C.无关紧要

D.由基本数据导出

26.学生表（id，name，sex，age，depart_id，depart_name），存在函数依赖是id→name，sex，age，depart_id；dept_id→dept_name，其满足（）。

A.1NF B.2NF

C.3NF

D.BCNF

27.设有关系模式R（S，D，M），函数依赖集：F＝{S→D，D→M}，则关系模式R的规范化程度最高达到（）。

A.1NF B.2NF

C.3NF

D.BCNF 28.设有关系模式R（A，B，C，D），其数据依赖集：F＝{（A，B）→C，C→D}，则关系模式R的规范化程度最高达到（）。

A.1NF B.2NF

C.3NF

D.BCNF

29.下列关于函数依赖的叙述中，哪一条是不正确的（）。

A.由X→Y，Y→Z，则X→YZ

B.由X→YZ，则X→Y，Y→Z

C.由X→Y，WY→Z，则XW→Z

D.由X→Y，Z∈Y，则X→Z

30.X→Y，当下列哪一条成立时，称为平凡的函数依赖（）。

A.X∈Y B.Y∈X

C.X∩Y＝∮

D.X∩Y≠∮

31.关系数据库的规范化理论指出：关系数据库中的关系应该满足一定的要求，最起码的要求是达到1NF，即满足（）。

A.每个非主键属性都完全依赖于主键属性

B.主键属性唯一标识关系中的元组

C.关系中的元组不可重复

D.每个属性都是不可分解的32.根据关系数据库规范化理论，关系数据库中的关系要满足第一范式，部门（部门号，部门名，部门成员，部门总经理）关系中，因哪个属性而使它不满足第一范式（）。

A.部门总经理

B.部门成员

C.部门名 D.部门号

33.有关系模式A（C，T，H，R，S），其中各属性的含义是： C：课程 T：教员 H：上课时间 R：教室 S：学生。根据语义有如下函数依赖集：F={C→T，（H，R）→C，（H，T）RC，（H，S）→R}

（1）关系模式A的码是（）。

A.C

B.（H，S）

C.（H，R）

D.（H，T）

（2）关系模式A的规范化程度最高达到（）。

A.1NF

B.2NF C.3NF D.BCNF

（3）现将关系模式A分解为两个关系模式A1（C，T），A2（H，R，S），则其中A1的规范化程度达到（）。

A.1NF B.2NF

C.3NF

D.BCNF

参考答案：(1)A(2)B(3)B(4)A(5)D(6)B(7)C(8)B(9)B(10)C(11)D(12)A(13)D(14)D(15)B(16)B(17)D(18)B(19)C(20)C(21)C(22)A(23)A(24)A(25)D(26)B(27)B(28)B(29)B(30)B(31)D(32)B(33)B B D

二、简答题

1．理解并给出下列术语的定义：

函数依赖、部分函数依赖、完全函数依赖、候选码、主码、外码、全码。

解析：解答本题不能仅仅把《概论》上的定义写下来。关键是真正理解和运用这些概念。

答：函数依赖：设R(U)是一个关系模式，U是R的属性集合，X和Y是U的子集。对于R(U)的任意一个可能的关系r，如果r中不存在两个元组，它们在X上的属性值相同，而在Y上的属性值不同，则称“X函数确定Y”或“Y函数依赖于X”，记作X→Y。

解析：1）函数依赖是最基本的一种数据依赖，也是最重要的一种数据依赖。

2）函数依赖是属性之间的一种联系，体现在属性值是否相等。由上面的定义可以知道，如果X→Y，则r中任意两个元组，若它们在X上的属性值相同，那么在Y上的属性值一定也相同。

3）我们要从属性间实际存在的语义来确定他们之间的函数依赖，即函数依赖反映了（描述了）现实世界的一种语义。

4）函数依赖不是指关系模式R的在某个时刻的关系（值）满足的约束条件，而是指R任何时刻的一切关系均要满足的约束条件。

答：完全函数依赖、部分函数依赖：在R（U）中，如果X→Y，并且对于X的任何一个真子集X，都有X′→Y，则称Y对X完全函数依赖;若X→Y，但Y不完全函数依赖于X，则称Y对X部分函数依赖;

候选码、主码：设K为R(U，F)中的属性或属性组合，若K → U则K为R的候选码。若候选码多于一个，则选定其中的一个为主码。

答：外码：关系模式R中属性或属性组X并非R的码，但X是另一个关系模式的码，则称X是R的外部码也称外码。

全码：整个属性组是码，称为全码（All-key）。

2．建立一个关于系、学生、班级、学会等诸信息的关系数据库。

描述学生的属性有：学号、姓名、出生年月、系名、班号、宿舍区。

描述班级的属性有：班号、专业名、系名、人数、入校年份。

描述系的属性有：系名、系号、系办公室地点、人数。

描述学会的属性有：学会名、成立年份、地点、人数。

有关语义如下：一个系有若干专业，每个专业每年只招一个班，每个班有若干学生。一个系的学生住在同一宿舍区。每个学生可参加若干学会，每个学会有若干学生。学生参加某学会有一个入会年份。

请给出关系模式，写出每个关系模式的极小函数依赖集，指出是否存在传递函数依赖，对于函数依赖左部是多属性的情况讨论函数依赖是完全函数依赖，还是部分函数依赖。

指出各关系的候选码、外部码，有没有全码存在？

答：关系模式：学生S（S#，SN，SB，DN，C#，SA）

班级C（C#，CS，DN，CNUM，CDATE）

系 D（D#，DN，DA，DNUM）

学会P（PN，DATE1，PA，PNUM）

学生--学会SP（S#，PN，DATE2）

其中，S#—学号，SN—姓名，SB—出生年月，SA—宿舍区

C#—班号，CS—专业名，CNUM—班级人数，CDATE—入校年份

D#—系号，DN—系名，DA—系办公室地点，DNUM—系人数

PN—学会名，DATE1—成立年月，PA—地点，PNUM—学会人数，DATE2—入会年份

每个关系模式的极小函数依赖集：

S：S#→SN，S#→SB，S#→C#，C#→DN，DN→SA

C：C#→CS，C#→CNUM，C#→CDATE，CS→DN，(CS,CDATE)→C#

D：D#→DN，DN→D#，D#→DA，D#→DNUM

P：PN→DATE1，PN→PA，PN→PNUM

SP：（S#，PN）→DATE2

S中存在传递函数依赖： S#→DN, S#→SA, C#→SA

C中存在传递函数依赖：C#→DN

（S#，PN）→DATE2 和（CS，CDATE）→C# 均为SP中的函数依赖，是完全函数依赖

关系候选码外部码全码

S S# C#，DN 无

C C#，(CS,CDATE)DN 无

D D#和DN 无无

P PN 无无

SP（S#，PN）S#，PN 无

3.试由Armostrong公理系统推导出下面三条推理规则：

(1)合并规则：若X→Z，X→Y，则有X→YZ

(2)伪传递规则：由X→Y，WY→Z有XW→Z

(3)分解规则：X→Y，Z 包含于 Y，有X→Z

证：（1）已知X→Z，由增广律知XY→YZ，又因为X→Y，可得XX→XY→YZ，最后根据传递律得X→YZ。

（2）已知X→Y，据增广律得XW→WY，因为WY→Z，所以XW→WY→Z，通过传递律可知XW→Z。

（3）已知Z 包含于 Y，根据自反律知Y→Z，又因为X→Y，所以由传递律可得X→Z。

4.下面的结论哪些是正确的，哪些是错误的？对于错误的结论请给出理由或给出一个反例说明之。

（1）任何一个二目关系都是属于3NF的。√

（2）任何一个二目关系都是属于BCNF的。√

（3）任何一个二目关系都是属于4NF的。√

（5）若R.A→R.B，R.B→R.C，则R.A→R.C √

（6）若R.A→R.B，R.A→R.C，则R.A→R.(B, C)√

（7）若R.B→R.A，R.C→R.A，则R.(B, C)→R.A √

（8）若R.(B, C)→R.A，则R.B→R.A，R.C→R.A ×

反例：关系模式 SC（S#，C#，G）（S#，C#）→G，但是S# → G，C#→G

数据库设计

一、选择题

1.数据流程图是用于描述结构化方法中（）阶段的工具。

A.概要设计

B.可行性分析

C.程序编码

D.需求分析

2.数据库设计中，用E－R图赖描述信息结构但不涉及信息在计算机中的表示，这是数据库设计的（）。

A.需求分析阶段

B.逻辑设计阶段

C.概念设计阶段

D.物理设计阶段

3.在数据库设计中，将E-R图转换成关系数据模型的过程属于（）。

A.需求分析阶段

B.逻辑设计阶段

C.概念设计阶段

D.物理设计阶段

4.子模式DDL是用来描述（）。

A.数据库的总体逻辑结构

B.数据库的局部逻辑结构

C.数据库的物理存储结构

D.数据库的概念结构

5.数据库设计的概念设计阶段，表示概念结构的常用方法和描述工具是（）。

A.层次分析法和层次结构图

B.数据流程分析法和数据流程图

C.实体联系法和实体联系图

D.结构分析法和模块结构图

6.在E－R模型向关系模型转换时，M：N的联系转换为关系模式时，其关键字是（）。

A.M端实体的关键字

B.N端实体的关键字

C.M、N端实体的关键字组合D.重新选取其他属性

7.某学校规定，每一个班级最多有50名学生，至少有10名学生；每一名学生必须属于一个班级。在班级与学生实体的联系中，学生实体的基数是（）。

A.（0，1）

B.（1，1）

C.（1，10）

D.（10，50）

8.在关系数据库设计中，设计关系模式是数据库设计中（）阶段的任务。

A.逻辑设计阶段

B.概念设计阶段

C.物理设计阶段

D.需求分析阶段

9.关系数据库的规范化理论主要解决的问题是（）。

A.如何构造合适的数据逻辑结构

B.如何构造合适的数据物理结构

C.如何构造合适的应用程序界面

D.如何控制不同用户的数据操作权限

10.数据库设计可划分为七个阶段，每个阶段都有自己的设计内容，“为哪些关系，在哪些属性上、键什么样的索引”这一设计内容应该属于（）设计阶段。

A.概念设计

B.逻辑设计

C.物理设计

D.全局设计

11.假设设计数据库性能用“开销”，即时间、空间及可能的费用来衡量，则在数据库应用系统生存期中存在很多开销。其中，对物理设计者来说，主要考虑的是（）。

A.规划开销

B.设计开销

C.操作开销

D.维护开销

12.数据库物理设计完成后，进入数据库实施阶段，下述工作中，（）一般不属于实施阶段的工作。

A.建立库结构

B.系统调试

C.加载数据

D.扩充功能

13.从ER图导出关系模型时，如果实体间的联系是M：N的，下列说法中正确的是（）。

A.将N方关键字和联系的属性纳入M方的属性中 B.将M方关键字和联系的属性纳入N方的属性中

C.增加一个关系表示联系，其中纳入M方和N方的关键字

D.在M方属性和N方属性中均增加一个表示级别的属性

14.在ER模型中，如果有3个不同的实体集，3个M：N联系，根据ER模型转换为关系模型的规则，转换为关系的数目是（）。

A.4 B.5

C.6 D.7

参考答案：

(1)D(2)C(3)B(4)B(5)C(6)C(7)B(8)A(9)A(10)C(11)C(12)D(13)C(14)C

二、简答题

1.试述数据库设计过程。

*解析：希望同学能够认真阅读《概论》的内容，了解并掌握数据库设计过程。这里只概要列出数据库设计过程的六个阶段：

1)需求分析

2)概念结构设计

3)逻辑结构设计

4)数据库物理设计

5)数据库实施

6)数据库运行和维护

这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身，还包括数据库的实施、数据库运行和维护。

设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。

2.试述数据库设计过程的各个阶段上的设计描述。

*解析：这是进一步了解数据库设计的具体内容。设计描述是指在各个阶段体现设计内容，描述设计结果的各种文档、程序。

答：各阶段的设计要点如下：

1)需求分析：准确了解与分析用户需求（包括数据与处理）。

2)概念结构设计：通过对用户需求进行综合、归纳与抽象，形成一个独立于具体DBMS的概念模型。

3)逻辑结构设计：将概念结构转换为某个DBMS所支持的数据模型，并对其进行优化。

4)数据库物理设计：为逻辑数据模型选取一个最适合应用环境的物理结构（包括存储结构和存取方法）。

5)数据库实施：设计人员运用DBMS提供的数据语言、工具及宿主语言，根据逻辑设计和物理设计的结果建立数据库，编制与调试应用程序，组织数据入库，并进行试运行。

6)数据库运行和维护：在数据库系统运行过程中对其进行评价、调整与修改。

3.试述数据库设计过程中结构设计部分形成的数据库模式。

答：数据库结构设计的不同阶段形成数据库的各级模式，即：

在概念设计阶段形成独立于机器特点，独立于各个DBMS产品的概念模式，在本篇中就是E-R图；

在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型，如关系模型，形成数据库逻辑模式；然后在基本表的基础上再建立必要的视图(View)，形成数据的外模式；

在物理设计阶段，根据DBMS特点和处理的需要，进行物理存储安排，建立索引，形成数据库内模式。

概念模式是面向用户和设计人员的，属于概念模型的层次；逻辑模式、外模式、内模式是DBMS支持的模式，属于数据模型的层次。可以在DBMS中加以描述和存储。

4.试述数据库设计的特点。

答：数据库设计既是一项涉及多学科的综合性技术又是一项庞大的工程项目。其主要特点有：

1)数据库建设是硬件、软件和干件（技术与管理的界面）的结合。

2)从软件设计的技术角度看，数据库设计应该和应用系统设计相结合，也就是说，整个设计过程中要把结构（数据）设计和行为（处理）设计密切结合起来。

5.需求分析阶段的设计目标是什么？调查的内容是什么？

答：需求分析阶段的设计目标是通过详细调查现实世界要处理的对象（组织、部门、企业等），充分了解原系统（手工系统或计算机系统）工作概况，明确用户的各种需求，然后在此基础上确定新系统的功能。

调查的内容是“数据”和“处理”，即获得用户对数据库的如下要求：

（1）信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求，即在数据库中需要存储哪些数据。

（2）处理要求。指用户要完成什么处理功能，对处理的响应时间有什么要求，处理方式是批处理还是联机处理。

（3）安全性与完整性要求。

6.数据字典的内容和作用是什么？

答：数据字典是系统中各类数据描述的集合。数据字典的内容通常包括：数据项、数据结构、数据流、数据存储、处理过程五个部分

其中数据项是数据的最小组成单位，若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。

数据字典的作用：

数据字典是关于数据库中数据的描述，在需求分析阶段建立，是下一步进行概念设计的基础，并在数据库设计过程中不断修改、充实、完善。

（注意，数据库设计阶段形成的数据字典与后面讲到的数据字典不同，后者是DBMS关于数据库中数据的描述，当然两者是有联系的）。

7.什么是数据库的概念结构？试述其特点和设计策略。

答：概念结构是信息世界的结构，即概念模型，其主要特点是：

（1）能真实、充分地反映现实世界，包括事物和事物之间的联系，能满足用户对数据的处理要求。是对现实世界的一个真实模型。

（2）易于理解，从而可以用它和不熟悉计算机的用户交换意见，用户的积极参与是数据库的设计成功的关键。

（3）易于更改，当应用环境和应用要求改变时，容易对概念模型修改和扩充。

（4）易于向关系、网状、层次等各种数据模型转换。

概念结构的设计策略通常有四种：

• 自顶向下。即首先定义全局概念结构的框架，然后逐步细化；

• 自底向上。即首先定义各局部应用的概念结构，然后将它们集成起来，得到全局概念

结构；

• 逐步扩张。首先定义最重要的核心概念结构，然后向外扩充，以滚雪球的方式逐步生

成其他概念结构，直至总体概念结构；

• 混合策略。即将自顶向下和自底向上相结合，用自顶向下策略设计一个全局概念结构的

框架，以它为骨架集成由自底向上策略中设计的各局部概念结构。

8.什么叫数据抽象？试举例说明。

答：数据抽象是对实际的人、物、事和概念进行人为处理，抽取所关心的共同特性，忽略非本质的细节，并把这些特性用各种概念精确地加以描述，这些概念组成了某种模型。

如分类这种抽象是：定义某一类概念作为现实世界中一组对象的类型。这些对象具有某些共同的特性和行为。它抽象了对象值和型之间的“is member of”的语义。在E-R模型中，实体型就是这种抽象。例如在学校环境中，李英是老师，表示李英是教师类型中的一员，则教师是实体型，李英是教师实体型中的一个实体值，具有教师共同的特性和行为：在某个系某个专业教学，讲授某些课程，从事某个方向的科研。

9.试述数据库概念结构设计的重要性和设计步骤。

答：重要性：

数据库概念设计是整个数据库设计的关键，将在需求分析阶段所得到的应用需求首先抽

象为概念结构，以此作为各种数据模型的共同基础，从而能更好地、更准确地用某一DBMS实现这些需求。

设计步骤：

概念结构的设计方法有多种，其中最经常采用的策略是自底向上方法，该方法的设计步

骤通常分为两步：第1步是抽象数据并设计局部视图，第2步是集成局部视图，得到全局的概念结构

10.什么是E-R图？构成E-R图的基本要素是什么？

答： E-R图为实体-联系图，提供了表示实体型、属性和联系的方法，用来描述现实世界的概念模型。

构成E-R图的基本要素是实体型、属性和联系，其表示方法为：

• 实体型：用矩形表示，矩形框内写明实体名；

• 属性：用椭圆形表示，并用无向边将其与相应的实体连接起来；

• 联系：用菱形表示，菱形框内写明联系名，并用无向边分别与有关实体连接起来，同时在无向边旁标上联系的类型（1 : 1，1 : n或m : n）。

11.为什么要视图集成？视图集成的方法是什么？

答：在对数据库系统进行概念结构设计时一般采用自底向上的设计方法，把繁杂的大系统分解子系统。首先设计各个子系统的局部视图，然后通过视图集成的方式将各子系统有机的融合起来，综合成一个系统的总视图。这样设计清晰，由简到繁。由于数据库系统是从整体角度看待和描述数据的，因此数据不再面向某个应用而是整个系统。因此必须进行视图集成，使得数据库能被全系统的多个用户、多个应用共享使用。

一般说来，视图集成可以有两种方式：

• 多个分E-R图一次集成；

• 逐步集成，用累加的方式一次集成两个分E-R图。

无论采用哪种方式，每次集成局部E-R图时都需要分两步走：

（1）合并。解决各分E-R图之间的冲突，将各分E-R图合并起来生成初步E-R图。

（2）修改和重构。消除不必要的冗余，生成基本E-R图。

12.什么是数据库的逻辑结构设计？试述其设计步骤。

答：数据库的逻辑结构设计就是把概念结构设计阶段设计好的基本E-R图转换为与选用的DBMS产品所支持的数据模型相符合的逻辑结构。

设计步骤为：

（1）将概念结构转换为一般的关系、网状、层次模型；

（2）将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换；

（3）对数据模型进行优化。

13.试述把E-R图转换为DBTG模型和关系模型的转换规则。

答： E-R图向DBTG模型的转换规则：

1)每个实体型转换为记录型，实体的属性转换为记录的数据项；

2)实体型之间1：n（n≥1）的联系转换为一个系，没有任何联系的实体型转换为奇异系；

3)K（K≥2）个实体型之间多对多的联系，引入一个连结记录，形成K个实体型和连结记录之间的K个系。连结记录的属性由诸首记录的码及联系属性所组成；

4)同一实体型内的1：n，n：m联系，引入连结记录，转换为两个系。

*解析：根据我国实际，网状，层次数据库系统已很少使用，因此《概论》第三版把它们删去了，有关的主要概念放在第一章数据模型中介绍。对于DBTG模型的许多概念也介绍得很简单。本题的内容已经超出了书上的内容，同学们只要了解就可以了。但是，下面E-R图向关系模型的转换规则要求同学必须掌握，并且能够举一反三。

答： E-R图向关系模型的转换规则：

一个实体型转换为一个关系模式。实体的属性就是关系的属性，实体的码就是关系的码。

对于实体间的联系则有以下不同的情况：

（1）一个1：1联系可以转换为一个独立的关系模式，也可以与任意一端对应的关系模式合并。如果转换为一个独立的关系模式，则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性，每个实体的码均是该关系的候选码。如果与某一端实体对应的关系模式合并，则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的属性。

（2）一个1：n联系可以转换为一个独立的关系模式，也可以与n端对应的关系模式合并。如果转换为一个独立的关系模式，则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性，而关系的码为n端实体的码。

（3）一个m：n联系转换为一个关系模式。与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性，各实体码的组合组成该关系的码，或码的一部分。

（4）三个或三个以上实体间的一个多元联系可以转换为一个关系模式。与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性，而关系的码为各实体码的组合。

（5）具有相同码的关系模式可合并。

*14.你能给出由E-R图转换为IMS模型的转换规则吗？

答： E-R图向IMS模型的转换规则：

1)每个实体型转换为记录型，实体的属性转换为记录的数据项；

2)实体型之间1：n（n≥1）的联系转换记录型之间的有向边；

3)实体型之间m：n（m>1，n>1）的联系则分解成一对多联系，再根据2)转换；

4)K（K≥2）个实体型之间多对多的联系，可先转换成多对两个实体型之间的联系，再根据3)转换。

*解析：IMS是IBM公司的层次数据库管理系统。IMS模型是层次模型。E-R图向IMS模型转换的另一种方法是，先把E-R图转换为网状模型，再利用IMS逻辑数据库LDB的概念来表示网状模型。详细方法这里从略。

数据库恢复技术

一、选择题

1．一个事务的执行，要么全部完成，要么全部不做，一个事务中对数据库的所有操作都是一个不可分割的操作序列的属性是（）。

A.原子性

B.一致性

C.独立性

D.持久性

2．表示两个或多个事务可以同时运行而不互相影响的是（）。

A.原子性

B.一致性

C.独立性

D.持久性

3.事务的持续性是指（）

A.事务中包括的所有操作要么都做，要么都不做。

B.事务一旦提交，对数据库的改变是永久的。

C.一个事务内部的操作对并发的其他事务是隔离的。

D.事务必须是使数据库从一个一致性状态变到另一个一致性状态。

4．SQL语言中的COMMIT语句的主要作用是（）。

A.结束程序

B.返回系统

C.提交事务

D.存储数据

5．SQL语言中用（）语句实现事务的回滚

A.CREATE TABLE B.ROLLBACK

C.GRANT和REVOKE D.COMMIT

6．若系统在运行过程中，由于某种硬件故障，使存储在外存上的数据部分损失或全部损失，这种情况称为（）。

A.介质故障

B.运行故障

C.系统故障 D.事务故障

7．在DBMS中实现事务持久性的子系统是（）。

A.安全管理子系统

B.完整性管理子系统

C.并发控制子系统

D.恢复管理子系统

8.后援副本的作用是（）。

A.保障安全性

B.一致性控制

C.故障后的恢复

D.数据的转储

9．事务日志用于保存（）。

A.程序运行过程

B.程序的执行结果

C.对数据的更新操作

D.数据操作

10．数据库恢复的基础是利用转储的冗余数据。这些转储的冗余数据包括（）。

A.数据字典、应用程序、审计档案、数据库后备副本

B.数据字典、应用程序、审计档案、日志文件

C.日志文件、数据库后备副本

D.数据字典、应用程序、数据库后备副本

选择题答案：(1)A(2)C(3)B(4)C(5)B(6)A(7)D(8)C(9)C(10)C

二、简答题

1.试述事务的概念及事务的四个特性。

答：事务是用户定义的一个数据库操作序列，这些操作要么全做要么全不做,是一个不可分割的工作单位。

事务具有四个特性：原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持续性（Durability）。这个四个特性也简称为ACID特性。

原子性：事务是数据库的逻辑工作单位，事务中包括的诸操作要么都做，要么都不做。

一致性：事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。

隔离性：一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的，并发执行的各个事务之间不能互相干扰。

持续性：持续性也称永久性（Permanence），指一个事务一旦提交，它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。

2.为什么事务非正常结束时会影响数据库数据的正确性，请列举一例说明之。

答：事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。如果数据库系统运行中发生故障，有些事务尚未完成就被迫中断，这些未完成事务对数据库所做的修改有一部分已写入物理数据库，这时数据库就处于一种不正确的状态，或者说是不一致的状态。

例如某工厂的库存管理系统中，要把数量为Q的某种零件从仓库1移到仓库2存放。

则可以定义一个事务T，T包括两个操作；Q1=Q1-Q，Q2=Q2+Q。如果T非正常终止时只做了第一个操作，则数据库就处于不一致性状态，库存量无缘无故少了Q。

3.数据库中为什么要有恢复子系统？它的功能是什么？

答：因为计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏是不可避免的，这些故障轻则造成运行事务非正常中断，影响数据库中数据的正确性，重则破坏数据库，使数据库中全部或部分数据丢失，因此必须要有恢复子系统。

恢复子系统的功能是：把数据库从错误状态恢复到某一已知的正确状态（亦称为一致状态或完整状态）。

4．数据库运行中可能产生的故障有哪几类？哪些故障影响事务的正常执行？哪些故障破坏数据库数据？

答：数据库系统中可能发生各种各样的故障，大致可以分以下几类：

（1）事务内部的故障；

（2）系统故障；

（3）介质故障；

（4）计算机病毒。

事务故障、系统故障和介质故障影响事务的正常执行；介质故障和计算机病毒破坏数据

库数据。

5．据库恢复的基本技术有哪些？

答：数据转储和登录日志文件是数据库恢复的基本技术。

当系统运行过程中发生故障，利用转储的数据库后备副本和日志文件就可以将数据库恢复到故障前的某个一致性状态。

6.数据库转储的意义是什么？试比较各种数据转储方法。

答：数据转储是数据库恢复中采用的基本技术。所谓转储即DBA定期地将数据库复制到磁带或另一个磁盘上保存起来的过程。当数据库遭到破坏后可以将后备副本重新装入，将数据库恢复到转储时的状态。

静态转储：在系统中无运行事务时进行的转储操作。静态转储简单，但必须等待正运行的用户事务结束才能进行。同样，新的事务必须等待转储结束才能执行。显然，这会降低数据库的可用性。

动态转储：指转储期间允许对数据库进行存取或修改。动态转储可克服静态转储的缺点，它不用等待正在运行的用户事务结束，也不会影响新事务的运行。但是，转储结束时后援副本上的数据并不能保证正确有效。因为转储期间运行的事务可能修改了某些数据，使得后援副本上的数据不是数据库的一致版本。

为此，必须把转储期间各事务对数据库的修改活动登记下来，建立日志文件（log file）。这样，后援副本加上日志文件就能得到数据库某一时刻的正确状态。

转储还可以分为海量转储和增量转储两种方式。

海量转储是指每次转储全部数据库。增量转储则指每次只转储上一次转储后更新过的数据。从恢复角度看，使用海量转储得到的后备副本进行恢复一般说来更简单些。但如果数据库很大，事务处理又十分频繁，则增量转储方式更实用更有效。

7.什么是日志文件？为什么要设立日志文件？

答：（1）日志文件是用来记录事务对数据库的更新操作的文件。

（2）设立日志文件的目的是：进行事务故障恢复；进行系统故障恢复；协助后备副本进行介质故障恢复。

8.登记日志文件时为什么必须先写日志文件，后写数据库？

答：把对数据的修改写到数据库中和把表示这个修改的日志记录写到日志文件中是两个不同的操作。有可能在这两个操作之间发生故障，即这两个写操作只完成了一个。

如果先写了数据库修改，而在运行记录中没有登记这个修改，则以后就无法恢复这个修改了。如果先写日志，但没有修改数据库，在恢复时只不过是多执行一次UNDO操作，并不会影响数据库的正确性。所以一定要先写日志文件，即首先把日志记录写到日志文件中，然后写数据库的修改。

9.针对不同的故障，试给出恢复的策略和方法。（即如何进行事务故障的恢复？系统故障的恢复？介质故障恢复？）

答：事务故障的恢复：

事务故障的恢复是由DBMS自动完成的，对用户是透明的。

DBMS执行恢复步骤是：

（1）反向扫描文件日志（即从最后向前扫描日志文件），查找该事务的更新操作。

（2）对该事务的更新操作执行逆操作。即将日志记录中“更新前的值”写入数据库。

（3）继续反向扫描日志文件，做同样处理。

（4）如此处理下去，直至读到此事务的开始标记，该事务故障的恢复就完成了。

答：系统故障的恢复：

系统故障可能会造成数据库处于不一致状态：

一是未完成事务对数据库的更新可能已写入数据库；

二是已提交事务对数据库的更新可能还留在缓冲区，没来得及写入数据库。

因此恢复操作就是要撤销(UNDO)故障发生时未完成的事务，重做(REDO)已完成的事务。

系统的恢复步骤是：

（1）正向扫描日志文件，找出在故障发生前已经提交的事务队列（REDO队列）和未完成的事务队列（UNDO队列）。

（2）对撤销队列中的各个事务进行UNDO处理。

进行UNDO处理的方法是，反向扫描日志文件，对每个UNDO事务的更新操作执行逆操作，即将日志记录中“更新前的值”（Before Image）写入数据库。

（3）对重做队列中的各个事务进行REDO处理。

进行REDO处理的方法是：正向扫描日志文件，对每个REDO事务重新执行日志文件登记的操作。即将日志记录中“更新后的值”（After Image）写入数据库。

*解析：

在第（1）步中如何找出REDO队列和UNDO队列？请大家思考一下。

下面给出一个算法：

1）建立两个事务队列:

• UNDO-LIST: 需要执行undo操作的事务集合；

• REDO-LIST: 需要执行redo操作的事务集合；

两个事务队列初始均为空。

2）从日志文件头开始，正向扫描日志文件

• 如有新开始（遇到Begin Transaction）的事务Ti，把Ti暂时放入UNDO-LIST队列；

• 如有提交的事务（遇到End Transaction）Tj，把Tj从UNDO-LIST队列移到REDO-LIST队列；

直到日志文件结束

答：介质故障的恢复：

介质故障是最严重的一种故障。

恢复方法是重装数据库，然后重做已完成的事务。具体过程是：

（1）DBA装入最新的数据库后备副本（离故障发生时刻最近的转储副本），使数据库恢复到转储时的一致性状态。

（2）DBA装入转储结束时刻的日志文件副本

（3）DBA启动系统恢复命令，由DBMS完成恢复功能，即重做已完成的事务。

*解析

1）我们假定采用的是静态转储，因此第（1）步装入数据库后备副本便可以了。

2）如果采用的是静动态转储，第（1）步装入数据库后备副本还不够，还需同时装入转储开始时刻的日志文件副本，经过处理后才能得到正确的数据库后备副本。

3）第（2）步重做已完成的事务的算法是：

a.正向扫描日志文件，找出故障发生前已提交的事务的标识，将其记入重做队列

b.再一次正向扫描日志文件，对重做队列中的所有事务进行重做处理。即将日志记录中“更新后的值”写入数据库。

10.具有检查点的恢复技术有什么优点？

答：利用日志技术进行数据库恢复时，恢复子系统必须搜索日志，确定哪些事务需要REDO，哪些事务需要UNDO。一般来说，需要检查所有日志记录。这样做有两个问题：

一是搜索整个日志将耗费大量的时间。

二是很多需要REDO处理的事务实际上已经将它们的更新操作结果写到数据库中了，恢复子系统又重新执行了这些操作，浪费了大量时间。

检查点技术就是为了解决这些问题。

11.试述使用检查点方法进行恢复的步骤。

答： ① 从重新开始文件中找到最后一个检查点记录在日志文件中的地址，由该地址在日志文件中找到最后一个检查点记录。

② 由该检查点记录得到检查点建立时刻所有正在执行的事务清单ACTIVE-LIST。

这里建立两个事务队列:

• UNDO-LIST: 需要执行undo操作的事务集合；

• REDO-LIST: 需要执行redo操作的事务集合；

把ACTIVE-LIST暂时放入UNDO-LIST队列，REDO队列暂为空。

③ 从检查点开始正向扫描日志文件

• 如有新开始的事务Ti，把Ti暂时放入UNDO-LIST队列；

• 如有提交的事务Tj，把Tj从UNDO-LIST队列移到REDO-LIST队列，直到日志文件结束；

④ 对UNDO-LIST中的每个事务执行UNDO操作, 对REDO-LIST中的每个事务执行REDO操作。

12.什么是数据库镜像？它有什么用途？

答：数据库镜像即根据DBA的要求，自动把整个数据库或者其中的部分关键数据复制到另一个磁盘上。每当主数据库更新时，DBMS自动把更新后的数据复制过去，即DBMS自动保证镜像数据与主数据的一致性。

数据库镜像的用途有：

一是用于数据库恢复。当出现介质故障时，可由镜像磁盘继续提供使用，同时DBMS自动利用镜像磁盘数据进行数据库的恢复，不需要关闭系统和重装数据库副本。

二是提高数据库的可用性。在没有出现故障时，当一个用户对某个数据加排它锁进行修改时，其他用户可以读镜像数据库上的数据，而不必等待该用户释放锁。

*13.试述你了解的某一个实际的DBMS产品中采用的恢复策略。

答：下面简单介绍一下Oracle的恢复技术：

Oracle中恢复机制也采用了转储和登记日志文件两个技术。

Oracle向DBA提供了多种转储后备副本的方法，如文件拷贝、利用Oracle的Export实用程序、用SQL命令Spool以及自己编程实现等。相应地，Oracle也提供了多种重装后备副本的方法，如文件拷贝、利用Oracle的Import实用程序、利用SQL*LOADER以及自己编程实现等。

在Oracle 早期版本（V.5）中，日志文件以数据块为单位，也就是说，Oracle的恢复操作是基于数据块的，不是基于操作的。Oracle中记录数据库更新前的旧值的日志文件称为数据库前像文件（Before Image，简称BI文件），记录数据库更新后的新值的日志文件称为数据库的后像文件（After Image，简称AI文件）。BI文件是必须配置的，AI文件是可以任选的。

Oracle7为了能够在出现故障时更有效地恢复数据，也为了解决读“脏”数据问题，提供了REDO日志文件和回滚段(Rollback Segment)。REDO日志文件中记录了被更新数据的前像和后像。回滚段记录更新数据的前像，设在数据库缓冲区中。在利用日志文件进行故障恢复时，为减少扫描日志文件的遍数，Oracle7首先扫描REDO日志文件，重做所有操作，包括未正常提交的事务的操作，然后再根据回滚段中的数据，撤销未正常提交的事务的操作。

详细技术希望同学自己设法了解Oracle最新版本的介绍，例如通过INTERNET访问Oracle公司的网站。也可以了解其他DBMS厂商的产品情况。

*14.试用恢复的基本技术设计一个恢复子系统，给出这个子系统的恢复策略，包括：

(a)当产生某一类故障时如何恢复数据库的方法；

(b)日志文件的结构；

(c)登记日志文件的方法；

(d)利用日志文件恢复事务的方法；

(e)转储的类型；

(f)转储的后备副本和日志文件如何配合使用。

*解析：这是一个大作业。可以综合复习和运用学到的知识。设计一个恢复子系统。

例如，日志文件的结构你可以记录为单位，也可以以数据块为单位。不同的日志文件结构，登记的日志内容，日志文件恢复事务的方法也就不同了。

对于研究生，还应该上机模拟实现你设计的恢复子系统。

数据库并发控制

一、选择题

1．为了防止一个用户的工作不适当地影响另一个用户，应该采取（）。

A.完整性控制

B.访问控制

C.安全性控制

D.并发控制

2.解决并发操作带来的数据不一致问题普遍采用（）技术。

A.封锁

B.存取控制

C.恢复

D.协商

3．下列不属于并发操作带来的问题是（）。

A.丢失修改

B.不可重复读

C.死锁

D.脏读

4． DBMS普遍采用（）方法来保证调度的正确性。

A.索引

B.授权

C.封锁

D.日志

5．事务T在修改数据R之前必须先对其加X锁，直到事务结束才释放，这是（）。

A.一级封锁协议

B.二级封锁协议

C.三级封锁协议

D.零级封锁协议

6．如果事务T获得了数据项Q上的排他锁，则T对Q（）。

A.只能读不能写

B.只能写不能读

C.既可读又可写 D.不能读也不能写

7．设事务T1和T2，对数据库中地数据A进行操作，可能有如下几种情况，请问哪一种不会发生冲突操作（）。

A.T1正在写A，T2要读A

B.T1正在写A，T2也要写A

C.T1正在读A，T2要写A D.T1正在读A，T2也要读A

8．如果有两个事务，同时对数据库中同一数据进行操作，不会引起冲突的操作是（）。

A.一个是DELETE，一个是SELECT

B.一个是SELECT，一个是DELETE

C.两个都是UPDATE

D.两个都是SELECT

9．在数据库系统中，死锁属于（）。

A.系统故障

B.事务故障

C.介质故障 D.程序故障

参考答案：(1)D(2)A(3)C(4)C(5)A(6)C(7)D(8)D(9)B

二、简答题

1.在数据库中为什么要并发控制？

答：数据库是共享资源，通常有许多个事务同时在运行。

当多个事务并发地存取数据库时就会产生同时读取和/或修改同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据，破坏数据库的一致性。所以数据库管理系统必须提供并发控制机制。

2.并发操作可能会产生哪几类数据不一致？用什么方法能避免各种不一致的情况？

答：并发操作带来的数据不一致性包括三类：丢失修改、不可重复读和读“脏”数据。

（1）丢失修改（Lost Update）

两个事务T1和T2读入同一数据并修改，T2提交的结果破坏了（覆盖了）T1提交的结果，导致T1的修改被丢失。

（2）不可重复读（Non-Repeatable Read）

不可重复读是指事务T1读取数据后，事务T2执行更新操作，使T1无法再现前一次读取结果。

（3）读“脏”数据（Dirty Read）

读“脏”数据是指事务T1修改某一数据，并将其写回磁盘，事务T2读取同一数据后，T1由于某种原因被撤销，这时T1已修改过的数据恢复原值，T2读到的数据就与数据库中的数据不一致，则T2读到的数据就为“脏”数据，即不正确的数据。

避免不一致性的方法和技术就是并发控制。最常用的并发控制技术是封锁技术。

也可以用其他技术，例如在分布式数据库系统中可以采用时间戳方法来进行并发控制。

3.什么是封锁？

答：封锁就是事务T在对某个数据对象例如表、记录等操作之前，先向系统发出请求，对其加锁。加锁后事务T就对该数据对象有了一定的控制，在事务T释放它的锁之前，其他的事务不能更新此数据对象。

封锁是实现并发控制的一个非常重要的技术。

4.基本的封锁类型有几种？试述它们的含义。

答：基本的封锁类型有两种: 排它锁(Exclusive Locks，简称X锁)和共享锁(Share Locks，简称S锁)。

排它锁又称为写锁。若事务T对数据对象A加上X锁，则只允许T读取和修改A，其他任何事务都不能再对A加任何类型的锁，直到T释放A上的锁。这就保证了其他事务在T释放A上的锁之前不能再读取和修改A。

共享锁又称为读锁。若事务T对数据对象A加上S锁，则事务T可以读A但不能修改A，其他事务只能再对A加S锁，而不能加X锁，直到T释放A上的S锁。这就保证了其他事务可以读A，但在T释放A上的S锁之前不能对A做任何修改。

5.什么是封锁协议？不同级别的封锁协议的主要区别是什么？

答：在运用封锁技术对数据加锁时，要约定一些规则。例如，在运用X锁和S锁对数据对象加锁时，要约定何时申请X锁或S锁、何时释放封锁等。这些约定或者规则称为封锁协议（Locking Protocol）。对封锁方式约定不同的规则，就形成了各种不同的封锁协议。不同级别的封锁协议，例如《概论》中介绍的三级封锁协议，三级协议的主要区别在于什么操作需要申请封锁，何时申请封锁以及何时释放锁（即持锁时间的长短）。

一级封锁协议：事务T在修改数据R之前必须先对其加X锁，直到事务结束才释放。

二级封锁协议：一级封锁协议加上事务T在读取数据R之前必须先对其加S锁，读完后即可释放S锁。

三级封锁协议：一级封锁协议加上事务T在读取数据R之前必须先对其加S锁，直到事务结束才释放。

6.不同封锁协议与系统一致性级别的关系是什么？

答：不同的封锁协议对应不同的一致性级别。

一级封锁协议可防止丢失修改，并保证事务T是可恢复的。在一级封锁协议中，对读数据是不加S锁的，所以它不能保证可重复读和不读“脏”数据。

二级封锁协议除防止了丢失修改，还可进一步防止读“脏”数据。在二级封锁协议中，由于读完数据后立即释放S锁，所以它不能保证可重复读。

在三级封锁协议中，无论是读数据还是写数据都加长锁，即都要到事务结束时才释放封锁。所以三级封锁协议除防止了丢失修改和不读“脏”数据外，还进一步防止了不可重复读。

7.试述活锁的产生原因和解决方法。

答：活锁产生的原因：当一系列封锁不能按照其先后顺序执行时，就可能导致一些事务无限期等待某个封锁，从而导致活锁。

避免活锁的简单方法是采用先来先服务的策略。当多个事务请求封锁同一数据对象时，封锁子系统按请求封锁的先后次序对事务排队，数据对象上的锁一旦释放就批准申请队列中第一个事务获得锁。

8.请给出预防死锁的若干方法。

答：在数据库中，产生死锁的原因是两个或多个事务都已封锁了一些数据对象，然后又都请求已被其他事务封锁的数据加锁，从而出现死等待。

防止死锁的发生其实就是要破坏产生死锁的条件。预防死锁通常有两种方法：

（1）一次封锁法

要求每个事务必须一次将所有要使用的数据全部加锁，否则就不能继续执行。

（2）顺序封锁法

预先对数据对象规定一个封锁顺序，所有事务都按这个顺序实行封锁。

不过，预防死锁的策略不大适合数据库系统的特点。

9.请给出检测死锁发生的一种方法，当发生死锁后如何解除死锁？

答：数据库系统一般采用允许死锁发生，DBMS检测到死锁后加以解除的方法。

DBMS中诊断死锁的方法与操作系统类似，一般使用超时法或事务等待图法。

超时法是：如果一个事务的等待时间超过了规定的时限，就认为发生了死锁。超时法实现简单，但有可能误判死锁，事务因其他原因长时间等待超过时限时，系统会误认为发生了死锁。若时限设置得太长，又不能及时发现死锁发生。

DBMS并发控制子系统检测到死锁后，就要设法解除。通常采用的方法是选择一个处理死锁代价最小的事务，将其撤消，释放此事务持有的所有锁，使其他事务得以继续运行下去。当然，对撤销的事务所执行的数据修改操作必须加以恢复。

10.什么样的并发调度是正确的调度？

答：可串行化（Serializable）的调度是正确的调度。

可串行化的调度的定义：多个事务的并发执行是正确的，当且仅当其结果与按某一次序串行地执行它们时的结果相同，我们称这种调度策略为可串行化的调度。

11.试述两段锁协议的概念。

答：两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁。

• 在对任何数据进行读、写操作之前，首先要申请并获得对该数据的封锁；

• 在释放一个封锁之后，事务不再申请和获得任何其他封锁。

“两段”的含义是，事务分为两个阶段：

第一阶段是获得封锁，也称为扩展阶段。在这阶段，事务可以申请获得任何数据项上的任何类型的锁，但是不能释放任何锁。

第二阶段是释放封锁，也称为收缩阶段。在这阶段，事务释放已经获得的锁，但是不能再申请任何锁。

12.为什么要引进意向锁？意向锁的含义是什么？

答：引进意向锁是为了提高封锁子系统的效率。该封锁子系统支持多种封锁粒度。

原因是：在多粒度封锁方法中一个数据对象可能以两种方式加锁—显式封锁和隐式封锁。因此系统在对某一数据对象加锁时不仅要检查该数据对象上有无（显式和隐式）封锁与之冲突；还要检查其所有上级结点和所有下级结点，看申请的封锁是否与这些结点上的（显式和隐式）封锁冲突；显然，这样的检查方法效率很低。为此引进了意向锁。

意向锁的含义是：对任一结点加锁时，必须先对它的上层结点加意向锁。

例如事务T要对某个元组加X锁，则首先要对关系和数据库加IX锁。换言之，对关系和数据库加IX锁，表示它的后裔结点—某个元组拟（意向）加X锁。

引进意向锁后，系统对某一数据对象加锁时不必逐个检查与下一级结点的封锁冲突了。例如，事务T要对关系R加X锁时，系统只要检查根结点数据库和R本身是否已加了不相容的锁（如发现已经加了IX，则与X冲突），而不再需要搜索和检查R中的每一个元组是否加了X锁或S锁。

13.试述常用的意向锁：IS锁，IX锁，SIX锁，给出这些锁的相容矩阵。

答： IS锁：如果对一个数据对象加IS锁，表示它的后裔结点拟（意向）加S锁。例如，要对某个元组加S锁，则要首先对关系和数据库加IS锁

IX锁：如果对一个数据对象加IX锁，表示它的后裔结点拟（意向）加X锁。例如，要对某个元组加X锁，则要首先对关系和数据库加IX锁。

SIX锁：如果对一个数据对象加SIX锁，表示对它加S锁，再加IX锁，即SIX = S + IX。

相容矩阵（略）

14.理解并解释下列术语的含义：封锁，活锁，死锁，排它锁，共享锁，并发事务的调度，可串行化的调度，两段锁协议。

答：（略，已经在上面有关习题中解答）

*１5.试述你了解的某一个实际的DBMS产品的并发控制机制。

答：（略）

数据库安全性

一、选择题

1.以下（）不属于实现数据库系统安全性的主要技术和方法。

A.存取控制技术

B.视图技术

C.审计技术 D.出入机房登记和加锁

2． SQL中的视图提高了数据库系统的（）。

A.完整性

B.并发控制

C.隔离性

D.安全性

3． SQL语言的GRANT和REMOVE语句主要是用来维护数据库的（）。

A.完整性

B.可靠性

C.安全性

D.一致性

4.在数据库的安全性控制中，授权的数据对象的（），授权子系统就越灵活。

A.范围越小

B.约束越细致

C.范围越大

D.约束范围大

选择题答案：

(1)D(2)D(3)C(4)A

三、简答题

1.什么是数据库的安全性？

答：数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。

2.数据库安全性和计算机系统的安全性有什么关系？

答：安全性问题不是数据库系统所独有的，所有计算机系统都有这个问题。只是在数据库系统中大量数据集中存放，而且为许多最终用户直接共享，从而使安全性问题更为突出。

系统安全保护措施是否有效是数据库系统的主要指标之一。

数据库的安全性和计算机系统的安全性，包括操作系统、网络系统的安全性是紧密联系、相互支持的，3.试述实现数据库安全性控制的常用方法和技术。

答：实现数据库安全性控制的常用方法和技术有：

1)用户标识和鉴别：该方法由系统提供一定的方式让用户标识自己的名字或身份。每次用户要求进入系统时，由系统进行核对，通过鉴定后才提供系统的使用权。

2)存取控制：通过用户权限定义和合法权检查确保只有合法权限的用户访问数据库，所有未被授权的人员无法存取数据。例如C2级中的自主存取控制（DAC），B1级中的强制存取控制（MAC）；

3)视图机制：为不同的用户定义视图，通过视图机制把要保密的数据对无权存取的用户隐藏起来，从而自动地对数据提供一定程度的安全保护。

4)审计：建立审计日志，把用户对数据库的所有操作自动记录下来放入审计日志中，DBA可以利用审计跟踪的信息，重现导致数据库现有状况的一系列事件，找出非法存取数据的人、时间和内容等。

5)数据加密：对存储和传输的数据进行加密处理，从而使得不知道解密算法的人无法获知数据的内容。

具体内容请参见《概论》9.2。

4.什么是数据库中的自主存取控制方法和强制存取控制方法？

答：自主存取控制方法：定义各个用户对不同数据对象的存取权限。当用户对数据库访问时首先检查用户的存取权限。防止不合法用户对数据库的存取。

强制存取控制方法：每一个数据对象被（强制地）标以一定的密级，每一个用户也被（强制地）授予某一个级别的许可证。系统规定只有具有某一许可证级别的用户才能存取某一个密级的数据对象。

*解析：自主存取控制中自主的含义是：用户可以将自己拥有的存取权限“自主”地授予别人。即用户具有一定的“自主”权。

5.SQL语言中提供了哪些数据控制（自主存取控制）的语句？请试举几例说明它们的使用方法。

答：SQL中的自主存取控制是通过GRANT 语句和 REVOKE 语句来实现的。如：

GRANT SELECT，INSERT ON Student TO 王平WITH GRANT OPTION；

就将Student表的SELECT和INSERT权限授予了用户王平，后面的“WITH GRANT OPTION”子句表示用户王平同时也获得了“授权”的权限，即可以把得到的权限继续授予其他用户。

REVOKE INSERT ON Student FROM 王平CASCADE；

就将Student表的INSERT权限从用户王平处收回，选项 CASCADE 表示，如果用户王平将 Student 的 INSERT 权限又转授给了其他用户，那么这些权限也将从其他用户处收回。

6.今有两个关系模式：

职工（职工号，姓名，年龄，职务，工资，部门号）

部门（部门号，名称，经理名，地址，电话号）

请用SQL的GRANT和REVOKE语句（加上视图机制）完成以下授权定义或存取控制功能：

(a)用户王明对两个表有SELECT权力；

GRANT SELECT ON 职工，部门 TO 王明；

(b)用户李勇对两个表有INSERT和DELETE权力；

GRANT INSERT，DELETE ON 职工，部门 TO 李勇；

(c)*每个职工只对自己的记录有SELECT权力；

GRANT SELECT ON 职工 WHEN USER（）= NAME TO ALL；

这里假定系统的GRANT语句支持WHEN子句和USER（）的使用。用户将自己的名字作为ID。注意，不同的系统这些扩展语句可能是不同的。读者应该了解你使用的DBMS产品的扩展语句。

(d)用户刘星对职工表有SELECT权力，对工资字段具有更新权力；

GRANT SELECT，UPDATE（工资）ON 职工 TO 刘星；

(e)用户张新具有修改这两个表的结构的权力；

GRANT ALTER TABLE ON 职工，部门 TO 张新；

(f)用户周平具有对两个表所有权力(读，插，改，删数据)，并具有给其他用户授权的权力；

GRANT ALL PRIVILIGES ON 职工，部门 TO 周平WITH GRANT OPTION；

(g)用户杨兰具有从每个部门职工中SELECT最高工资，最低工资，平均工资的权力，他不能查看每个人的工资。

答：首先建立一个视图。然后对这个视图定义杨兰的存取权限。

CREATE VIEW 部门工资 AS

SELECT 部门.名称，MAX（工资），MIN（工资），AVG（工资）

FROM 职工，部门

WHERE 职工.部门号 = 部门.部门号

GROUP BY 职工.部门号；

GRANT SELECT ON 部门工资 TO 杨兰；

7.把习题8中(a)~(g)的每一种情况，撤销各用户所授予的权力。

答：(a)REVOKE SELECT ON 职工，部门 FROM 王明；

(b)REVOKE INSERT，DELETE ON 职工，部门 FROM 李勇；

(c)REOVKE SELECT ON 职工 WHEN USER（）= NAME FROM ALL；

这里假定用户将自己的名字作为ID，且系统的REOVKE语句支持WHEN子句，系统也支持USER（）的使用。

(d)REVOKE SELECT，UPDATE ON 职工 FROM 刘星；

(e)REVOKE ALTER TABLE ON 职工，部门 FROM 张新；

(f)REVOKE ALL PRIVILIGES ON 职工，部门 FROM 周平；

(g)REVOKE SELECT ON 部门工资 FROM 杨兰；

DROP VIEW 部门工资；

8.为什么强制存取控制提供了更高级别的数据库安全性？

答：强制存取控制（MAC）是对数据本身进行密级标记，无论数据如何复制，标记与数据是一个不可分的整体，只有符合密级标记要求的用户才可以操纵数据，从而提供了更高级别的安全性。

9.理解并解释MAC机制中主体、客体、敏感度标记的含义。

答：主体是系统中的活动实体，既包括DBMS所管理的实际用户，也包括代表用户的各进程。

客体是系统中的被动实体，是受主体操纵的，包括文件、基表、索引、视图等。

对于主体和客体，DBMS为它们每个实例（值）指派一个敏感度标记（Label）。敏感度标记被分成若干级别，例如绝密（Top Secret）、机密（Secret）、可信（Confidential）、公开（Public）等。主体的敏感度标记称为许可证级别（Clearance Level），客体的敏感度标记称为密级（Classification Level）。

10.什么是数据库的审计功能，为什么要提供审计功能？

答：审计功能指DBMS的审计模块在用户对数据库执行操作的同时把所有操作自动记录到系统的审计日志中。

因为任何系统的安全保护措施都不是完美无缺的，蓄意盗窃破坏数据的人总可能存在。利用数据库的审计功能，DBA可以根据审计跟踪的信息，重现导致数据库现有状况的一系列事件，找出非法存取数据的人、时间和内容等。

11.统计数据库中存在何种特殊的安全性问题？

答：统计数据库允许用户查询聚集类型的信息，如合计、平均值、最大值、最小值等，不允许查询单个记录信息。但是，人们可以从合法的查询中推导出不合法的信息，即可能存在隐蔽的信息通道，这是统计数据库要研究和解决的特殊的安全性问题。

*12.试述你了解的某一个实际的DBMS产品的安全性措施。

答：不同的DBMS产品以及同一产品的不同版本的安全措施各不相同，仁者见仁，智者见智，请读者自己了解。《概论》上9.4 简单介绍了有关ORACLE数据库的安全性措施。

数据库完整性

一、选择题

1．完整性检查和控制的防范对象（），防止它们进入数据库。安全性控制的防范对象是（），防止他们对数据库数据的存取。

A.不合语义的数据

B.非法用户

C.不正确的数据

D.非法操作

2．下述哪个是SQL语言中的数据控制命令（）。

A.GRANT B.COMMIT

C.UPDATE D.SELECT

3．下述SQL语言中的权限，哪一个允许用户定义新关系时，引用其他关系的主码作为外码（）。

A.INSERT

B.DELETE

C.REFERENCES D.SELECT

参考答案：(1)A C B D(2)A(3)C

二、简答题

1.什么是数据库的完整性？

答：数据库的完整性是指数据的正确性和相容性。

2.数据库的完整性概念与数据库的安全性概念有什么区别和联系？

答：数据的完整性和安全性是两个不同的概念，但是有一定的联系。

前者是为了防止数据库中存在不符合语义的数据，防止错误信息的输入和输出，即所谓垃圾进垃圾出（Garbage In Garbage Out）所造成的无效操作和错误结果。

后者是保护数据库防止恶意的破坏和非法的存取。

也就是说，安全性措施的防范对象是非法用户和非法操作，完整性措施的防范对象是不合语义的数据。

3.什么是数据库的完整性约束条件？可分为哪几类？

答：完整性约束条件是指数据库中的数据应该满足的语义约束条件。

一般可以分为六类：

静态列级约束、静态元组约束、静态关系约束、动态列级约束、动态元组约束、动态关系约束。

静态列级约束是对一个列的取值域的说明，包括以下几方面：

1.对数据类型的约束，包括数据的类型、长度、单位、精度等

2.对数据格式的约束

3.对取值范围或取值集合的约束。

4.对空值的约束

5.其他约束

静态元组约束就是规定组成一个元组的各个列之间的约束关系，静态元组约束只局限在单个元组上。

静态关系约束是在一个关系的各个元组间或者若干关系间常常存在各种联系或约束。常见的静态关系约束有：

1.实体完整性约束。

2.参照完整性约束。•

3.函数依赖约束。

动态列级约束是修改列定义或列值时应满足的约束条件，包括下面两方面：

1.修改列定义时的约束

2.修改列值时的约束

动态元组约束是指修改某个元组的值时需要参照其旧值，并且新旧值之间需要满足某种约束条件。

动态关系约束是加在关系变化前后状态上的限制条件，例如事务一致性、原子性等约束条件。

详细内容可以参见《概论》10.1中的介绍。

4.DBMS的完整性控制机制应具有哪些功能？

答：DBMS的完整性控制机制应具有三个方面的功能：

1）.定义功能，即提供定义完整性约束条件的机制。

2.检查功能，即检查用户发出的操作请求是否违背了完整性约束条件。

3）.违约反应：如果发现用户的操作请求使数据违背了完整性约束条件，则采取一定的动作来保证数据的完整性。

5.RDBMS在实现参照完整性时需要考虑哪些方面？

答： RDBMS在实现参照完整性时需要考虑以下几个方面：

1）外码是否可以接受空值

2）删除被参照关系的元组时的考虑，这时系统可能采取的作法有三种：

（a）级联删除（CASCADES）；

（b）受限删除（RESTRICTED）；

（c）置空值删除（NULLIFIES）

3）在参照关系中插入元组时的问题，这时系统可能采取的作法有：

（a）受限插入

（b）递归插入

4）修改关系中主码的问题

一般是不能用UPDATE语句修改关系主码的。如果需要修改主码值，只能先删除该元组，然后再把具有新主码值的元组插入到关系中。

如果允许修改主码，首先要保证主码的唯一性和非空，否则拒绝修改。然后要区分是参照关系还是被参照关系。

详细讨论可以参见《概论》10.2。

6.假设有下面两个关系模式：

职工（职工号，姓名，年龄，职务，工资，部门号），其中职工号为主码；

部门（部门号，名称，经理名，电话），其中部门号为主码；

用SQL语言定义这两个关系模式，要求在模式中完成以下完整性约束条件的定义：

定义每个模式的主码；定义参照完整性；定义职工年龄不得超过60岁。

答：CREATE TABLE DEPT

(Deptno NUMBER(2)，Deptname VARCHAR(10)，Manager VARCHAR(10)，PhoneNumber Char(12)

CONSTRAINT PK_SC PRIMARY KEY(Deptno));

CREATE TABLE EMP

(Empno NUMBER(4)，Ename VARCHAR(10)，Age NUMBER(2)，CONSTRAINT C1 CHECK(Age《＝60)，Job VARCHAR(9)，Sal NUMBER(7,2)，Deptno NUMBER(2)，CONSTRAINT FK_DEPTNO

FOREIGN KEY(Deptno)

REFERENCES DEPT(Deptno))；

7．关系系统中，当操作违反实体完整性、参照完整性和用户定义的完整性约束条件时，一般是如何分别进行处理的？

答：对于违反实体完整性和用户定义的完整性的操作一般都采用拒绝执行的方式进行处理。而对于违反参照完整性的操作，并不都是简单地拒绝执行，有时要根据应用语义执行一些附加的操作，以保证数据库的正确性。具体的处理可以参见上面第5题或《概论》10.2中相应部分。

*8.试述你了解的某一个实际的DBMS产品的完整性控制策略。

答：不同的DBMS产品以及同一产品的不同版本的完整性控制策略各不相同，读者要去了解某一个DBMS产品的完整性控制策略。

数据库系统概论习题集

第一章绪论

一、选择题

1.DBS是采用了数据库技术的计算机系统，它是一个集合体，包含数据库、计算机硬件、软件和（）。

A.系统分析员

B.程序员 C.数据库管理员

D.操作员

2.数据库（DB），数据库系统（DBS）和数据库管理系统（DBMS）之间的关系是（）。

A.DBS包括DB和DBMS

B.DBMS包括DB和DBS

C.DB包括DBS和DBMS D.DBS就是DB，也就是DBMS

3.下面列出的数据库管理技术发展的三个阶段中，没有专门的软件对数据进行管理的是（）。

I．人工管理阶段

II．文件系统阶段

III．数据库阶段

A.I 和 II

B.只有 II C.II 和 III

D.只有 I

4.下列四项中，不属于数据库系统特点的是（）。

A.数据共享

B.数据完整性

C.数据冗余度高

D.数据独立性高

5.数据库系统的数据独立性体现在（）。

A.不会因为数据的变化而影响到应用程序

B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序

C.不会因为存储策略的变化而影响存储结构

D.不会因为某些存储结构的变化而影响其他的存储结构

6.描述数据库全体数据的全局逻辑结构和特性的是（）。

A.模式

B.内模式 C.外模式 D.用户模式

7.要保证数据库的数据独立性，需要修改的是（）。

A.模式与外模式

B.模式与内模式

C.三层之间的两种映射 D.三层模式

8.要保证数据库的逻辑数据独立性，需要修改的是（）。

A.模式与外模式的映射

B.模式与内模式之间的映射

C.模式

D.三层模式

9.用户或应用程序看到的那部分局部逻辑结构和特征的描述是（），它是模式的逻辑子集。

A.模式

B.物理模式

C.子模式 D.内模式

10.下述（）不是DBA数据库管理员的职责。

A.完整性约束说明 B.定义数据库模式

C.数据库安全 D.数据库管理系统设计

选择题参考答案：(1)C(2)A(3)D(4)C(5)B(6)A(7)C(8)A(9)C(10)D

二、简答题

１．试述数据、数据库、数据库系统、数据库管理系统的概念。

数据：描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。

数据与其语义是不可分的。500这个数字可以表示一件物品的价格是500元，也可以表示一个学术会议参加的人数有500人。还可以表示一袋奶粉重500克。

*解析：简单地讲，数据数据库数据具有永久储存、有组织和可共享三个特点。

数据模型是数据库的核心概念。每个数据库中数据的都是按照某一种数据模型来组织的。

２．使用数据库系统有什么好处？

使用数据库系统的好处是由数据库管理系统的特点或优点决定的。

使用数据库系统的好处很多，例如可以大大提高应用开发的效率，方便用户的使用，减轻数据库系统管理人员维护的负担等。

３．试述文件系统与数据库系统的区别和联系。

文件系统与数据库系统的区别：文件系统面向某一应用程序，共享性差、冗余度大，独立性差，纪录内有结构、整体无结构，应用程序自己控制。

读者可以参考《概论》书中表1.1 中的有关内容。

文件系统与数据库系统的联系是：文件系统与数据库系统都是计算机系统中管理数据的软件。

*解析：

４．举出适合用文件系统而不是数据库系统的例子；再举出适合用数据库系统的应用例子。

·适用于文件系统而不是数据库系统的应用例子

数据的备份，软件或应用程序使用过程中的临时数据存储一般使用文件比较合适。早期功能比较简单、比较固定的应用系统也适合用文件系统。

·适用于数据库系统而非文件系统的应用例子

５．试述数据库系统的特点。

数据库系统的主要特点有：

一、数据结构化：数据库系统实现整体数据的结构化，这是数据库的主要特征之一，也是数据库系统与文件系统的本质区别。

*解析：

数据共享可以大大减少数据冗余，节约存储空间，同时还能够避免数据之间的不相容性与不一致性。

所谓“数据面向某个应用”是指数据结构是针对某个应用设计的，只被这个应用程序或应用系统使用。可以说数据是某个应用的“私有资源”。

所谓“弹性大”是指系统容易扩充也容易收缩，即应用增加或减少时不必修改整个数据库的结构，或者只要做很少的修改。

我们可以取整体数据的各种子集用于不同的应用系统，当应用需求改变或增加时，只要重新选取不同的子集或加上一部分数据便可以满足新的需求。

*解析：

DBMS数据控制功能包括四个方面：

数据的安全性保护：保护数据以防止不合法的使用造成的数据的泄密和破坏；

数据的完整性检查：将数据控制在有效的范围内或保证数据之间满足一定的关系；

并发控制：对多用户的并发操作加以控制和协调，保证并发操作的正确性；

下面我们可以得到“什么是数据库”的一个定义：

数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。

６．数据库管理系统的主要功能有哪些？

①数据库定义功能；

②数据存取功能；

③数据库运行管理；

④数据库的建立和维护功能。

７．试述数据模型的概念、数据模型的作用和数据模型的三个要素。

数据模型是数据库中用来对现实世界进行抽象的工具，是数据库中用于提供信息表示和操作手段的形式构架。

①数据结构：是所研究的对象类型的集合，是对系统的静态特性的描述。

②数据操作：是指对数据库中各种对象（型）的实例（值）允许进行的操作的集合，包括操作及有关的操作规则，是对系统动态特性的描述。

*解析：

数据模型是数据库系统中最重要的概念之一。同学们必须通过《概论》的学习真正掌握

数据模型的概念和作用。

数据模型是数据库系统的基础。任何一个DBMS都以某一个数据模型为基础，或者说支持某一个数据模型。

８．试述概念模型的作用。

９．定义并解释概念模型中以下术语：

实体，实体型，实体集，属性，码，实体联系图（E-R图）

实体：客观存在并可以相互区分的事物叫实体。

实体型：具有相同属性的实体具有相同的特征和性质，用实体名及其属性名集合来抽象和刻画同类实体称为实体型。

实体集：同型实体的集合称为实体集。

属性：实体所具有的某一特性，一个实体可由若干个属性来刻画。

码：唯一标识实体的属性集称为码。

实体联系图：E-R图提供了表示实体型、属性和联系的方法：

· 实体型：用矩形表示，矩形框内写明实体名。

· 属性：用椭圆形表示，并用无向边将其与相应的实体连接起来。

·联系：用菱形表示，菱形框内写明联系名，并用无向边分别与有关实体连接起来，同时在无向边旁标上联系的类型（1 : 1，1 : n或m : n）。

10．试给出三个实际部门的E-R图，要求实体型之间具有一对一，一对多，多对多各种不同的联系。

关系数据库

一、选择题

1.下面的选项不是关系数据库基本特征的是（）。

A.不同的列应有不同的数据类型

B.不同的列应有不同的列名

C.与行的次序无关

D.与列的次序无关

2.一个关系只有一个（）。

A.候选码

B.外码

C.超码

D.主码

3.关系模型中，一个码是（）。

A.可以由多个任意属性组成 B.至多由一个属性组成

C.可有多个或者一个其值能够唯一表示该关系模式中任何元组的属性组成D.以上都不是

4.现有如下关系：

患者（患者编号，患者姓名，性别，出生日起，所在单位）

医疗（患者编号，患者姓名，医生编号，医生姓名，诊断日期，诊断结果）

其中，医疗关系中的外码是（）。

A.患者编号

B.患者姓名

C.患者编号和患者姓名

D.医生编号和患者编号

A.书号

B.读者号

C.书号+读者号

D.书号+读者号+借期

6.关系模型中实现实体间 N：M 联系是通过增加一个（）。

A.关系实现

B.属性实现

C.关系或一个属性实现

D.关系和一个属性实现

7.关系代数运算是以（）为基础的运算。

A.关系运算

B.谓词演算

C.集合运算

D.代数运算

8.关系数据库管理系统应能实现的专门关系运算包括（）。

A.排序、索引、统计

B.选择、投影、连接 C.关联、更新、排序

D.显示、打印、制表

9.五种基本关系代数运算是（）。

A.∪ － × σ π

B.∪ － σ π

C.∪ ∩ × σ π

D.∪ ∩ σ π

10.关系代数表达式的优化策略中，首先要做的是（）。

A.对文件进行预处理

B.尽早执行选择运算

C.执行笛卡尔积运算

D.投影运算

11.关系数据库中的投影操作是指从关系中（）。

A.抽出特定记录

B.抽出特定字段

C.建立相应的影像

D.建立相应的图形

12.从一个数据库文件中取出满足某个条件的所有记录形成一个新的数据库文件的操作是（）操作。

A.投影

B.联接

C.选择

D.复制

13.关系代数中的联接操作是由（）操作组合而成。

A.选择和投影 B.选择和笛卡尔积

C.投影、选择、笛卡尔积

D.投影和笛卡尔积

14.自然联接是构成新关系的有效方法。一般情况下，当对关系R和S是用自然联接时，要求R和S含有一个或者多个共有的（）。

A.记录

B.行

C.属性

D.元组

15.假设有关系R和S，在下列的关系运算中，（）运算不要求：“R和S具有相同的元数，且它们的对应属性的数据类型也相同”。

A.R∩S

B.R∪S

C.R－S

D.R×S

16.假设有关系R和S，关系代数表达式R－（R－S）表示的是（）。

A.R∩S

B.R∪S

C.R－S

D.R×S

17.下面列出的关系代数表达是中，那些式子能够成立（）。

ⅰ.σf1(σf2(E))= σf1∧f2(E)

ⅱ.E1∞E2 = E2∞E1

ⅲ.(E1∞E2)∞E3 = E1∞(E2∞E3)

ⅳ.σf1(σf2(E))=σf2(σf1(E))

A.全部

B.ⅱ和ⅲ C.没有

D.ⅰ和ⅳ

18.下面四个关系表达式是等价的，是判别它们的执行效率（）。

E1 =πA(σ B=C ∧ D=E′(R×S))

E2 =πA(σ B=C(R× σD=E′(S))

E3 =πA(R∞B=CσD=E′(S))

E3 =πA(σD=E′(R∞B=C S))

A.E3最快

B.E2最快 C.E4最快 D.E1最快

19.有关系SC（S_ID，C_ID，AGE，SCORE），查找年龄大于22岁的学生的学号和分数，正确的关系代数表达式是（）。

ⅰ.πS_ID，SCORE(σ age>22(SC))

ⅱ.σ age>22(πS_ID，SCORE(SC))

ⅲ.πS_ID，SCORE(σ age>22(πS_ID，SCORE，AGE(SC)))

A.ⅰ和 ⅱ

B.只有ⅱ正确

C.只有 ⅰ正确

D.ⅰ和ⅲ正确

选择题参考答案：(1)A(2)D(3)C(4)A(5)D(6)A(7)C(8)B(9)A(10)B

(11)B(12)C(13)B(14)C(15)D(16)A(17)C(18)A(19)D

二、简答题

1.试述关系模型的三个组成部分。

2.试述关系数据语言的特点和分类。

3.设有一个SPJ数据库，包括S，P，J，SPJ四个关系模式：

S(SNO，SNAME，STATUS，CITY)；

P(PNO，PNAME，COLOR，WEIGHT)；

J(JNO，JNAME，CITY)；

SPJ(SNO，PNO，JNO，QTY)；

试用关系代数完成如下查询：

（1）求供应工程J1零件的供应商号码SNO；

（2）求供应工程J1零件P1的供应商号码SNO；

（3）求供应工程J1零件为红色的供应商号码SNO；

（4）求没有使用天津供应商生产的红色零件的工程号JNO；

（5）求至少用了供应商S1所供应的全部零件的工程号JNO。

4.定义并理解下列术语，说明它们之间的联系与区别:

（1）域，笛卡尔积，关系，元组，属性

（2）主码，候选码，外码

（3）关系模式，关系，关系数据库

5.试述关系模型的完整性规则。在参照完整性中，为什么外码属性的值有时也可以为空？什么情况下才可以为空？

6.试述等值连接与自然连接的区别和联系。

7.关系代数的基本运算有哪些？

8.试用关系代数的基本运算来表示其他运算。

SQL语言

一、选择题

1.SQL语言是（）的语言，容易学习。

A.过程化

B.非过程化

C.格式化

D.导航式

2.SQL语言的数据操纵语句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的，也是使用最频繁的语句是（）。

A.SELECT B.INSERT

C.UPDATE D.DELETE

3.在视图上不能完成的操作是（）。

A.更新视图

B.查询

C.在视图上定义新的表

D.在视图上定义新的视图

4.SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体，其中，CREATE、DROP、ALTER语句是实现哪种功能（）。

A.数据查询

B.数据操纵

C.数据定义 D.数据控制

5.SQL语言中，删除一个视图的命令是（）。

A.DELETE

B.DROP

C.CLEAR

D.REMOVE

6.在SQL语言中的视图VIEW是数据库的（）。

A.外模式

B.模式

C.内模式

D.存储模式

7.下列的SQL语句中，（）不是数据定义语句。

A.CREATE TABLE B.DROP VIEW

C.CREATE VIEW D.GRANT

8.若要撤销数据库中已经存在的表S，可用（）。

A.DELETE TABLE S B.DELETE S

C.DROP TABLE S D.DROP S

9.若要在基本表S中增加一列CN（课程名），可用（）。

A.ADD TABLE S（CN CHAR（８））

B.ADD TABLE S ALTER（CN CHAR（８））

C.ALTER TABLE S ADD（CN CHAR（８））D.ALTER TABLE S（ADD CN CHAR（８））

第五篇：数据库期末复习教案[定稿]

15计科本《数据库系统原理与应用》期末复习纲要

一、题型与分值分布1、2、3、4、单项选择20题，计20分填空题，每空1分，计10分简答题4小题，计20分综合应用题2题，计50分

（1）概念模型（ER图），转化成相关的关系模型并写出主码与外码，并建立相关的关系表（20分）（2）T—SQL语名的作用，6小题，计30分

二、具体知识要点及课后习题

具体知识点：第一章

1、数据库中的数据具有哪些基本特点。（永久存储、有组织、可共享）

2、数据库系统具有哪些基本特点。（数据共享、数据完整性、数据独立性及较小的冗余度）

3、4、数据库系统与数据库、数据库管理系统之间的关系？数据库中的数据独立性分为物理独立性和逻辑独立性，分别指的是什么？P11-125、6、模式

7、数据库管理系统的功能结构为P16 数据库系统的三级数据模式结构：逻辑模式、外模式、内数据库系统的二级映象技术是指外模式与模式之间的映象，它不仅在三级数据模式之间建立了联系，同时也保证了数据的独立性。

8、数据的正确、有效和相容称之为数据的完整性第二章

1、信息的三种世界是指现实世界、信息世界和计算机世界（数据世界）。

2、数据库系统的核心是数据模型，、概念模型是现实世界的第一层抽象，这一类模型中最著名的模型是实体-关系模型。

3、数据模型的三要素是：数据结构、数据操作和完整性约束条件。如“实体完整性”约束规则，要求关系中的“主码”不允许取空值

4、数据库系统中常见的数据模型有：层次模型、网状模型和关系模型

5、概念模型的特点是：对现实世界的第一层抽象；与软、硬件无关；从用户观点对数据建模。逻辑模型的特点是：对现实世界的第二层抽象；与硬件无关，与软件有关；从计算机实现观点对数据建模。第三章

1、数据库的概念结构设计（E-R图）P55-58: E-R模型是对现实世界的一种抽象，E-R图的主要成分是实体、联系和属性;各分E-R图之间的冲突主要有属性冲突、命名冲突和结构冲突三类。

2、概念模型向关系模型的转换（逻辑结构设计）P62

3、概念数据模型不依赖于任何数据库管理系统。实体-关系模型是概念模型中最著名的一种。第四章

1、数据库中关系的类型有基本表、视图表和查询表三种，它们各有何不同P91

2、关系中的基本名词：元组、属性、候选码和主码、全码、主属性和非主属性P91 一个关系只有一个主码

3、数据库中基本关系的性质P92

4、关系的完整性 P95

5、关系操作语言的种类：关系代数语言、关系演算语言、基于映象的语言（如SQL是一种映象，是非过程化的）。SQL包含数据定义、数据操作和数据控制三种功能

5、关系模型的完整性约束有三类：实体完整性、参照完整性和用户定义的完整性 P96 主要掌握主码、外码等

6、专门的关系运算：选择、投影、连接

7、关系代数运算中，传统的集合运算有笛卡尔积、并、交和差

8、数据库数据具有永久存储、有组织、可共享三个基本特点。重点掌握4.2.3用关系代数表示检索的实例第五章

1、SQL语句分类，按功能分为数据定义语句、数据操纵语句、数据控制语句

2、SQL的数据定义包括基本表、索引、视图和数据库（重点掌握视图的建立和用SQL语句写出查询程序），如在关系数据库系统中，为了简化用户的查询操作，而又不增加数据的存储空间，常用的方法是创建视图

学会同时用SQL语言和关系代数实现下列相关操作

P119 例5-

1、5-

2、5-3

3、SQL的数据更新语句有插入(INSERT)、修改(UPDATE)与删除(DELTE)三种

4、数据控制是系统通过对数据用户的使用权限加以限制而保证数据安全的重要措施。SQL的数据控制语句包括授权（Grant）、收权(Revoke)和拒绝访问(Deny)三种。用户权限包含数据对象和操作类型两个要素；而数据库角色是被命名的一组与数据库操作相关的权限，角色是权限的集合

5、利用游标进行查询需要4种语句，分别是说明游标、打开游标、推进游标、关闭游标

第六章

1、数据库对象包含哪些？P156 SQL Server2008的数据库对象有很多，例如：表、视图、角色、索引（或存储过程、默认值、数据类型、触发器、约束）

2、数据库类别P157

3、数据库对象是数据库的逻辑文件。SQL Server2008的数据库对象包括表、视图、角色、索引、数据类型、默认值、存储过程、触发器和约束等。了解各自的含义。

4、SQL Server2008的数据库中有3种物理文件：基本数据文件、辅助数据和日志文件

5、掌握视图的创建和维护方法。视图是根据子模式建立的虚拟表。视图的有哪些优点呢？

如：视图能够简化用户的操作；视图使用户能以多种角度看待同一数据；视图对重构数据库提供了一定程度的逻辑独立性；视图能够对机密数据提供安全保护 P247

6、掌握存储过程和触发器的创建和维护.P179

7、Trantsact-SQL语言：重点放在数据操纵语言P192 第七章

1、关系模式应满足的基本要求P214

2、已知关系模式R及其上的相关函数依赖集合，会求出该关系模式对应的候选码。

例1：已知关系模式R（A，B，C，D，E）及其上的函数依赖集合F＝{A→D，B→C，E→A }，该关系模式的候选码是（BE）

例2：学生表（id，name，sex，age，depart_id，depart_name），存在的函数依赖是id→{name，sex，age，depart_id}； dept_id→dept_name，其满足2NF

3、重点掌握课本习题P239 3 P240 15（1）第八章

1、数据库安全性是指什么？P244

2、数据库安全性控制的一般方法有哪些？P244

3、数据库完整性是指数据的正确性和相容性。P259(1)数据完整性约束分为表级约束、元组约束和属性约束

（2）SQL server使用约束、默认、规则和触发器4种方法定义和实施数据库完整性功能

4、数据库并发控制。数据库的并发控制就是控制数据库，防止多用户并发使用数据库时造成数据错误和程序运行错误，保证数据的完整性。解决事务并发操作带来的数据不一致性，常用封锁机制。

5、事务的概念和特征P265 并发操作带来的数据不一致性包括3类：丢失修改、不可重复读和读“脏”数据。

6、封锁：封锁机制作为并发控制的重要手段，利用封锁的特性和封锁协议，它在并发操作保证事务的隔离性，用正确的方式调度并发操作，使一个用户事务的执行不受其他事务的干扰，从而避免造成数据的不一致。

（1）锁的类型：排他锁（X锁）和共享锁（S锁），它们各自的特点是什么。P268（2）封锁协议：一级封锁协议、二级封锁协议（如1：事务T对要修改数据必须先加X锁，直到事务结束才释放X锁；对要读取数据必须先加S锁；如2：若事务T对数据对象A加上X锁，则只允许T读取和修改A，其他任何事务都不能再对A加任何类型的锁）、三级封锁协议；

封锁出现的问题及解决的方法。举例说明何谓活锁，如何解决活锁？P270

7、数据库恢复技术

恢复机制涉及的两个关键问题是：第一，如何建立备份数据；第二，如何利用这些备份数据实施数据恢复。建立备份数据最常用的技术是数据转储和登录日志文件。

数据库的备份方法通常有完整备份、差异备份、事务日志备份

8、何谓两段锁协议 P271

9、何谓“并发调度可串行化” P270；何谓“可串行化调度” P271

10、用户权限是由两个要素组成的，分别是数据对象和操作类型

11、数据库角色是被命名的一组与数据库操作相关的权限，角色是权限的集合。

课后习题1、2、3、第1章P19：

一、4；5；10

二、全部第2章P42：

二、全部

第3章P85:

一、19、22、23

二、全部

4、第4章P111：

一、14、15、16

二、8、911、21、22、24、25、32、33

5、第5章 P127 46、7、8、第6章P176：

一、2、3

二、1、4、6、7、8、9、10、11、12 第7章P205:

二、1、6、7、8、9 第8章P252：

一、1、3、12、13、15、26

二、8、12、13、15、16、18

数据库期末

第一篇：数据库期末

第二篇：数据库考试期末总结

第三篇：数据库期末复习总结

第四篇：数据库期末考试题及答案

第五篇：数据库期末复习教案[定稿]

相关范文推荐

西南交大2014数据库期末考题

SQL数据库期末考试题及答案[五篇模版]

SQL数据库期末复习试题 - 填空

数据库营销

数据库教学计划--（定稿）

数据库教学计划

数据库学习心得

数据库课程设计