1.数据库发展的三个阶段
第一代数据库系统、第二代数据库系统、新一代数据库系统
2.数据库系统发展的三个里程碑
IMS系统、DBTG报告、关系数据库系统
3.数据管理技术三个阶段
人工管理阶段(40年代中-50年代中)
文件系统阶段(50年代末-60年代中)
数据库系统阶段(60年代末-现在)
4.数据:是数据库中存储的基本对象
?数据库:(简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合
数据管理系统特点:1.实现数据的集中化控制,采用一定的数据模型实现数据结构化
??????????????????2.避免了数据的不致性,数据的冗余度小。
??????????????????3.实现数据共享
??????????????????4.提供数据库保护
5.数据独立性
6.数据由DBMS统一管理和控制
数据管理系统功能:数据定义功能、数据操纵功能、数据运行管理、数据库的建立和维护
数据库系统的组成:数据库、数据库管理系统、应用系统、数据库管理员、用户
5.共享: 数据共享是指数据库中的一组数据集合为多种语言和多个用户共同使
6.冗余:数据的不一致性
7.数据的独立性:数据逻辑独立性和数据物理独立性
8.数据库控制功能:(1)数据的安全性(Security) 保护
(2)数据的完整性Integrity) 保护
(3)井发控制(Concurrency Contro)
??(4)数据库恢复QRecovery)
1.数据模型:是现实世界数据特征的抽象,是用来描述数据的一组概念和定义。
2.数据模型三要素:数据结构、数据操作、数据约束条件
3.概念模型表示方法:
4.实体:客观存在的且可以区别的事物
5.联系:是实体集之间关系的抽象表示,即对现实世界中事物之间关系的描述
联系类型: ⑴二元联系:只有两个实体集参与的联系称为二元联系,二元联系可进一步区分为1:1、 1:n和m:n三种,
①1:1 (one to one)联系:若两个实体集E1,E2中的每- -个实体至多和另-个实体集中的一个实体有联系,则称E1, E2有1:1的联系。
②1:n (one to many) 联系:设有两个实体策E1,E2,若E1中每个实体与E2中任意个实体(包括零个)相联系,而E2中每个实体至多和E1中-个实体有联系,则称E1和E2是一对多的联系, 记为1:n。把1:n联系倒转过来便成为n:1的联系。如学生实体集与宿舍房间实体集之间的联系是n:1的。
③m:n (many_ to many)联系:若两个实体集E1. E2中的每一个实体都和另一 个实体策中 任意个实体(包括零个)有联系,则称EI, E2是多对多的联系,
记为m:n。
⑵多元联系:参与联系的实体集的个数≥3时,称为多元联系。与二元联系一样,多元联系也可区分为1:1、1:n和m:n三种。
⑶自反联系: 同一实体集内两部分实体之间的联系,是一种特.殊的二元联系。两部分实体之间的联系也可以区分为1:1、1:n和m:n三种。
6.E-R模型(课件第二章30-40页): E-R图的表示方法.
■用矩形框表示实体集,并在矩形框中标明实体集名;
■用菱形框表示联系, 菱形框内标明联系名,与其相关
的实体集之间用无向边连接,且在连线边上标明联系
类型;
■用椭圆表示属性, 并用无向边连向与其相关的实体集
或联系。
7.层次数据模型:用树形结构表示实体集与实体集之间的联系
??层次模型数据结构特点:(1)每棵树有且仅有一一个结点无双亲。该结点称为树的根结点;
(2)除根外的任何一一个结点有且仅有一一个双亲结点。1:n联系1方的实体集:双亲结点,n方的实体集:子女结点。无子女结点:叶(1eaf)结点,除叶结点外任何一个结点可有任意个子女结点。同一个双亲的于女结点称为兄弟结点。 ??????
8.层次序列:用树的前序遍历的次序(即从上到下。自左至右)作为数据存储次序。
9层次路径:用来指明从根结点到目标结点的一条查询路径。通常用从根结点到目标结点路径上每个记录值的排序关键字表示。
10.网状数据模型:用网状数据结构表示实体集与实体集之间联系
11.①关系数据模型:关系数据模型是以案合论中的关系概念为基础发展起来的数据模型,它用二维表格表示现实世界实体果及实体集间的联系。
②描述功能:⑴用二维表描述实体集间的联系⑵用二维表格表示实体集及其属性
③关系模式的表达:关系模式是关系中信息内容结构的描述。它包括关系名、属性名、每个属性列的取值集合、数据完整性约束条件以及各属性间固有的数据依赖关系等。
④关系代数:传统的集合运算: 井、差、交笛卡尔乘积运算.
专门的关系运算: 选择、投影、连接、自然连接.半连接、自然半连接、除运算
关系演算:关系演算是以数理逻轻中的谓词演算来表达关系的操作。关系演算根据使用谓词变量类型的不同,可分为元组关系演算和城关系演算两种。
⑤关系模型约束条件
域完整性约束:限定属性值的取值范围,由语义决定一个属性值是否允许为控值NULL
实体完整性约束: 关系中标识属性(关键字)的值不能为NULL.否则。
參照完整性约束:不同的关系间存在引用时,不能引用不存在的元组。
⑥约束
⑦空值
12.①面向对象的数据模型:足面向对象程序设计方法与数据库技术相结合的产物。以更接近人类思维的方式描述客观世界的事物及其联系,以便对客观实体进行结构模拟和行为模拟.
①对象:对象是客观存在并能互相区分的事物。(它是客观世界中概念化的基本实体,因此实体都可以视为对象。复杂对象可以由相对简单的对象以某种方法组合而成。所以世界上所有事物都是由各种“对象”组成的.从动态角度看,对象及其操作就是对象的行为。因此。-个对象是对一组信息及对其操作的描述。)
②属性:每个对象包含一组属性,用以描述对象的状态、组成和特性。(对象的属性也可以是对象,且属性值可取单-值或-组值。某个(或某些)对象可以作为另一个(或-些)对象的属性被引用。而其自身又可能将其他对象作为自已的属性。从而形成对象的递归引用。这种由简单对象组成复杂对象的过程称为聚集)
③方法:用以描述对象的行为特性。(方法的定义与表示包括两部分,一 是 方法的接口,给出了方法的外部表示、包含的名称、参数及结果类型;二是方法的实现,是一段可对对象进行某种操作的程序,因此方法也称操作,它可以改变对象的状态。)
④封装:对象的封装性体现在:
(1)对象具有清晰的边界:对象的内部软件的范围限定在这个边界之内:
(2)对象具有统一的外部接口: 对象的接口描述该对象与其他对象间的相互作用:
(3)对象的内部实现是不公开的:对象的实现给出了对象提供的功能细节,外部对象不能访问这个功能细节.
⑤信息传递:
消息:对象之间进行通信的一种构造称为消息,它是对象之间实现联系的惟一途径.消息一般由三部分组成:接收者一一消息所施加作用的对象:操作者一给 出消息的操作要求:操怍参数- -消息操作时所需要的外部数据。
消息传递:当-一个消息发送给某个对象时。消息中包含要求接收对象去执行某些活动的信息。接收对象对消息解释进行相应的操作。并以消息的形式返回操作结果的理信机制.
12.类:类是具有共同属性和方法的对象的集合。这些屏性和方法可以在类中统说明。
13.实例:类中每个对称为实类的一个实例
1.数据库设计:⑴定义:对于一个给定的应用环境,根据一个单位的信息需求、处理需求和数据库的支撑环境,利用数据模型和应用程序模拟现实世界中该单位的数据结构和处理活动的过程。
⑵分类:静态特性设计:数据模型设计或数据库结构设计,
动态特性设计:基于数据库结构基础上的应用程序开发。
2.数据库设计的方法:直观设计法、规范化设计法(广泛使用)、计算机辅助设计法、自动化设计法
①常用的规范化设计方法主要有基于3NF、基于实体联系、基于视图概念的数据库设计方法等。
3.数据库设计的基本步骤:需求分析阶段、概念结构设计阶段、逻辑结构设计阶段、物理设计阶段、数据库实施阶段、数据库运行和维护阶段
4.数据库需求分析法:分析用户的应用环境、分析系统内部结构、确定系统的目标
5.结构化分析法(SA):是需求分析中常用的一种简单实用的数据分析法.SA法采用自顶向下、逐层分解的方式分析和描述数据间的联系。同时辅以数据流图和数据字典描述数据处理和数据组织结构。
6.数据字典:是各类数据的描述性信息的集合
7.数据流图:表达了数据和处理的关系
①数据项:描述数据的最小单位
②数据结构:若干数据项的有意义集合
③数据流:可以是数据项,也可以是数据结构
④数据存储:处理过程中存取的数据
⑤处理过程
数据库概念结构设计
1.数据库概念结构设计方法:自顶向下、自底向上、逐步扩张、混合方式
2.局部概念结构设计:确定局部概念结构的范围、确定实体集、确定实体(集)的属性、
定义实体(集)间的联系、
3.全局概念结构设计:方式:二元合并法(逐步集成法)、n元合并法(总体集成法)
???????????????????N元合并法(两步形成):解决冲突、消除冗余修改生成基本E-R模型
?冲突:定义:局部E-R模型间存在的数据不一致性,我们称之为冲突
???????分类:属性冲突:◆属性域冲突。属性值的类型、取值范围或取值集合不同。
???????????????????????◆属性取值单位冲突。
?????????????命名冲突:即属性名、实体名、实体联系名相互冲突
???????????????????????同名异义。不同意义的对象具有相同的名字。
???????????????????????异名同义。即一义多名,同一意义的对象具有不同的名字
?????????????结构冲突:◆同一对象在不同的局部E-R模型中产生不同的抽象。如学校中系的描述....
●同一实体在不同的局部E-R模型中属性组成不同。如学生实体.....
◆实体间联系在不同的局部E-R模型中其类型不同。情况
全局E-R模型的要求:①完整性和正确性②最小化③可理解性.④内部一致性,即不能存在互相矛盾的表达⑤能满足需求分析阶段所确定的所有要求
4. 概念结构实例:以工厂产品生产及库存综合管理为例,来说明概念结构设计,即构成基本E-R模型的过程。经过对需求分析阶段数据的概括、抽象初步形成该应用项目的数据描述可由产品、零件、材料、仓库等实体及它们的属性构成,图8-19~ 图8-21是各应用部门从不同应用环境出发对本部门的相关实体的E-R模型描述。
根据E-R图写出关系模型(重点)
逻辑结构设计
1.逻辑结构设计准则:结构准则:保持数据的特性
性能准则:资源的合理使用,获取高的存取效率
①结构准则:以规范化理论优化数据模型结构(以下选看)
◆确定数据依赖。按需求分析阶段得到的语义,分别写出每个关系模式内部各属性之间的数据依赖和不同关系模式属性间的数据依赖:
◆清除冗余联系。对各个关系模式之间的数据依赖进行极小化处理,清除冗余联系。
◆保持数据的关系范式。对关系模式逐一进行分析,看是否存在部分函数依赖、传递函数依赖、多值依赖等,确定关系模式达到哪十级范式。从而使结构更加规范,并尽可能消除不必要的数据冗余和各种操作异常:
◆对关系模式进行必要的分解。使描述关系模式的语义单一化,同时要保持实体集之间连接的完整性。
②性能准则:数据库的设计满足操作性能需求(以下选看)
⑴存取效率:满足事务对响应时间的要求;
⑵存储效率:数据占用空间/(数据占用空间+辅助信息占用空间+备用空间)
⑶内外存间数据传递的次数;
⑷操作接口简洁实用:
⑸既能满足当前的数据需求,l也能满足相当时期内数据需求,使数据库有较长的生命周期:
⑹便于数据库的重组和重构
⑺在数据库的软/硬件环境变化时,容易修改和移植,对系统故障有可靠的恢复能力
⑻满足对数据完整性、安全性、一致性的要求
⑼其他方面的性能要求。
2.逻辑结构设计方法:①基于结构的设计方法——满足结构准则, 其代表是基于数据依赖的各种分解和合成方法。
②基于操作的设计方法——满足性能准则,其代表是操作需求模拟方法。
3.概念模型向关系模型的转换规则:规则1 (实体的转换)、规则2 (二元联系的转换)、规则3 (多元联系的转换)、规则4 (实体的合并)、规则5 (多元联系的转换)
把E-R图转换为关系模式(重点)
数据库物理设计
1.物理设计的内容与方法: 确定数据库的存取方法:索引、聚簇、HASH
①索引:在节省空间的情况下,用以提高查询速度所普遍采用的一种方法
②聚簇:把在某个属性(或属性组) t上有相同值的元组,集中存放在一个物理块内或物理.上相邻的区域,提高I / O的数据命中率,从而提高有关数据的查询速度。
创建聚簇的基本语句:CREATE CLUSTER <聚簇名>
实例:对于TEACHER (教师)关系,以BIRTH (出生年月)为关键字创建聚族,设所建立的聚簇名为CLT,聚簇后临时存入关系CL_ TEACHER,
数据库设计的评价:
①逻辑结构设计评价:
②物理设计评价(性能评价)方法:排队和统计分析法、监视试验法、模拟检验法
数据库的运行和维护:
数据的载入:筛选所需数据、转换数据格式、原始数据输入、检验输入数据
数据库的试运行:功能测试、性能测试
数据库的运行和维护阶段的主要工作:①数据库的转储和恢复
②数据库的安全性、完整性控制
③数据库的性能监督、分析和改造
④数据库的重组和重构
每一章后面的习题看一下!
1、数据库体系结构包括几级模式几级映象,分别是什么?
数据库体系结构包括:三级模式(外模式、概念模式和内模式);
??????????????????两层映象(外模式/模式映象和模式/内模式映象)。
2、一个数据库有几个模式,几个子模式,一个内模式?
一个数据库有一个模式,多个子模式,一个内模式。
3、模式、子模式和内模式的别称是什么?
模式又称概念模式;子模式又称外模式或用户模式;内模式又称存储模式。
4、模式和子模式的概念?设立子模式的好处?
模式:是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,通常又称之为DBA视图,即数据库管理员看到的数据库,它是所有用户视图的一个最小并集。
子模式:又称外模式或用户模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
设立子模式的好处:(1)方便了用户的使用,简化了用户的接口;(2)保证数据的独立性;(3)有利于数据共享;有利于数据的安全和保密。
5、数据独立性包括什么,如何实现数据独立性?
数据独立性包括物理独立性和逻辑独立性。
在典型的数据库系统结构中包含三个层次,整体逻辑结构、局部逻辑结构和存贮结构,在整体逻辑结构和局部逻辑结构之间提供映象,在存贮结构和整体逻辑结构之间提供映象。应用程序是根据局部逻辑结构而编写的,局部逻辑结构是整体逻辑结构的逻辑子集。
6、数据库系统包括什么?
一个数据库系统包括四个主要部分:数据、硬件、软件和用户
7、对硬件的要求是什么?
(1)要有足够大的内存;(2)要有大容量的直接存取的外存储器;
(3)要有较强的通道能力。
8、用户包括哪几类?最终用户包括哪几类?
用户包括数据库管理员、系统分析员程序设计员及用户;
最终用户包括偶然用户、简单用户和复杂用户。
9、公共用户视图用模式表示,个别用户视图用子模式表示。
10、数据库管理系统有哪些功能?
()数据定义功能;(2)数据操纵功能;(3)数据库的建立、运行和维护功能。
11、Vf
打开一个文件:use **.dbf
关闭一个文件:use
浏览一个文件:brower
1、HTML 标注网页结构。
2、XML、HTML的定义、特点??
XML:又叫可延伸性标示语言或可扩展标识语言,是一种元标记语言,提供一种描述结构数据的格式,可以让用户自行定义自己的标记语言;是一种元语言,可以被用来定义任何一种新的标示语言;又是一种特殊的语言格式和语法,它使文件很容易地让人阅读,又很容易让计算机程序来辨识;是用于标示具有结构性信息的电子文件的标识语言。
XML的特点:(1)既保留了SGML的强大功能,又减少了SGML的复杂程度,将内容与表述格式分开,具有伸缩性与灵活性双重属性;(2)XML将结构、内容和表现分离,使得同一个XML源文档只写一次,就可以用不同的方法表现出来;(3)XML是完全面向数据的;(4)XML纯用于规范化定义数据对象,一个定义完整正确的XML对象具有良好的内聚性,并完全独立于数据的外部表现形式;(5)较SGML更有效率、更实用、更易于流行的信息流标准。
HTML:超文本语言,是WWW的描述语言,是一种简单通用的全置标记语言。
HTML特点:(1)HTML通过在文档中添加具有特定意义的标记来组织文档;(2)HTML所使用的标记都是预定义的,不同的HTML版本具有不同的标记集;(3)浏览器完成对HTML文档的解释;(4)HTML的主要功能在于通过浏览器完成对信息的显示,即信息格式化的控制。
3、HTML文档?
HTML文件是由HTML命令组成的描述性文本。
4、数据库对应公司?
(1)XML由“全球信息网发展协会”(W3C)开发;(2)IBM公司开发出通用标记语言标准SGML;(3)1989年欧洲粒子中心的Tim Beners-Lee使用类SGML语法,开发了HTML。
5、XML、HTML和SGML的关系?
(1)XML特意避免了很多HTML不合理的地方和SGML冗余的地方;(2)早期的HTML把数据和显示融合在一起,不可分离,XML可以把数据和显示分离;(3)HTML的目的是给人看的,XTML是给机器读的;(4)HTML是松散的,允许错误的存在,不同的环境会有不同的HTML显示效果,有些平台仍不支持HTML。
SGML描述表现形式(格式)、文档内容,功能强大、灵活、复杂,应用于高端的复杂结构的出版;HTML描述表现形式、文档格式、建立WEB页面,简单,应用于web;XML描述文档或数据内容,功能强大、灵活、简单,应用于web、不同系统间、各种数据库之间的数据交换。
6、代表纯文本的是什么?
XML文档为XML标识语言写成的XML原代码文件,实际上是ASCII的纯文本文件;
CDATA:纯文本形式。
7、XML文档的合法性和命名规则?
合法性:(1)验证XML 文档:
<?xml version=“1.0” encoding=“ISO-8859-1”?>
<!DOCTYPE note SYSTEM “Note.dtd”>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don’t forget the meeting! <body>
</note>
(2)DTD验证:
<!DOCTYPE note[
<!ELEMENT note(to,from,heading,body)>
<!ELEMENT to ??(#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading(#PCDATA)>
<!ELEMENT body (#PCDATA)>
]>
(3)schema验证:
<xs:element name=”note”>
<xs:complex Type>
<xs:sequence>
???<xs:element name=”to” type=”xs:string”/>
???<xs:element name=”from” type=”xs:string”/>
???<xs:element name=”heading” type=”xs:string”/>
???<xs:element name=”body” type=”xs:string”/>
</xs:sequence>
<xs:complex Type>
</xs:element>
命名规则:(1)标记必须以“<”开始,以“>”结束,起始标记和结束标记必须匹配,且同时出现;(2)标记名称必须以字母或下划线开头,后面的字符可以是字母、数字、下划线、短横和圆点;(3)在标记名称中不能使用空格;(4)XML标记区分大小写;(5)标记允许嵌套但不允许交迭;(6)XML必须关闭标记;(7)空元素也必须关闭。
8、消除XML文档命名冲突的是什么?
为了消除XML文档命名冲突,采用名字空间声明,允许通过一个网址指向识别的标识。
9、XML的声明关键字?
一个合法的XML文档中所使用的每一个标记都应在DTD中声明。元素声明包括元素名称、元素内容、子元素以及子元素的出现次数等。元素声明的格式如下:
<!ELEMENT 元素名称 内容> ?????此处的内容可以是ANY即任意关键字、#PCDATA或是子元素列表等。 #PCDATA说明元素的内容是可解析的字符文本,这种解析的字符文本不能再有自己的子元素了。
子元素列表格式: ?<!ELEMENT 元素名称(子元素列表)>
如果某一个子元素多次出现,可以用*表示,如“Author*”说明子元素中有二个以上的作者。
“Author?”表示该子元素最多出现一次;“Author+”表示该子元素至少出现一次;这种模式是用来描述内容模型的。
属性及其类型声明:
声明属性的格式:<!ATTLIST 元素名称 属性名称 属性值类型 默认值>
其中,ATTLIST是XML声明属性的关键字。“属性值类型”表明了该属性所特有的值类型以及某些语义。XML中有10种属性值类型。
10、XML中最小单位?(元素)
11、XML文档对应的DOM树形结构?(课本155页)