建材秒知道
登录
建材号 > 设计 > 正文

数据库设计中的五大范式

懦弱的大雁
平淡的星星
2022-12-30 17:17:42

数据库设计中的五大范式

最佳答案
酷酷的柜子
昏睡的裙子
2026-04-03 01:32:10

对于表中的每一行,必须且仅仅有唯一的行值.在一行中的每一列仅有唯一的值并且具有原子性。(第一范式是通过把重复的组放到每个独立的表中,把这些表通过一对多关联联系起来这种方式来消除重复组的。) 即无重复列。

第二范式要求非主键列是主键的子集, 非主键列活动必须完全依赖整个主键。 主键必须有唯一性的元素,一个主键可以由一个或更多的组成唯一值的列组成。一旦创建,主键无法改变,外键关联一个表的主键。主外键关联意味着一对多的关系。

(第二范式处理冗余数据的删除问题。当某张表中的信息依赖于该表中其它的不是主键部分的列的时候,通常会违反第二范式。)

第三范式要求 非主键列互不依赖。

(第三范式规则查找以消除没有直接依赖于第一范式和第二范式形成的表的主键的属性。我们为没有与表的主键关联的所有信息建立了一张新表。每张新表保存了来自源表的信息和它们所依赖的主键。)

第四范式 禁止主键列和非主键列一对多关系不受约束。

第五范式 将表分割成尽可能小的块, 为了排除在表中所有的冗余。

最新回答
哭泣的音响
闪闪的小蜜蜂
2026-04-03 01:32:10

目前关系数据库有六种范式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯−科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式依次类推。一般来说,数据库只需满足第三范式(3NF)。

第一范式(1NF)第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不是集合、数组、记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。

简而言之,第一范式(1NF)是最基本的范式,如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足第一范式(1NF)。在任何一个关系数据库中,第一范式(1NF)是对关系模式设计的基本要求,所有设计的数据模型都必须满足第一范式(1NF)。

从上面的定义描述中,可以归纳出第一范式(1NF)具有如下几个显著特点:((1)数据库表中的字段都是单一属性。

①字段不可再分。

②同一列中不能有多个值。

(2)单一属性由基本类型构成。

①整型。

②实数。

③字符型。

④逻辑型。

⑤日期型。

⑥其他类型。

满足以上两大特征的表就是符合第一范式(1NF)的表,不满足以上任一特征的表都是不符合第一范式(1NF)的表。

例如,图字段可再分的表所示的“电话”字段可以再拆分成“手机”与“座机”字段,不满足“字段不可再分”的要求,因此不符合第一范式(1NF)要求。

字段可再分的表

又如,图字段可再分的表所示的“姓名”字段包含“张伟”与“宋鑫”两个值,不满足“同一列中不能有多个值”的要求,因此也不符合第一范式(1NF)要求。

同一列中有多个值的表

第二范式(2NF)第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如,员工表中的身份证号码即可实现每个员工的区分,该身份证号码即候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分。如果在员工关系中没有对其身份证号码进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计身份证号码等不重复的编号以实现区分,被添加的编号选作主键。注意:该主键的添加是在ER设计时添加,不是在建库时随意添加。

第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖,是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分,通常需要为表加上一个列,以存储各个实例的唯一标识。

简而言之,第二范式(2NF)在第一范式(1NF)的基础之上更进一层。第二范式(2NF)需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一个数据库表中。

所谓联合主键,是指由两个或两个以上的字段共同组成数据表的主键。如图联合主键表所示,单凭“客户”字段无法确定表中唯一的记录,单凭“开户银行”字段也无法确定表中唯一的与“开户银行”一起组成数据表的联合主键。

联合主键表

从上面的定义描述中,可以归纳出第二范式(2NF)具有如下几个显著特点:((1)数据库表满足第一范式(1NF)。

(2)数据库中每个表均有主键。

①单字段主键。

②联合主键。即不能存在单个主键字段决定非主键字段的情况。

例如,表中有A、B、C、D、E五个字段,若A与B为联合主键(A,B),如有A决定C的情况(A→C),则不符合第二范式(2NF)。

满足以上特征的表就是符合第二范式(2NF)的表,不满足以上任何一特征的表都是不符合第二范式(2NF)的表。

例如,如图所示,所有字段均不可再拆分,因而满足第一范式(1NF)的要求,但表中没有任何一个字段可以确定表中的唯一记录,即表中没有主键,因此其不满足“数据库中每张表均有主键”的要求,所以不符合第二范式(2NF)要求。

又如,如图所示,满足第一范式(1NF)的要求,并且在原来的基础上增加了“ID”字段作为表的主键,因此其符合第二范式(2NF)要求。

没有主键的数据表

增加了主键的数据表

重新分析图1−3所示的联合主键表,此表符合第一范式(1NF)“字段不可再拆分”的要求,并且有“客户”与“开户银行”两个字段作为表的联合主键(客户,开户银行),但其是否就是一个符合第二范式(2NF)的表呢?

进一步分析,就可以发现:“客户电话”字段由“客户”字段决定,“开户行地址”字段由“开户银行”字段决定;即存在如下依赖关系:客户→客户电话,开户银行→开户行地址。

(客户,开户银行)为主键字段,(客户电话,开户行地址)为非主键字段,因此,其不符合联合主键中“不能存在单个主键字段决定非主键字段”的情况,所以可以认定其并不是符合第二范式(2NF)的数据表。

例1.1判断如图所示的学生信息表是否符合第二范式(2NF)。

图所示中存在联合主键(学号,课程编号),但存在(学号→姓名)、(课程编号→课程名)的依赖关系,即存在某个主键字段决定非主键字段的情况,因此其不符合第二范式(2NF),不是第二范式(2NF)表。可考虑把此表拆成分数表(见图)、课程表(见图)和姓名表(见图),则此三个表是符合第二范式(2NF)的表。

图学生信息表

图分数表

图课程表

图姓名表

第三范式(3NF)第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。第三范式(3NF)要求一个关系中不包含已在其他关系包含的非主关键字信息。

第三范式(3NF)就是任何非主属性不依赖于其他非主属性,也就是在满足第二范式(2NF)的基础上,任何非主属性不得传递依赖于主属性。第三范式(3NF)需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。如属性之间含有A→B→C这样的关系,是不符合第三范式(3NF)的。

当数据表不符合第三范式(3NF)时,会有大量的冗余数据,还会存在插入异常、删除异常、数据冗余度大、修改复杂等问题。

从上面的定义描述中,可以归纳出第三范式(3NF)具有如下几个显著特点:((1)数据库表满足第二范式。

(2)数据库表的非主键字段不存在传递依赖关系(即非主键字段不能决定其他非主键字段)。例如,表中有A、B、C、D、E五个字段,若A为主键,如有C决定D的情况(C→D)则不符合第三范式(3NF)。

满足以上特征的表就是符合第三范式(3NF)的表,不满足以上任何一特征的表都是不符合第三范式(3NF)的表。

如图所示,表中有主键(工号),因而满足第二范式(2NF)的要求;但表中非主键字段间存在传递依赖关系:非主键字段“部门”决定非主键字段“部门电话”和“部门主管”(部门→部门电话,部门→部门主管),因此不符合第三范式(3NF)的要求。

图非主键字段存在传递依赖关系的表

例1.2判断图所示的学生院属信息表是否符合第三范式(3NF)。

图学生院属信息表

图中有主键(学号),则满足第二范式(2NF)的要求,但存在(所在学院→学院电话)、(所在学院→学院地点),即存在非主键字段决定其他非主键字段的情况,因此其不符合第三范式(3NF)的要求,不是第三范式(3NF)表。可考虑把此表拆成学生表(见图)和学院表(见图),则两个表是符合第三范式(3NF)的表。

图学生表

图学院表

凶狠的项链
平常的歌曲
2026-04-03 01:32:10
关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴德斯科范式(BCNF)、第四范式(4NF)和第五范式(5NF)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。

第一范式 无重复的列

第二范式 属性完全依赖于主键

第三范式 属性不能传递依赖于主属性(属性不依赖于其它非主键属性)

大力的高山
高兴的太阳
2026-04-03 01:32:10

1、第一范式(1NF)

所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。

即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。

说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。

不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型。

2、第二范式(2NF)

在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)

第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。

第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。

例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。

在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复。

无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)

第二范式(2NF)要求实体的属性完全依赖于主关键字。

所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。

为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键。

3、第三范式(3NF)

在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)

第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。

简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。

那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。

如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。

简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。

扩展资料

设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。

满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。

参考资料:百度百科-数据库范式

怡然的猎豹
落后的项链
2026-04-03 01:32:10
这样吧:

范式,其实是一些经验丰富的前辈,根据项目经验总结出来的数据库设计方法,使用范式,可以使数据库结构更合理,效率更高。

看范式的定义,有点难以理解,我就把我理解的分享给你:

第一范式:一个实体设计成一张表;

第二范式:每张表要设置一个主键;

第三范式:表与表之间的关系,使用外键;

第四范式:如果如果三张或三张以上的表之间有主外关系,那么要跨过中间表添加个外键,比方说:

公司表

部门表

员工表

当三表连接的时候,如果在员工表中添加公司编号作为外键,可以快捷地根据公司查询员工,提高效率。

第五范式:适当的地方增加冗余字段,这个跟第四范式有点像,在第四范式基础上举个例子:

如果增加了职位表,考勤表,那么在考勤表中,按前三范式的原则,只需要添加一个员工编号即可,但是实际设计的时候,适应增加公司编号和部门编号,就单是考勤这个功能而言,可以减少多表连接,而直接从考勤表中获取到公司或部门的考勤记录。

明白否??

仁爱的眼睛
耍酷的微笑
2026-04-03 01:32:10
你好,很高兴能为您解答,请耐心看完,记得采纳,谢谢.

第一范式:在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。

第二范式:第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。这个唯一属性列被称为主关键字或主键、主码。

第三范式:满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。

数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的;同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给数据库的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。

顺心的蛋挞
淡然的哑铃
2026-04-03 01:32:10

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

真正要明白”范式(NF)”是什么意思,首先看下教材中的定义,范式是“符合某一种级别的关系模式的集合,表示一个关系内部各属性之间的联系的合理化程度”。实际上可以把它粗略地理解为一张数据表的表结构所符合的某种设计标准的级别。就像家里装修买建材,最环保的是E0级,其次是E1级,还有E2级等等。数据库范式也分为1NF,2NF,3NF,BCNF,4NF,5NF。一般在我们设计关系型数据库的时候,最多考虑到BCNF就够。符合高一级范式的设计,必定符合低一级范式,例如符合2NF的关系模式,必定符合1NF。

在实际开发中最为常见的设计范式有三个:

首先是第一范式(1NF)。

符合1NF的关系(你可以理解为数据表。“关系”和“关系模式”的区别,类似于面向对象程序设计中”类“与”对象“的区别。”关系“是”关系模式“的一个实例,你可以把”关系”理解为一张带数据的表,而“关系模式”是这张数据表的表结构。1NF的定义为:符合1NF的关系中的每个属性都不可再分。表1所示的情况,就不符合1NF的要求。

表1

实际上,1NF是所有关系型数据库的最基本要求,你在关系型数据库管理系统(RDBMS),例如SQL Server,Oracle,MySQL中创建数据表的时候,如果数据表的设计不符合这个最基本的要求,那么操作一定是不能成功的。也就是说,只要在RDBMS中已经存在的数据表,一定是符合1NF的。如果我们要在RDBMS中表现表中的数据,就得设计为表2的形式:表2

表2

但是仅仅符合1NF的设计,仍然会存在数据冗余过大,插入异常,删除异常,修改异常的问题,例如对于表3中的设计:

每一名学生的学号、姓名、系名、系主任这些数据重复多次。每个系与对应的系主任的数据也重复多次——数据冗余过大

假如学校新建了一个系,但是暂时还没有招收任何学生(比如3月份就新建了,但要等到8月份才招生),那么是无法将系名与系主任的数据单独地添加到数据表中去的 ----—插入异常

假如将某个系中所有学生相关的记录都删除,那么所有系与系主任的数据也就随之消失了(一个系所有学生都没有了,并不表示这个系就没有了)。——删除异常

假如李小明转系到法律系,那么为了保证数据库中数据的一致性,需要修改三条记录中系与系主任的数据。——修改异常。

正因为仅符合1NF的数据库设计存在着这样那样的问题,我们需要提高设计标准,去掉导致上述四种问题的因素,使其符合更高一级的范式(2NF),这就是所谓的“规范化”。

第二范式

第二范式在第一范式的基础之上更进一层。是指2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖。

函数依赖:若在一张表中,在属性(或属性组)X的值确定的情况下,必定能确定属性Y的值,那么就可以说Y函数依赖于X,写作 X → Y。

表中的函数依赖关系例如:

系名 → 系主任

学号 → 系主任

(学号,课名) → 分数

但以下函数依赖关系则不成立:

学号 → 课名

学号 → 分数

课名 → 系主任

(学号,课名) → 姓名

码:假如当 K 确定的情况下,该表除 K 之外的所有属性的值也就随之确定,那么 K 就是码。码也可以理解为主键。

第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。

比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。

订单信息表

这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。

而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,把订单项目表也分离到另一个表中,就非常完美了。如下所示。

订单信息表

订单项目表

商品信息表

这样设计,在很大程度上减小了数据库的冗余。如果要获取订单的商品信息,使用商品编号到商品信息表中查询即可。

因此可以总结判断的方法是:

第一步:找出数据表中所有的码。

第二步:根据第一步所得到的码,找出所有的主属性。

第三步:数据表中,除去所有的主属性,剩下的就都是非主属性了。

第四步:查看是否存在非主属性对码的部分函数依赖。

第三范式

3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖。也就是说, 如果存在非主属性对于码的传递函数依赖,则不符合3NF的要求。

则就是第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。

订单信息表

客户信息表

这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。

由此可见,符合3NF要求的数据库设计,基本上解决了数据冗余过大,插入异常,修改异常,删除异常的问题。当然,在实际中,往往为了性能上或者应对扩展的需要,经常 做到2NF或者1NF,但是作为数据库设计人员,至少应该知道,3NF的要求是怎样的。

难过的航空
殷勤的百合
2026-04-03 01:32:10
数据库范式有第一范式、第二范式、第三范式、巴斯科德范式、第四范式、第五范式六种。数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。

设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

目前关系数据库有六种范式:第一范式、第二范式、第三范式、巴斯科德范式、第四范式和第五范式。满足最低要求的范式是第一范式。在第一范式的基础上进一步满足更多规范要求的称为第二范式,其余范式以次类推。一般说来,数据库只需满足第三范式即可。