建材秒知道
登录
建材号 > 设计 > 正文

数据库表结构设计,常见的数据库管理系统

眯眯眼的翅膀
优雅的路人
2022-12-31 20:51:54

数据库表结构设计,常见的数据库管理系统

最佳答案
外向的手链
无辜的西装
2025-06-24 00:18:31

一、数据场景 1、表结构简介 任何工具类的东西都是为了解决某个场景下的问题,比如Redis缓存系统热点数据,ClickHouse解决海量数据的实时分析,MySQL关系型数据库存储结构化数据。数据的存储则需要设计对应的表结构,清楚的表结构,有助于快速开发业务,和理解系统。表结构的设计通常从下面几个方面考虑:业务场景、设计规范、表结构、字段属性、数据管理。

2、用户场景

例如存储用户基础信息数据,通常都会下面几个相关表结构:用户信息表、单点登录表、状态管理表、支付账户表等。

用户信息表

存储用户三要素相关信息:姓名,手机号,身份证,登录密码,邮箱等。

CREATE TABLE `ms_user_center` (`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '用户ID',`user_name` varchar(20) NOT NULL COMMENT '用户名',`real_name` varchar(20) DEFAULT NULL COMMENT '真实姓名',`pass_word` varchar(32) NOT NULL COMMENT '密码',`phone` varchar(20) NOT NULL COMMENT '手机号',`email` varchar(32) DEFAULT NULL COMMENT '邮箱',`head_url` varchar(100) DEFAULT NULL COMMENT '用户头像URL',`card_id` varchar(32) DEFAULT NULL COMMENT '身份证号',`user_sex` int(1) DEFAULT '1' COMMENT '用户性别:0-女,1-男',`create_time` datetime DEFAULT NULL COMMENT '创建时间',`update_time` datetime DEFAULT NULL COMMENT '更新时间',`state` int(1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户表' 单点登录表

用意是在多个业务系统中,用户登录一次就可以访问所有相互信任的业务子系统,是聚合业务平台常用的解决方案。

CREATE TABLE `ms_user_sso` (`user_id` int(11) NOT NULL COMMENT '用户ID',`sso_id` varchar(32) NOT NULL COMMENT '单点信息编号ID',`sso_code` varchar(32) NOT NULL COMMENT '单点登录码,唯一核心标识',`log_ip` varchar(32) DEFAULT NULL COMMENT '登录IP地址',`create_time` datetime DEFAULT NULL COMMENT '创建时间',`update_time` datetime DEFAULT NULL COMMENT '更新时间',`state` int(1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',PRIMARY KEY (`user_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户单点登录表' 状态管理表

系统用户在使用时候可能出现多个状态,例如账户冻结、密码锁定等,把状态聚合到一起,可以更加方便的管理和验证。

CREATE TABLE `ms_user_status` (`user_id` int(11) NOT NULL COMMENT '用户ID',`account_status` int(1) DEFAULT '1' COMMENT '账户状态:0-冻结,1-未冻结',`real_name_status` int(1) DEFAULT '0' COMMENT '实名认证状态:0-未实名,1-已实名',`pay_pass_status` int(1) DEFAULT '0' COMMENT '支付密码是否设置:0-未设置,1-设置',`wallet_pass_status` int(1) DEFAULT '0' COMMENT '钱包密码是否设置:0-未设置,1-设置',`wallet_status` int(1) DEFAULT '1' COMMENT '钱包是否冻结:0-冻结,1-未冻结',`email_status` int(1) DEFAULT '0' COMMENT '邮箱状态:0-未激活,1-激活',`message_status` int(1) DEFAULT '1' COMMENT '短信提醒开启:0-未开启,1-开启',`letter_status` int(1) DEFAULT '1' COMMENT '站内信提醒开启:0-未开启,1-开启',`emailmsg_status` int(1) DEFAULT '0' COMMENT '邮件提醒开启:0-未开启,1-开启',`create_time` datetime DEFAULT NULL COMMENT '创建时间',`update_time` datetime DEFAULT NULL COMMENT '更新时间',`state` int(1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',PRIMARY KEY (`user_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户状态表' 支付账户表

用户交易的核心表,存储用户相关的账户资金信息。

CREATE TABLE `ms_user_wallet` (`wallet_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '钱包ID',`user_id` int(11) NOT NULL COMMENT '用户ID',`wallet_pwd` varchar(32) DEFAULT NULL COMMENT '钱包密码',`total_account` decimal(20,2) DEFAULT '0.00' COMMENT '账户总额',`usable_money` decimal(20,2) DEFAULT '0.00' COMMENT '可用余额',`freeze_money` decimal(20,2) DEFAULT '0.00' COMMENT '冻结金额',`freeze_time` datetime DEFAULT NULL COMMENT '冻结时间',`thaw_time` datetime DEFAULT NULL COMMENT '解冻时间',`create_time` datetime DEFAULT NULL COMMENT '创建时间',`update_time` datetime DEFAULT NULL COMMENT '更新时间',`state` int(1) DEFAULT '1' COMMENT '是否可用,0-不可用,1-可用',PRIMARY KEY (`wallet_id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户钱包' 二、设计规范 1、涉及模块

通过上面几个表设计的案例,可以看到表设计关联到数据库的各个方面知识:数据类型,索引,编码,存储引擎等。表设计是一个很大的命题,不过也遵循一个基本规范:三范式。

2、三范式 基础概念

一范式

表的列的具有原子性,不可再分解,即列的信息,不能分解,关系型数据库MySQL、Oracle等自动的满足。

二范式

每个事实的数据记录只会出现一次, 不会冗余, 通常设计一个主键来实现。

三范式

要求一个表中不包含已经存在于其它表的非主键信息,例如部门和员工的信息,员工表包含部门表的主键ID,则可以关联获取相关信息,没必要在员工表保存相关信息。

优缺点对比

范式化设计

范式化结构设计通常更新快,因为冗余数据较少,表结构轻巧,也更好的写入内存中。但是查询起来涉及到关联,代价非常高,非常损耗查询性能。

反范式化设计

所有的数据都在一张表中,避免关联查询,索引的有效性更高,但是数据的冗余性极高。

建议结论

上述的两种设计方式在实际开发中都是不存在的,在实际开发中都是混合使用。比如汇总统计,缓存数据,都会基于反范式化的设计。

三、字段属性

合适的字段类型对于高性能来说非常重要,基本原则如下:简单的类型占用资源更少;在可以正确存储数据的情况下,选最小的数据类型。

1、数据类型选择 整数类型

TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,根据数据类型范围合理选择即可。

实数类型

FLOAT、DOUBLE、DECIMAL,建议资金货币相关类型使用高精度DECIMAL存储,或者把数据成倍扩大为整数,采用BIGINT存储,不过处理相对麻烦。

字符类型

CHAR、VARCHAR,长度不确定建议采用VARCHAR存储,不过VARCHAR类型需要额外开销记录字符串长度。CHAR适合存储短字符,或者定长字符串,例如MD5的加密结构。

时间类型

DATETIME、TIMESTAMP,DATETIME保存大范围的值,精度秒。TIMESTAMP以时间戳的格式,范围相对较小,效率也相对较高,所以通常情况建议使用。

MySQL的字段类型有很多种,可以根据数据特性选择合适的,这里只描述常见的几种类型。

2、基础用法操作 数据类型

修改字段类型

ALTER TABLE ms_user_sso MODIFY state CHAr(1) DEFAULT '0'ALTER TABLE ms_user_sso MODIFY state INT(1) DEFAULT '1' COMMENT '状态:0不可用,1可用'

修改名称位置

ALTER TABLE ms_user_sso CHANGE log_ip login_ip VARCHAr(32) AFTER update_time 索引使用

索引类型:主键索引,普通索引,唯一索引,组合索引,全文索引。这里演示普通索引的操作。MySQL的核心模块,后续详说。

添加索引

ALTER TABLE ms_user_wallet ADD INDEX user_id_index(user_id) CREATE INDEX state_index ON ms_user_wallet(state)

查看索引

SHOW INDEX FROM ms_user_wallet

删除索引

DROp INDEX state_index ON ms_user_wallet

修改索引

不具有真正意义上的修改,可以把原有的索引删除之后,再次添加索引。

外键关联

用处:外键关联的作用保证多个数据表的数据一致性和完整性,建表时先有主表,后有从表;删除数据表,需要先删从表,再删主表。复杂场景不建议使用,实际开发中用的也不多。

添加外键

ALTER TABLE ms_user_wallet ADD CONSTRAINT user_id_out_key FOREIGN KEY(user_id) REFERENCES ms_user_center(id)

删除外键

ALTER TABLE ms_user_wallet DROP FOREIGN KEY user_id_out_key四、表结构管理 1、查看结构DESC ms_user_status SHOW CREATE TABLE ms_user_status2、字段结构 添加字段 ALTER TABLE ms_user_status ADD `delete_time` datetime DEFAULT NULL COMMENT '删除时间' 删除字段 ALTER TABLE ms_user_status DROP COLUMN delete_time3、修改表名ALTER TABLE ms_user_center RENAME ms_user_info4、存储引擎 存储引擎 SELECT VERSION() SHOW ENGINES

MySQL 5.6 支持的存储引擎有InnoDB、MyISAM、Memory、Archive、CSV、BLACKHOLE等。一般默认使用InnoDB,支持事务管理。该模块MySQL核心,后续详解。

修改引擎

数据量大的场景下,存储引擎修改是一个难度极大的操作,容易会导致表的特性变动,引起各种后续反应,后续会详说。

ALTER TABLE ms_user_sso ENGINE = MyISAM5、修改编码

表字符集默认使用utf8,通用,无乱码风险,汉字3字节,英文1字节,utf8mb4是utf8的超集,有存储4字节例如表情符号时使用。

查看编码 SHOW VARIABLES LIKE 'character%' 修改编码 ALTER TABLE ms_user_sso DEFAULT CHARACTER SET utf8mb4五、数据管理 1、增删改查

添加数据

INSERT INTO ms_user_sso ( user_id,sso_id,sso_code,create_time,update_time,login_ip,state ) VALUES ('1','SSO7637267','SSO78631273612','2019-12-24 11:56:57','2019-12-24 11:57:01','127.0.0.1','1' )

更新数据

UPDATE ms_user_sso SETuser_id = '1',sso_id = 'SSO20191224',sso_code = 'SSO20191224', create_time = '2019-11-24 11:56:57',update_time = '2019-11-24 11:57:01', login_ip = '127.0.0.1',state = '1' WHERe user_id = '1'

查询数据

一般情况下都是禁止使用 select* 操作。

SELECT user_id,sso_id,sso_code,create_time,update_time,login_ip,state FROM ms_user_sso WHERe user_id = '1'

删除数据

DELETe FROM ms_user_sso WHERe user_id = '2'

不带where条件,就是删除全部数据。原则上不允许该操作,优化篇会详解。TRUNCATE TABLE也是清空表数据,但是占用的资源相对较少。

2、数据安全 不可逆加密

这类加密算法,多用来做数据验证操作,比如常见的密码验证。

SELECT MD5('cicada')='94454b1241ad2cfbd0c44efda1b6b6ba' SELECT SHA('cicada')='0501746a2e4fd34e1d14015fc4d58309585edc7d' SELECT PASSWORd('smile')='*B4FB95D86DCFC3F33A3852714DC742C77504479D' 可逆加密

安全性要求高的系统,需要做三级等保,对数据的安全性极高,数据在存储时必须加密入库,取出时候需要解密,这些就需要可逆加密。

SELECT DECODE(ENCODE('123456','key_salt'),'key_salt') SELECT AES_DECRYPT(AES_ENCRYPT('cicada','salt123'),'salt123')

上述数据安全的管理,也可以基于应用系统的服务(代码)层进行处理,相对专业的流程是从数据生成源头处理,规避数据传递过程泄露,造成不必要的风险。

最新回答
威武的悟空
甜蜜的跳跳糖
2025-06-24 00:18:31

1.典型地质遗迹基本概况表

包括地理位置、园区范围、自然条件等组成(表6-2)。

表6-2 基本概况(JBGK.MDB)数据库结构表

数据项说明:

地质公园编号:前3位国别代码,按行政区划代码(GB/T2260-98)填写,后3位地质遗迹点的顺序号。当公园范围较大,跨国界时,其编号以主景区所在的区域为准进行编号,后6位为顺序号,保证地质遗迹编号的唯一性。

地质遗迹分类:为适应现阶段地质遗迹的调查,地质公园建设和发展规划、科学普及的开展,以系统地球科学理论为指导,赵汀(2009)提出了显性地质遗迹的概念并建立了学科分类系统,并在此基础上完成了中国国家地质公园地质遗迹分类。

2.景区、景点数据(表6-3,表6-4)

表6-3 景区表结构(JQ.MDB)表

表6-4 景点表结构(JD.MDB)表

景区和景点数据关系(表6-5)为一对多关系。即,一个景区至少有一处以上的景点,任意一个景点只能属于某一个景区。

从容的花瓣
直率的指甲油
2025-06-24 00:18:31
数据库表的命名

使用名词作为表名

仔细想想便可发现,数据库表中存在的所有数据都是现实世界各种操作的结果,它们有的是中间过程结果,有的是最终数据结果。不论怎样,它们是一份一份没有任何动作的,静态的记录。而表本身就是存储这些记录的容器,从这样的层面理解,表名应该采用名词的形式是完全符合逻辑的。

比如我们要设计一个存储用户邀请的表,invitation 就比 invite 更加的优雅。

相关表采用统一前缀

我们知道,大型系统的设计往往按模块或者子系统进行划分,一个一个模块的处理问题,保证模块间的低耦合,模块内的高内聚。数据库表设计也一样,我们可以对相关联的表采用相同的前缀,使开发人员一眼看上去就知道哪几个表是相关的。

比如对于用户基本信息表、用户的详细信息表和用户的微信绑定表如下的命名更可取:

user

user_profile

user_wecha

字段的命名

本节先介绍几个比较通用的原则,使得字段的含义更容易理解,描述性更强,之后进行简单的总结分类,以便让我们明白这些原则背后的逻辑。

使用动词被动形式+描述性后缀

通过前面我们知道,数据库表中的所有记录都是静态的结果性数据,它是由一定的用户操作产生的。那么它是如何产生的?经过什么样的操作产生的呢?

在解答之前先看一个例子,下面是一个简单的 article 表结构:

id: integer

title: varchar

content: text

user_id: integer

create_time: timestamp

这样的设计本身是没有问题的,目前用的也很多。这个设计主要的问题是没有体现出 user_id 与这篇文章的关系,需要经过一定的猜测和思考才能得出。create_time 虽然还比较直观,但没有体现出这篇文章实在过去的某个时间创建的。

然后我们在来看修改后的设计:

id: integer

title: varchar

content: text

created_by: integer

created_at: timestamp

通过把 user_id 替换为 created_by、create_time 替换为 created_at,使得我们更容易理解对应的文章是被指定的人在指定的时间创建出来的,而不需要我们的多方猜测或者查阅文档,使得整个表结构的描述性更强。

时间区分当前时间和未来时间

英语中表时间的时候, at 一般跟一个时间点,而 in 有表示在未来的某个时间之内的意思。结合起来,笔者倾向于用 at 表示过去或者现在的时间,而用 in 表示未来的时间。比如日历中的 event 有开始时间和结束时间的概念,我觉得如下的命名是比较合理的:

starts_at 事件的开始时间,相对 ends_in 它属于当前时间,采用 _at 后缀

ends_in 事件的结束时间,相对 ends_in 它属于未来时间,从用 _in 后缀

其他我们比较常用的比如 created_at、updated_at、expires_in 都属于这种类型。

使用第三人称单数

当我们采用动词+介词的时候我更倾向与使用第三人称单数,因为字段描述的这个实体是单数的,通过使用第三人称单数,我们可以自然语言的方式表达出需要的意思。比如以 event 为例,翻译成英语是这样的:

The event starts at 2016-05-05 12:00:00

完全符合英语的语法,也表达了想要表达的意思。

区分单数与复数

单数与复数主要是对字段内容的描述,比如通知(notification)有接收人这个字段,如果我们需要通知能够发送给多个人,那么 receivers 这样的字段名称明显好于 receiver,因为 receivers 体现了通知可以发送给多个人这一个事实。

前面从四个原则出发介绍了如何让字段更具有描述性,简单总结下来我觉得从语义上来说,字段可以分为两种类型:描述性字段和动作性字段。

描述性字段是对对应数据库记录(或者说实体)的补充说明,比如以人作为实体,那么人的身高、体重和血压就属于这类描述性字段。

描述性字段如果是动词+介词的形式,动词需要采用第三人称单数的形式,比如 starts_at。然后根据字段的内容,如果内容有多个元素或实体,我们需要使用复数,否则使用单数形式。

动作性字段不仅能对所属实体进行补充说明,还能对这个实体的所涉及操作有所描述。比如我们有 article 这个实体, article 的 created_by 和 created_at 就属于动作性字段,因为它不仅表达了 article 的创建者和创建时间这层信息,它还表达了这个 article 是指定的人被创建的,而不是凭空生成的。

沉静的石头
害羞的白开水
2025-06-24 00:18:31
数据库表结构设计重要。

当在决定开发一个数据库管理项目时,最先着手的工作就应是数据库表结构的设计。数据库表结构的设计是开发数据库管理项目的基石,一个糟糕的表结构设计,可能会严重延误项目开发周期,使大量的劳动时间为此付之东流。表结构设计是数据库逻辑设计的重要组成部分,会直接影响到数据库的性能。

设计数据库表的注意事项:不应该针对整个系统进行数据库设计,而应该根据系统架构中的组件划分,针对每个组件所处理的业务进行组件单元的数据库设计;不同组件间所对应的数据库表之间的关联应尽可能减少,如果不同组件间的表需要外键关联也尽量不要创建外键关联,而只是记录关联表的一个主键,确保组件对应的表之间的独立性,为系统或表结构的重构提供可能性。

奋斗的黑裤
失眠的板凳
2025-06-24 00:18:31

一. 设计表结构

在操作设计数据库之前,我们先要设计数据库表结构,我们就来分析分析经典的学生,课程,成绩,老师这几者他们之间的关系,我们先来分析各个主体他们直接有什么属性,并确定表结构,在实际开发过程中,根据自己的业务需要和属性,设计不同的表结构,以下是我设计的表结构:

爱撒娇的红酒
温婉的手套
2025-06-24 00:18:31
在制作报告的时候,数据统计起来非常的难,效率非常的低,我们常常归咎于自己的Excel基础差,函数公式掌握的不牢固。但是实际上,更重要的一个原因是, 我们的表格可能一开始就设计错了 。

下面是制作表格时,常见的5种表格设计错误,遇到这几种表格,想提高效率都难。

所谓二维表就是,我们可以通过横向和纵向标题查询,在交叉位置获取需要的数据 。这是我们制作表格时,最常见的一种类型,这类表格的主要特点是:

横向第1行是一个标题。比如线别、计划与实际、日期等等。

纵向第1列是另一个标题。比如城市、产品类型、不良描述、姓名等等。

通常每天一个sheet

但是这类表格汇总起来非常的麻烦, 引发的最常见的问题就是,多工作表的合并 ,不知道难倒了多少人。

在做日统计报表的时候,这类表格也是众矢之的。 数据第1行是日期,随着时间,日期列不停的往右填,导致数据列非常的多,表格非常的宽。

这类表格会有什么问题呢?

数据查看起来不方便。 拖动滚动条的时候,一不小心就过了,来来回回的非常闹心。

月度、年度统计非常麻烦。 根据时间段做汇总统计的时候,非常麻烦,VLOOKUP函数、SUMIFS函数啊,乱七八糟的要写一大堆。

表格的标题有多行(列),分成了多个级别,级别高的标题可能还会把单元格合并起来,这是这类表格的突出特点。

大家注意看一下上面这个表格的标题,分成了3个级别。第1级标题是(1月份进销存),第2级标题是(预估和实际),第3级标题是(数量、单价、金额)。这样看上去,好像没有什么问题,从上往下看还比较有层次感。

只有在遇到实际的汇总统计需求的时候,才能发现问题,比如:

1- 要统计年度每个产品的实际销售金额是多少?

肯定是要写公式了,比如使用SUMIF函数只对金额求和。但是因为第3级标题中,”金额“出现了重复,我们还要排除”计划金额“,“领用金额”等数据。这样公式写起来就麻烦了。

2- 统计每个季度的销售预估和实际,对比季度达成率。

这个我已经想不出来,该怎么写公式了。

所以,多级别多行标题,比较容易出现的问题是:

标题中有合并单元格 ,根据标题汇总数据时,容易出错。

标题字段出现重复 ,比如案例中的3级标题,有多个数量、金额、单价。汇总统计时,增加筛选统计的复杂程度。

制作表格的时候,为了美观,我们可能会把表格设计成表单的样式。就像上面这个表格,一个sheet被拆分成了多个小的“表格”,这样阅读和填写起来,都比较的方便。

但是现在我们要统计所有工程数量的总和,就不是一件容易的事情了。

另外还有一些拍脑袋设计出来的表格,比如这个为每个部门分配负责人的表格,顺着往下填就行,确实方便。

然后再统计每个人,负责那几个部门?

最后请高手,给写出这样的公式,纯纯的“没事找事儿型”。

{=INDEX(A$1:I$1,SMALL(IF((A$2:I$2=A12)+(A$3:I$3=A12),COLUMN(A:I)),COLUMN(A:I)))}

总的来说,用登记表记录数据,主要的缺点是: 表格设计没有规律,数据汇总统计异常的困难。

在设计一个财务表格时,我遇到过这样类型的表格。

这个表格非常的宽,里面包含了多项不同类型的内容。我们截取其中的细节来看看。

↑合同的信息

↑开发票的信息

↑收款的信息

↑月度统计的信息

这么多的信息,都混在同一个工作表里,就像是一大坨…。 每次要统计数据时,都要牵一发而动一坨。 统计起来不知道有多麻烦,比如:

统计某个单位的欠款信息。

统计2017年度整体的账务数据。

统计所有未完成还款的记录。

简单的总结一下。 一个好的表格,在设计的时候要尽量均衡下面几个方面的需求 :

方便数据输入,这是输入表的设计。

数据汇总统计简单。这是汇总表的设计。

图表做起来能简单一点。这是可视化的设计。

很显然,这5个设计错误,都只注重了数据输入方便,忽略了数据的汇总统计。 要同时满足输入和汇总的便捷,我们要在它们之间建立一个桥梁,就是数据表。

有了数据表,使用Excel的透视表功能,我们就可以快速的完成数据统计了。