MySQL开源代码的关系数据库管理系统(RDBMS),MySQL作为系统开发中最常用的数据库之一,因其速度、可靠性和适应性而受到开发者的青睐。然而,为了避免MySQL数据库开发中的致命错误,我们需要遵守开发MySQL数据库核心原则。以下所列出的5条MySQL数据库开发核心原则是所有开发MySQL数据库时应该遵守的。希望可以引起重视。
1.尽量避免在数据库中计算
“使鸡司夜,使狸执鼠,都用它的能力,上乃无事。”古人早就明白了各司其职、各司其职的重要性。作为现代数据库开发人员,我们应该让数据库做自己的工作,而不是”物尽其用”。因此,我们应该尽量避免在数据库中进行一些操作,将复杂的操作转移到程序端CPU,这是它的战场。我们应该避免在数据库中使用复杂的操作函数。毕竟,技术行业是专业的。这不是数据库的优势。处理复杂操作的任务应交给CPU。
2.尽量控制表字段的数量
单表的字段数量不宜过多,否则会影响数据库的优化。根据业务场景进行优化调整,尽量少而精地调整表字段数量,使之IO效率高,能快速遍历全表,二区还能提高数据库的并发性。
字段数量由特定标准控制,字段数量由单表控制评估1G体积和500W行数据量:按顺序读取1G文件需要N秒,单行不超过200Byte,单表不超过50个纯INT字段,单表不超过20个CHAR(10)字段,建议单表字段上限控制在20~50个。
3.平衡范式和冗余
数据库表结构的设计也注重平衡。在过去,我们常说我们应该严格遵循三个范式,所以让我们先谈谈什么是范式。第一范式:单个字段不能再分。唯一性。第二范式:没有非主属性,只依赖部分主键。消除不完全依赖。第三类:消除传递依赖。用一句话来总结范式和冗余:冗余以存储换取性能,范式以性能换取存储。因此,冗余通常在实际工作中更受欢迎。在模型设计中,这两个方面的具体权衡应首先基于企业提供的计算能力和存储资源。其次,一般互联网行业都是基于的实施数据仓库的Kimball模式,建模也由任务驱动,因此,冗余和范式的权衡满足了任务的需要。例如,指标数据必须在早上8点之前处理,但计算时间窗口很小。为了尽可能减少指标的计算时间,在计算过程中尽可能减少多表相关性,模型设计需要做更多的冗余。
4.拒绝三个B
由于数据库的并发性就像城市交通,呈非线性增长,这就要求我们在开发数据库时注意高并发性的瓶颈,防止数据库因高并发性而瘫痪。
这里的3B是指:
大SQL(BIG SQL):要减少
大事务(BIG Transaction)
大批量(BIG Batch)
5.尽量控制单表数据量
众所周知,单表数据量过大会影响数据查询效率,严重时会导致整个库卡住。一般来说,根据一年内单表数据量的估计:纯度INT不超过1000W,包括CHAR不超过500W。同时,尽量做好合理的分表,使单表数据量不超载。常见的分表策略有:通过USERID(根据ID范围分表):它广泛应用于金融行业,用户数量大,用户特征明显。按DATE分表(按天、周、月分表):它广泛应用于电信行业,如用户在线记录表、用户短信表、单词表等。AREA分表(省、市、区分表)。
实际上,这些MySQL数据库开发的核心原则或MySQL数据库开发的注意事项在互联网上有许多类似的版本。事实上,这主要是前辈们从历史事件中吸取的宝贵经验教训。准确地说,这些原则是MySQL数据库开发的红线,一旦触及,可能会产生意想不到的后果。因此,请记住这些MySQL数据库开发的核心原则,使我们的MySQL数据库开发更加合理、规范。