MySQL开发规范[转]

admin

July 30, 2012 - 3 minutes read - 523 words

MySQL开发规范

说明，此规范为内部制定的一个给开发人员如何使用MySQL的规范，由Team共同讨论制定，还在不断的完善中，有一些建议或者规定不一定十分合理，后续可能会修改。另外，MySQL版本不断进化，也会导致有一些条款失效，请大家根据自身的情况谨慎参考。

一、 表设计

库名、表名、字段名必须使用小写字母，“_”分割。【FAQ】
库名、表名、字段名必须不超过12个字符。【FAQ】
库名、表名、字段名见名知意,建议使用名词而不是动词。【FAQ】
建议使用InnoDB存储引擎。【FAQ】
存储精确浮点数必须使用DECIMAL替代FLOAT和DOUBLE。【FAQ】
建议使用UNSIGNED存储非负数值。【FAQ】
建议使用INT UNSIGNED存储IPV4。【FAQ】
整形定义中不添加长度，比如使用INT，而不是INT(4)。【FAQ】
使用短数据类型，比如取值范围为0-80时，使用TINYINT UNSIGNED。
不建议使用ENUM类型，使用TINYINT来代替。【FAQ】
尽可能不使用TEXT、BLOB类型。【FAQ】
VARCHAR(N)，N表示的是字符数不是字节数，比如VARCHAR(255)，可以最大可存储255个汉字，需要根据实际的宽度来选择N。
VARCHAR(N)，N尽可能小，因为MySQL一个表中所有的VARCHAR字段最大长度是65535个字节，进行排序和创建临时表一类的内存操作时，会使用N的长度申请内存。【FAQ】
表字符集选择UTF8。【FAQ】
使用VARBINARY存储变长字符串。【FAQ】
存储年使用YEAR类型。
存储日期使用DATE类型。
存储时间（精确到秒）建议使用TIMESTAMP类型，因为TIMESTAMP使用4字节，DATETIME使用8个字节。【FAQ】
建议字段定义为NOT NULL。【FAQ】
将过大字段拆分到其他表中。
禁止在数据库中使用VARBINARY、BLOB存储图片、文件等。
表结构变更需要通知DBA审核。

二、 索引【FAQ】

非唯一索引必须按照“idx_字段名称_字段名称[_字段名]”进行命名。
唯一索引必须按照“uniq_字段名称_字段名称[_字段名]”进行命名。
索引名称必须使用小写。
索引中的字段数建议不超过5个。
单张表的索引数量控制在5个以内。【FAQ】
唯一键由3个以下字段组成，并且字段都是整形时，使用唯一键作为主键。
没有唯一键或者唯一键不符合5中的条件时，使用自增（或者通过发号器获取）id作为主键。
唯一键不和主键重复。
索引字段的顺序需要考虑字段值去重之后的个数，个数多的放在前面。
ORDER BY，GROUP BY，DISTINCT的字段需要添加在索引的后面。
使用EXPLAIN判断SQL语句是否合理使用索引，尽量避免extra列出现：Using File Sort，Using Temporary。【FAQ】
UPDATE、DELETE语句需要根据WHERE条件添加索引。
不建议使用%前缀模糊查询，例如LIKE “%weibo”。
对长度过长的VARCHAR字段建立索引时，添加crc32或者MD5 Hash字段，对Hash字段建立索引。【FAQ】
合理创建联合索引（避免冗余），(a,b,c) 相当于 (a) 、(a,b) 、(a,b,c)。
合理利用覆盖索引。【FAQ】
SQL变更需要确认索引是否需要变更并通知DBA。

三、 SQL 语句

使用prepared statement，可以提供性能并且避免SQL注入。
SQL语句中IN包含的值不应过多。
UPDATE、DELETE语句不使用LIMIT。【FAQ】
WHERE条件中必须使用合适的类型，避免MySQL进行隐式类型转化。【FAQ】
SELECT语句只获取需要的字段。
SELECT、INSERT语句必须显式的指明字段名称，不使用SELECT *，不使用INSERT INTO table()。【FAQ】
使用SELECT column_name1, column_name2 FROM table WHERE [condition]而不是SELECT column_name1 FROM table WHERE [condition]和SELECT column_name2 FROM table WHERE [condition]。
WHERE条件中的非等值条件（IN、BETWEEN、<、<=、>、>=）会导致后面的条件使用不了索引。
避免在SQL语句进行数学运算或者函数运算，容易将业务逻辑和DB耦合在一起。
INSERT语句使用batch提交（INSERT INTO table VALUES(),(),()……），values的个数不应过多。
避免使用存储过程、触发器、函数等，容易将业务逻辑和DB耦合在一起，并且MySQL的存储过程、触发器、函数中存在一定的bug。
避免使用JOIN。
使用合理的SQL语句减少与数据库的交互次数。【FAQ】
不使用ORDER BY RAND()，使用其他方法替换。【FAQ】
建议使用合理的分页方式以提高分页的效率。【FAQ】
统计表中记录数时使用COUNT(*)，而不是COUNT(primary_key)和COUNT(1)。
禁止在从库上执行后台管理和统计类型功能的QUERY。【FAQ】

四、散表

对于字段类型简单，字段数不多表，单表数据量建议控制在5000w以下。
可以结合使用hash、range、lookup table进行散表。
散表如果使用md5（或者类似的hash算法）进行散表，表名后缀使用16进制，比如user_ff。
推荐使用CRC32求余（或者类似的算术算法）进行散表，表名后缀使用数字，数字必须从0开始并等宽，比如散100张表，后缀从00-99。
使用时间散表，表名后缀必须使用特定格式，比如按日散表user_20110209、按月散表user_201102。

五、其他

批量导入、导出数据需要DBA进行审查，并在执行过程中观察服务。
批量更新数据，如update,delete 操作，需要DBA进行审查，并在执行过程中观察服务。
产品出现非数据库平台运维导致的问题和故障时，如前端被抓站，请及时通知DBA，便于维护服务稳定。
业务部门程序出现bug等影响数据库服务的问题,请及时通知DBA，便于维护服务稳定。
业务部门推广活动，请提前通知DBA进行服务和访问评估。
如果出现业务部门人为误操作导致数据丢失，需要恢复数据，请在第一时间通知DBA，并提供准确时间，误操作语句等重要线索。

———————————————————————————————————————————————————————————————-

FAQ

1-1.库名、表名、字段名必须使用小写字母，“_”分割。

a) MySQL有配置参数lower_case_table_names，不可动态更改，linux系统默认为0，即库表名以实际情况存储，大小写敏感。如果是1，以小写存储，大小写不敏感。如果是2，以实际情况存储，但以小写比较。

b) 如果大小写混合用，可能存在abc,Abc,ABC等多个表共存，容易导致混乱。

c) 字段名显示区分大小写，但实际使用不区分，即不可以建立两个名字一样但大小写不一样的字段。

d) 为了统一规范，库名、表名、字段名使用小写字母。