|慢sql治理经典案例分享

|慢sql治理经典案例分享

文章图片

|慢sql治理经典案例分享

文章图片

|慢sql治理经典案例分享

文章图片



菜鸟供应链金融慢sql治理已经有一段时间 , 自己负责的应用持续很长时间没有慢sql告警 , 现阶段在推进组内其他成员治理应用慢sql 。 这里把治理过程中的一些实践拿出来分享下 。
一 全表扫描 1 案例
SELECT count(*) AS tmp_count FROM ( SELECT * FROM `XXX_rules` WHERE 1 = 1 ORDER BY gmt_create DESC ) a 2 溯源
在分页查询治理的文章里已经介绍过我们系统旧的分页查询逻辑 , 上面的查询sql明显就是分页查询获取总记录数 , 通过XXX_rules表的分页查询接口溯源 , 找到发起调用的页面是我们小二后台的一个操作商家准入的页面 , 页面打开后直接调用分页查询接口 , 除了分页参数 , 不传入其他任何查询参数 , 导致扫描全表 。
3 分析
灵魂拷问:为什么要扫描全表?全表数据展示到页面 , 花里胡哨的数据有用吗?
调研:和经常使用这个页面的运营聊后了解到 , 打开页面查询出的全表数据对运营是没有用的 , 他们根本不看这些数据 。 运营的操作习惯是拿到商家id , 在页面查询框中输入商家id , 查到商家数据后进行操作 。
4 解决方案
由此优化方案就很明朗了:打开页面时不直接查询全量数据 , 等运营输入商家id后 , 将商家id作为参数进行查询 。 XXX_rules表中 , 商家id这一常用查询条件设置为索引 , 再结合分页查询优化 , 全表扫描慢sql得以解决 。
优化后的小二后台页面如下:

打开页面时未查询任何数据 , 查询条件商家账户为必填项 。
优化后的sql为:
SELECT count(*) AS tmp_count FROM ( SELECT * FROM `xxx_rules` WHERE 1 = 1 AND `rule_value` = '2928597xxx' ) a 执行EXPLAIN得到结果如下:

可以看到命中了索引 , 扫描行数为3 , 查询速度明显提高 。
5 思考
扫描全表治理简单来说就是加入查询条件 , 命中索引 , 去除全表扫描查询 , 虽然有些粗暴 , 但并不是没有道理 。 实际业务场景中 , 很少有要扫描全表获取全部数据的情况 , 限制调用上游必须传入查询条件 , 且该查询条件能命中索引 , 能很大程度上避免慢sql 。
另外 , 再引申下 , XXX_rules初始的用意是准入表 , 记录金融货主维度的准入情况 , 最多也就几千条数据 , 但是很多同事将这张表理解为规则表 , 写入很多业务相关规则 , 导致这个表膨胀到一百多万条数据 , 表不clean了 。 这就涉及到数据表的设计使用 , 明确表的使用规范 , 不乱写入数据 , 能给后期维护带来很大的便利 。
二 索引混乱 1 示例

2 分析
除了时间、操作人字段 , XXX_rules表就rule_name、rule_value、status、product_code四个字段 , 表的索引对这四个字段做各种排列组合 。 存在如下问题:
1、rule_name离散度不高 , 放在索引首位不合适;
2、前三个索引重合度很高;
显然是对索引的命中规则不够了解 。 XXX_rules表很多业务有定时任务对其写入删除 , 索引多、混乱 , 对性能有很大的影响 。
高性能的索引有哪些 , 再来回顾下:
1、独立的列:索引列不能是表达式的一部分;
2、选择区分度高的列作为索引;