EXPLAIN sql优化方法(2) Using temporary ; Using filesort

优化GROUP BY语句

默认情况下,MySQL对所有GROUP BY col1,col2...的字段进行排序。这与在查询中指定ORDER BY col1,col2...类似。因此,如果显式包括一个包含相同的列的ORDER BY子句,则对MySQL的实际执行性能没有什么影响。 如果查询包括GROUP BY 但用户想要避免排序结果的消耗,则可以指定ORDER By NULL禁止排序,例如:

Java代码  

  1. explain select id, sum(moneys) from sales2 group by id \G     
  2. explain select id, sum(moneys) from sales2 group by id order by null \G   

 你可以通过比较发现第一条语句会比第二句在Extra:里面多了Using filesort.而恰恰filesort是最耗时的。

 

优化ORDER BY语句

在某些情况中,MySQL可以使用一个索引来满足ORDER BY子句,而不需要额外的排序。WHERE 条件和 ORDER BY使用相同的索引,并且ORDER BY的顺序和索引顺序相同,并且ORDER BY的字段都是升序或者都是降序。

例如:

Java代码  

  1. SELECT * FROM t1 ORDER BY key_part1,key_part2,....:  
  2. SELECT * FROM t1 WHERE key_part1 = 1 ORDER BY key_part1 DESC,key_part2 DESC;  
  3. SELECT * FROM t1 ORDER BY key_part1 DESC, key_part2 DESC;  

但是以下的情况不使用索引:

Java代码  

  1. SELECT * FROM t1 ORDER BY key_part1 DESC, key_part2 ASC;  
  2. --ORDER by的字段混合ASC 和 DESC  
  3. SELECT * FROM t1 WHERE key2=constant ORDER BY key1;  
  4.  ----用于查询行的关键字与ORDER BY 中所使用的不相同  
  5.  SELECT * FROM t1 ORDER BY key1, key2;  
  6.  ----对不同的关键字使用ORDER BY  

 

Java代码  

  1.  mysql > explain select A . id , A . title , B . title from jos_content A left join jos_categories B on A . catid = B . id left join jos_sections C on A . sectionid = C . id order by B . id ;  
  2. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+---------------------------------+  
  3. | id | select_type | table | type    | possible_keys | key      | key_len | ref                      | rows   | Extra                            |  
  4. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+---------------------------------+  
  5. |  1 | SIMPLE       | A      | ALL     | NULL           | NULL     | NULL     | NULL                     | 46585 | Using temporary ; Using filesort |  
  6. |  1 | SIMPLE       | B      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . catid      |      1 |                                 |  
  7. |  1 | SIMPLE       | C      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . sectionid |      1 | Using index                      |  
  8. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+---------------------------------+  
  9. 3 rows in set ( 0.00 sec )  
  10.    
  11. mysql > explain select A . id , A . title , B . title from jos_content A left join jos_categories B on A . catid = B . id left join jos_sections C on A . sectionid = C . id order by A . id ;  
  12. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+----------------+  
  13. | id | select_type | table | type    | possible_keys | key      | key_len | ref                      | rows   | Extra           |  
  14. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+----------------+  
  15. |  1 | SIMPLE       | A      | ALL     | NULL           | NULL     | NULL     | NULL                     | 46585 | Using filesort |  
  16. |  1 | SIMPLE       | B      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . catid      |      1 |                |  
  17. |  1 | SIMPLE       | C      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . sectionid |      1 | Using index     |  
  18. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+-------+----------------+  

 对于上面两条语句,只是修改了一下排序字段,而第一个使用了Using temporary,而第二个却没有。在日常的网站维护中,如果有Using temporary出现,说明需要做一些优化措施了。

而为什么第一个用了临时表,而第二个没有用呢?
因为如果有ORDER BY子句和一个不同的GROUP BY子句,或者如果ORDER BY或GROUP BY中的字段都来自其他的表而非连接顺序中的第一个表的话,就会创建一个临时表了。
那么,对于上面例子中的第一条语句,我们需要对jos_categories的id进行排序,可以将SQL做如下改动:

Java代码  

  1. mysql > explain select B . id , B . title , A . title from jos_categories A left join jos_content B on A . id = B . catid left join jos_sections C on B . sectionid = C . id order by A . id ;  
  2. +----+-------------+-------+--------+---------------+-----------+---------+-------------------------+------+----------------+  
  3. | id | select_type | table | type    | possible_keys | key        | key_len | ref                      | rows | Extra           |  
  4. +----+-------------+-------+--------+---------------+-----------+---------+-------------------------+------+----------------+  
  5. |  1 | SIMPLE       | A      | ALL     | NULL           | NULL       | NULL     | NULL                     |    18 | Using filesort |  
  6. |  1 | SIMPLE       | B      | ref     | idx_catid      | idx_catid | 4        | joomla_test . A . id         | 3328 |                |  
  7. |  1 | SIMPLE       | C      | eq_ref | PRIMARY        | PRIMARY    | 4        | joomla_test . B . sectionid |    1 | Using index     |  
  8. +----+-------------+-------+--------+---------------+-----------+---------+-------------------------+------+----------------+  
  9. 3 rows in set ( 0.00 sec )  

这样我们发现,不会再有Using temporary了,而且在查询jos_content时,查询的记录明显有了数量级的降低,这是因为jos_content的idx_catid起了作用。
所以结论是:

尽量对第一个表的索引键进行排序,这样效率是高的。 
我们还会发现,在排序的语句中都出现了Using filesort,字面意思可能会被理解为:使用文件进行排序或中文件中进行排序。实际上这是不正确的,这是一个让人产生误解的词语。 
当我们试图对一个没有索引的字段进行排序时,就是filesoft。它跟文件没有任何关系,实际上是内部的一个快速排序。 
然而,当我们回过头来再看上面运行过的一个SQL的时候会有以下发现:

Java代码  

  1. mysql > explain select A . id , A . title , B . title from jos_content A , jos_categories B , jos_sections C where A . catid = B . id and A . sectionid = C . id order by C . id ;  
  2. +----+-------------+-------+--------+-----------------------+-------------+---------+---------------------+-------+-------------+  
  3. | id | select_type | table | type    | possible_keys          | key          | key_len | ref                  | rows   | Extra        |  
  4. +----+-------------+-------+--------+-----------------------+-------------+---------+---------------------+-------+-------------+  
  5. |  1 | SIMPLE       | C      | index   | PRIMARY                | PRIMARY      | 4        | NULL                 |      1 | Using index |  
  6. |  1 | SIMPLE       | A      | ref     | idx_catid , idx_section | idx_section | 4        | joomla_test . C . id     | 23293 | Using where |  
  7. |  1 | SIMPLE       | B      | eq_ref | PRIMARY                | PRIMARY      | 4        | joomla_test . A . catid |      1 | Using where |  
  8. +----+-------------+-------+--------+-----------------------+-------------+---------+---------------------+-------+-------------+  
  9. 3 rows in set ( 0.00 sec )  

这是我们刚才运行过的一条语句,只是加了一个排序,而这条语句中C表的主键对排序起了作用,我们会发现Using filesort没有了。
而尽管在上面的语句中也是对第一个表的主键进行排序,却没有得到想要的效果(第一个表的主键没有用到),这是为什么呢?实际上以上运行过的所有left join的语句中,第一个表的索引都没有用到,尽管对第一个表的主键进行了排序也无济于事。不免有些奇怪!

于是我们继续测试了下一条SQL:

Java代码  

  1. mysql > explain select A . id , A . title , B . title from jos_content A left join jos_categories B on A . catid = B . id left join jos_sections C on A . sectionid = C . id where A . id < 100 ;  
  2. +----+-------------+-------+--------+----------------+---------+---------+-------------------------+------+-------------+  
  3. | id | select_type | table | type    | possible_keys   | key      | key_len | ref                      | rows | Extra        |  
  4. +----+-------------+-------+--------+----------------+---------+---------+-------------------------+------+-------------+  
  5. |  1 | SIMPLE       | A      | range   | PRIMARY         | PRIMARY | 4        | NULL                     |    90 | Using where |  
  6. |  1 | SIMPLE       | B      | eq_ref | PRIMARY         | PRIMARY | 4        | joomla_test . A . catid      |    1 |             |  
  7. |  1 | SIMPLE       | C      | eq_ref | PRIMARY         | PRIMARY | 4        | joomla_test . A . sectionid |    1 | Using index |  
  8. +----+-------------+-------+--------+----------------+---------+---------+-------------------------+------+-------------+  
  9. 3 rows in set ( 0.05 sec )  

然后,当再次进行排序操作的时候,Using filesoft也没有再出现

Java代码  

  1. mysql > explain select A . id , A . title , B . title from jos_content A left join jos_categories B on A . catid = B . id left join jos_sections C on A . sectionid = C . id where A . id < 100 order by A . id ;  
  2. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+------+-------------+  
  3. | id | select_type | table | type    | possible_keys | key      | key_len | ref                      | rows | Extra        |  
  4. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+------+-------------+  
  5. |  1 | SIMPLE       | A      | range   | PRIMARY        | PRIMARY | 4        | NULL                     |  105 | Using where |  
  6. |  1 | SIMPLE       | B      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . catid      |    1 |             |  
  7. |  1 | SIMPLE       | C      | eq_ref | PRIMARY        | PRIMARY | 4        | joomla_test . A . sectionid |    1 | Using index |  
  8. +----+-------------+-------+--------+---------------+---------+---------+-------------------------+------+-------------+  
  9. 3 rows in set ( 0.00 sec )  

这个结果表明:对where条件里涉及到的字段,Mysql会使用索引进行搜索,而这个索引的使用也对排序的效率有很好的提升。
写了段程序测试了一下,分别让以下两个SQL语句执行200次:

Java代码  

  1. select A . id , A . title , B . title from jos_content   A left join jos_categories B on A . catid = B . id left join jos_sections C   on A . sectionid = C . id  
  2. select A . id , A . title , B . title from jos_content   A , jos_categories B , jos_sections C where A . catid = B . id and   A . sectionid = C . id  
  3. select A . id , A . title , B . title from jos_content A left   join jos_categories B on A . catid = B . id left join jos_sections C on   A . sectionid = C . id   order by rand () limit 10  
  4. select A . id from   jos_content A left join jos_categories B on B . id = A . catid left join   jos_sections C on A . sectionid = C . id order by A . id  

结果是第(1)条平均用时20s ,第(2)条平均用时44s ,第(3)条平均用时70s ,第(4)条平均用时2s 。而且假如我们用explain观察第(3)条语句的执行情况,会发现它创建了temporary表来进行排序。

综上所述,可以得出如下结论: 
1. 对需要查询和排序的字段要加索引。
2. 在一定环境下,left join还是比普通连接查询效率要高,但是要尽量少地连接表,并且在做连接查询时注意观察索引是否起了作用。
3. 排序尽量对第一个表的索引字段进行,可以避免mysql创建临时表,这是非常耗资源的。
4. 对where条件里涉及到的字段,应适当地添加索引,这样会对排序操作有优化的作用。
5. 在做随机抽取数据的需求时,避免使用order by rand(),从上面的例子可以看出,这种是很浪费数据库资源的,在执行过程中用show processlist查看,会发现第(3)条有Copying to tmp table on disk。而对(3)和(4)的对比得知,如果要实现这个功能,最好另辟奚径,来减轻Mysql的压力。
6. 从第4点可以看出,如果说在分页时我们能先得到主键,再根据主键查询相关内容,也能得到查询的优化效果。通过国外《High Performance MySQL》专家组的测试可以看出,根据主键进行查询的类似“SELECT ... FROM... WHERE id = ...”的SQL语句(其中id为PRIMARYKEY),每秒钟能够处理10000次 以上的查询,而普通的SELECT查询每秒只能处理几十次到几百次 。涉及到分页的查询效率问题,网上的可用资源越来越多,查询功能也体现出了它的重要性。也便是sphinx、lucene这些第三方搜索引擎的用武之地了。
7. 在平时的作业中,可以打开Mysql的Slow queries功能,经常检查一下是哪些语句降低的Mysql的执行效率,并进行定期优化。

时间: 2024-12-27 22:35:55

EXPLAIN sql优化方法(2) Using temporary ; Using filesort的相关文章

EXPLAIN sql优化方法(1) 添加索引

添加索引优化器更高效率地执行语句  假设我们有两个数据表t1和t2,每个有1000行,包含的值从1到1000.下面的查询查找出两个表中值相同的数据行: Java代码   mysql> SELECT t1.i1, t2.i2 FROM t1, t2 WHERE t1.i1 = t2.i2;   +------+------+   | i1 | i2 |   +------+------+   | 1 | 1 |   | 2 | 2 |   | 3 | 3 |   | 4 | 4 |   | 5 |

EXPLAIN sql优化方法(3)DERIVED

派生表和视图的性能 从MySQL 4.1开始,它已经支持派生表.联机视图或者基本的FROM从句的子查询. 这些特性之间彼此相关,但是它们之间的性能比较如何呢? MySQL 5.0 中的派生表似乎和视图实现的方式不同,尽管我从合并的代码基数来看觉得在查询优化上应该是一样的. 派生表仍然以临时表的方式显式地处理,而且还是没有索引的临时表(因此最好不要像在例子中那样连接2个派生表) 需要考虑的另一方面是,派生表需要被显式处理,尽管只是执行 EXPLAIN 语句.因此如果在 FROM 字句中的 SELE

千万级的mysql数据库与sql优化方法

对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id from t where num=0 3.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使

不懂业务的SQL优化方法

看着如下长长的SQL,对于其要实现的功能一无所知,开发人员需要根据领导的需要调整该SQL并导出产生的数据,但每次运行都要5分钟左右,对对于开发,调试和领导确认都不能接受,开发人员直接将此SQL转给我优化,由于此SQL并不写入应用且手工执行频率很高,于是最直接的方法就是先并行加快sql的执行速度 WITH T_MAST AS(  SELECT          T3.BASE_YW         ,T2.USER_ID         ,T2.USER_NM            ,T2.BRN

浅谈SQL优化方法

一. 什么情况下需要优化SQL? 1.单个查询执行时间非常长 2.许多查询执行时间过长,但是有一个代表性的可以调整(使用绑定变量) 二.什么情况下会触发SQL慢? 1.数据库版本的升级改变了行为或有bug 2.统计信息不正确 3.数据变化 4.应用变化 三.什么地方会出错呢? 1.索引:没被创建.建了但无效.建了但没走索引 2.表连接的顺序错了 3.表连接的类型错了 4.谓词没有推进,视图没有合并 5.查询转化不当(COST) 6.其它问题 查看本栏目更多精彩内容:http://www.bian

总结SQL执行进展优化方法_MsSql

在本文中,小编将与大家重点探讨SQL执行进展优化的方法. 聚集索引扫描 SELECT * FROM C_SY_Ownedstorm 聚集索引扫描比表扫描快 聚集索引扫描:发生于聚集表,也相当于全表扫描操作,但在针对聚集列的条件等操作时,效率会较好. 表扫描 SELECT * FROM #temp 表扫描:发生于堆表,并且没有可用的索引时,会发生表扫描,表示整个表扫描一次. 测试SQL CREATE TABLE t1(c1 INT, c2 VARCHAR (8000)); GO DECLARE @

踩坑CBO,解决那些坑爹的SQL优化问题

本文根据DBAplus社群第93期线上分享整理而成.   讲师介绍  丁俊 新炬网络首席性能优化专家 SQL审核产品经理   DBAplus社群联合发起人,<剑破冰山-Oracle开发艺术>副主编. Oracle ACEA,ITPUB开发版资深版主,十年电信行业从业经验.   本次分享大纲: CBO优化器存在哪些坑 CBO优化器坑的解决之道 加强SQL审核,将性能问题扼杀于襁褓之中 分享现场FAQ   CBO( Cost Based Optimizer)优化器是目前Oracle广泛使用的优化器

详解MySQL 数据库优化方法

用analyze进行处理,定期进行处理 ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tb1_name[, tbl_name]... 对表进行定义分析analyze table table_name CHECK TABLE tb1_name[,tbl_name]...[option]...option = {QUICK | FAST | MEDIUM | EXTENDED | CHANGED} 定期对表进行优化 OPTIMIZE [LOCAL | NO_W

被埋没的SQL优化利器——Oracle SQL monitor

转载声明:本文为DBA+社群原创文章,转载必须连同本订阅号二维码全文转载,并注明作者名字及来源:DBA+社群(dbaplus).    据说,在Oracle企业版数据库中有一个免费的工具,乃SQL优化之利器,那就是Oracle SQL monitor.下面,由DBA+社群原创专家周俊,给大家科普一下这一被埋没的神器.   专家简介    周俊 DBA+社群原创专家   具有14年以上Oracle数据库技术支持经验,在IBM的7年间担任华东区非IBM logo产品技术支持团队team leader