优化Group By最有效的办法是当可以直接使用索引来完全获取需要group的字段。使用这个访问方法时,MySQL使用对关键字排序的索引的类型(比如BTREE索引)。这使得索引中用于group的字段不必完全涵盖WHERE条件中索引对应的key。由于只包含索引中关键字的一部分,因此称为松散的索引扫描。
历史上MySQL不能做松散的索引扫描,这种方式可以扫描索引的非连续部分,假定下面的例子中,在列(a,b)上有一索引,要运行下面的查询:
mysql> SELECT … FROM tbl WHERE b BETWEEN 2 AND 3;
因为索引从列a开始,但是WHERE没制定列a,MySQL将做全表扫描来消除不匹配的行。
很希望有快的方式来执行查询。某些索引结构(不是MySQL)让你定位到每个范围的开始,扫描到范围结束,然后跳到下一范围的开始。
这当然是相对简单的例子,也可以很容易通过再加一个不同的索引来达到目的。实际上,很多时候添加另一个索引不一定能解决问题。一个例子是某些查询在索引的第一个列上有范围条件在第二个列上有等价条件。
从MySQL 5.0 开始,松散索引扫描在一定条件是可能的,比如在分组查询中找到最大和最小值:
mysql> EXPLAIN SELECT actor_id, MAX(film_id)
-> FROM sakila.film_actor
-> GROUP BY actor_idG
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: film_actor
type: range
possible_keys: NULL
key: PRIMARY
key_len: 2
ref: NULL
rows: 396
Extra: Using index for group-by
在下面一些情况下是可以使用松散索引扫描的:
• 查询针对一个单表。
• GROUP BY包括索引的第1个连续部分(如果对于GROUP BY,查询有一个DISTINCT子句,则所有DISTINCT的属性指向索引开头)。
• 只使用累积函数(如果有)MIN()和MAX(),并且它们均指向相同的列。
• 索引的任何其它部分(除了那些来自查询中引用的GROUP BY)必须为常数(也就是说,必须按常量数量来引用它们),但MIN()或MAX() 函数的参数例外。