サブクエリ
MySQLが実装しているサブクエリ最適化手法についても注意点を触れておこう。サブクエリの実行計画の詳細についての解説は、本エントリでは割愛するので、詳しく知りたい人は次のブログエントリを参照して頂きたい。
漢(オトコ)のコンピュータ道: MySQLのEXPLAINを徹底解説!!
MySQLにおいてサブクエリに関する注意点を挙げるとすれば、それは下記の2つであろう。
- INサブクエリまたはそれに準じるANY/ALLを使ったサブクエリが相関サブクエリになる。
- FROM句のサブクエリは必ずマテリアライズされる。
MySQLでは、INサブクエリは内部的にEXISTSを用いたサブクエリと同じような実行計画になる。この点は知らなければ意外な落とし穴になってしまうので注意が必要だ。例えば次のようなINサブクエリについて考えてみよう。
mysql> EXPLAIN SELECT * FROM City WHERE CountryCode IN -> (SELECT Code FROM Country WHERE Name LIKE 'j%')\G *************************** 1. row *************************** id: 1 select_type: PRIMARY table: City type: ALL possible_keys: NULL key: NULL key_len: NULL ref: NULL rows: 4079 Extra: Using where *************************** 2. row *************************** id: 2 select_type: DEPENDENT SUBQUERY table: country type: unique_subquery possible_keys: PRIMARY key: PRIMARY key_len: 3 ref: func rows: 1 Extra: Using where 2 rows in set (0.00 sec)
サブクエリ自身に外部クエリへの相関は含まれていないが、実行計画を見るとなぜかselect_typeがDEPENDENT SUBQUERYとなっているのがお分かり頂けるだろうか。(相関のないサブクエリであればSUBQUERYになるはずだ。)これはなぜかというと、MySQLが内部的に次のようなクエリのようにみなして実行するからである。
SELECT * FROM City WHERE EXISTS ( SELECT 1 FROM Country WHERE Code = City.CountryCode AND Name LIKE 'j%' );
MySQLはサブクエリがある場合、外部クエリを先に実行してからサブクエリを評価するので、Cityテーブルからレコードをフェッチするたびにサブクエリが実行されることになり、とても効率が悪いのである。
ただし、先ほどのEXPLAINでは、サブクエリのレコードアクセスタイプがunique_subqueryとなっているが、このレコードアクセスタイプは実際にSELECTを実行するほど効率は悪くない。unique_subqueryというレコードアクセスタイプは、INサブクエリにおいてSELECTで指定するカラムが主キーまたはユニークなセカンダリインデックスの場合に用いることが出来るもので、SELECTではなくより簡略化された関数でレコードをフェッチするという最適化アルゴリズムである。似たような最適化アルゴリズムとして、index_subqueryというレコードアクセスタイプがある。こちらは、INサブクエリにおいてSELECTで指定するカラムがユニークでないインデックスの場合に用いられる最適化アルゴリズムであり、そこそこ効率が良い。レコードアクセスタイプがunique_subqueryまたはindex_subqueryの場合にはそれほどINサブクエリは遅くないのである。
ただし、サブクエリは必ず外部クエリから先に評価されるという制約があるため、可能であれば常にサブクエリよりもJOINを使うほうが望ましい。また、unique_subqueryまたはindex_subqueryを用いることができない場合にはサブクエリは効率が良くないのもJOINに書き換えるべき理由のひとつである。INサブクエリをJOINを使って書き換えるのは比較的簡単で、例えば先程のサブクエリはJOINを使って次のように書き換えることが出来る。
SELECT City.* FROM City JOIN Country WHERE Country.Code = City.CountryCode AND Country.Name LIKE 'j%';
ちなみに、UPDATEやDELETEではWHERE句の条件としてサブクエリを指定するしかない・・・と思われるかも知れないが、MySQLには複数のテーブルを使ってUPDATEやDELETEのための条件を指定するシンタックスが存在する。例えば、上記のSELECTに合致するレコードをCityテーブルから削除するには、次のようにDELETEを記述すれば良い。
DELETE City FROM City JOIN Country WHERE Country.Code = City.CountryCode AND Country.Name LIKE 'j%';
DELETEやUPDATEの詳細なシンタックスについてはマニュアルを参照して欲しい。
また、最新の開発版であるMySQL 5.6ではFROM句のサブクエリに対する最適化アルゴリズムが追加されている。詳細は下記のマニュアルページを参照して頂きたい。
Optimizing Subqueries in the FROM Clause - MySQL 5.6 Reference Manual