EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

003 MySQLチューニング虎の巻/ソートに関連するトピックとクエリの書き換え

edited by DB Online   2012/01/17 00:00

サブクエリ

 MySQLが実装しているサブクエリ最適化手法についても注意点を触れておこう。サブクエリの実行計画の詳細についての解説は、本エントリでは割愛するので、詳しく知りたい人は次のブログエントリを参照して頂きたい。

漢(オトコ)のコンピュータ道: MySQLのEXPLAINを徹底解説!!

 MySQLにおいてサブクエリに関する注意点を挙げるとすれば、それは下記の2つであろう。

  1.  INサブクエリまたはそれに準じるANY/ALLを使ったサブクエリが相関サブクエリになる。
  2.   FROM句のサブクエリは必ずマテリアライズされる。

 MySQLでは、INサブクエリは内部的にEXISTSを用いたサブクエリと同じような実行計画になる。この点は知らなければ意外な落とし穴になってしまうので注意が必要だ。例えば次のようなINサブクエリについて考えてみよう。

mysql> EXPLAIN SELECT * FROM City WHERE CountryCode IN
    -> (SELECT Code FROM Country WHERE Name LIKE 'j%')\G
*************************** 1. row ***************************
           id: 1
  select_type: PRIMARY
        table: City
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 4079
        Extra: Using where
*************************** 2. row ***************************
           id: 2
  select_type: DEPENDENT SUBQUERY
        table: country
         type: unique_subquery
possible_keys: PRIMARY
          key: PRIMARY
      key_len: 3
          ref: func
         rows: 1
        Extra: Using where
2 rows in set (0.00 sec)

 サブクエリ自身に外部クエリへの相関は含まれていないが、実行計画を見るとなぜかselect_typeがDEPENDENT SUBQUERYとなっているのがお分かり頂けるだろうか。(相関のないサブクエリであればSUBQUERYになるはずだ。)これはなぜかというと、MySQLが内部的に次のようなクエリのようにみなして実行するからである。


SELECT * FROM City WHERE EXISTS (
  SELECT 1 FROM Country WHERE Code = City.CountryCode AND Name LIKE 'j%'
);

 MySQLはサブクエリがある場合、外部クエリを先に実行してからサブクエリを評価するので、Cityテーブルからレコードをフェッチするたびにサブクエリが実行されることになり、とても効率が悪いのである。

 ただし、先ほどのEXPLAINでは、サブクエリのレコードアクセスタイプがunique_subqueryとなっているが、このレコードアクセスタイプは実際にSELECTを実行するほど効率は悪くない。unique_subqueryというレコードアクセスタイプは、INサブクエリにおいてSELECTで指定するカラムが主キーまたはユニークなセカンダリインデックスの場合に用いることが出来るもので、SELECTではなくより簡略化された関数でレコードをフェッチするという最適化アルゴリズムである。似たような最適化アルゴリズムとして、index_subqueryというレコードアクセスタイプがある。こちらは、INサブクエリにおいてSELECTで指定するカラムがユニークでないインデックスの場合に用いられる最適化アルゴリズムであり、そこそこ効率が良い。レコードアクセスタイプがunique_subqueryまたはindex_subqueryの場合にはそれほどINサブクエリは遅くないのである。

 ただし、サブクエリは必ず外部クエリから先に評価されるという制約があるため、可能であれば常にサブクエリよりもJOINを使うほうが望ましい。また、unique_subqueryまたはindex_subqueryを用いることができない場合にはサブクエリは効率が良くないのもJOINに書き換えるべき理由のひとつである。INサブクエリをJOINを使って書き換えるのは比較的簡単で、例えば先程のサブクエリはJOINを使って次のように書き換えることが出来る。


SELECT City.* FROM City JOIN Country WHERE Country.Code = City.CountryCode AND Country.Name LIKE 'j%';

 ちなみに、UPDATEやDELETEではWHERE句の条件としてサブクエリを指定するしかない・・・と思われるかも知れないが、MySQLには複数のテーブルを使ってUPDATEやDELETEのための条件を指定するシンタックスが存在する。例えば、上記のSELECTに合致するレコードをCityテーブルから削除するには、次のようにDELETEを記述すれば良い。

DELETE City FROM City JOIN Country WHERE Country.Code = City.CountryCode AND Country.Name LIKE 'j%';

 DELETEやUPDATEの詳細なシンタックスについてはマニュアルを参照して欲しい。

 また、最新の開発版であるMySQL 5.6ではFROM句のサブクエリに対する最適化アルゴリズムが追加されている。詳細は下記のマニュアルページを参照して頂きたい。

Optimizing Subqueries in the FROM Clause - MySQL 5.6 Reference Manual


著者プロフィール

バックナンバー

連載:MySQLチューニング虎の巻
All contents copyright © 2007-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5