EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

SQL Server 2012 フルテキスト検索の新機能(前編)

edited by DB Online   2012/04/12 00:00

形態素解析のチューニング

 SQL Serverが採用している文字列抽出アルゴリズムは形態素解析です。そのため、先述したようなメリット/デメリットを理解したうえで使用する必要があります。

 比較的多くのユーザが、「検索対象内にデータは存在するはずなのに、意図したデータがヒットしない」という問題に頭を悩ませがちです。

 そのような場合は次のようなステップで、チューニングを進めると効果的です。

 1. 検索条件が内部的にどのように分割されているかを確認
   sys.dm_fts_parserを使用
      http://msdn.microsoft.com/ja-jp/library/cc280463(v=sql.110).aspx

 2. 必要があれば次の何れか(または全て)の作業をおこなう
  ●ユーザ辞書をメンテナンス
    ・ユーザ辞書の作成
     http://technet.microsoft.com/ja-jp/library/cc263242.aspx

    ・ユーザ辞書によるワードブレーカー動作のカスタマイズ
     http://msdn.microsoft.com/jajp/library/hh231252(v=sql.110).aspx

  ●ストップワードをメンテナンス
    ・ストップワードとストップリストの構成と管理
      http://msdn.microsoft.com/ja-jp/library/ms142551(v=sql.110).aspx

  ● 類義語辞典のメンテナンス
    類義語辞典の構成と管理
      http://msdn.microsoft.com/ja-jp/library/ms142491(v=sql.110).aspx


著者プロフィール

  • 平山理(ヒラヤマオサム)

    日本マイクロソフト株式会社 プレミアフィールドエンジニアリング プレミアフィールドエンジニア 日本マイクロソフトの Premier Field Engineering 部で、お客様に SQL Server をスムーズにお使いいただくための様々なお手伝いをしています。Sybase (現 SAP) 勤務時代の 5 年間とマイクロソフトでの 12 年間、データベース道を極めるために精進する毎日です。 二人の娘の父親であり、ハードロックを好む「バッタもん」ギタリストであり、毎月 300 km くらい走る (わりと) シリアス ランナーでもあります。著書に「絵で見てわかる SQL Server の内部構造」(翔泳社)

バックナンバー

連載:あたらしいSQL Server/Denaliの世界

もっと読む

All contents copyright © 2007-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5