暗躍するウェブスクレイピング 企業にとって見過ごせない脅威に
ウェブスクレイピングによって最も大きな被害を受けているのが、転売の対象として狙われやすい人気商品やチケットの販売を取り扱っているサイトだ。たとえば、日本を含む世界中の航空会社の予約サイトには、スクレイパーが押し寄せていて悩みの種になっている。いわゆる“転売ヤー”の操るボットは、航空会社のセールや販売開始時刻に合わせて、空き座席やプレミアのつく座席をボットで探り、一斉に仮予約で抑えてしまうのである。その後オークションサイトなどで転売し、売れ残ったチケットを航空会社のキャンセル費用が発生する期限ギリギリにリリースする。
このため、航空会社は空き座席の多い(稼働率の低い)状態で飛行機を飛ばすことになり、大きな損失を被ってしまう。転売目的の買い占めによる同様の被害防止の試みは、イベントチケットやプレミア価格のつく商品の販売でも引き続き試行錯誤が行われている。
一方、犯罪者は偽サイトを作るためにスクレイパーを使って、商品の画像や説明文、価格情報などのコンテンツを丸ごとコピーしている。こうして作られた偽サイトは、認証情報やクレジットカード情報の窃盗目的でのフィッシングや、偽ブランド品の販売に利用されているほか、有名人をかたる投資詐欺や、企業経営者を語るロマンス詐欺で騙す相手からの信用を得るためにも利用されている。
一部の偽サイトは驚くほど精巧にできており、たとえばEコマースサイトを模倣するケースでは、商品に対する利用者のコメントや、ショッピングカートなどの機能もある程度動くようコピーされているため、少し使った程度では偽造サイトだと気づけないだろう。
企業情報や素材の目録、記事、様々な分析データなど、有料/無料で提供されているデータをこっそり盗み取ろうとするスクレイピングも横行している。これは、Webやアプリ上で検索結果を表示するサービスに対し、ボットでアクセスを繰り返すことで、データベースに収められている価値のあるデータを丸ごと抜き盗ろうとする試みだ。商品の在庫や価格調査のボットも、これに分類されるだろう。
それが数件であれば誰でもアクセスできるデータであったとしても、群としてまとまったデータはその企業独自のアセット(資産)に他ならない。このようなデータ資産の盗難を阻止するとともに、規約に沿わない利用者の証拠を抑えるためにも、スクレイパー対策は企業にとって不可欠な要素になってきているのである。