DB Press

SQLite4の開発物語

db tech showcase2017 スペシャルセッション

小幡一郎[著]

更新日: 2017/10/20
公開日: 2017/10/19

通知

　世界で一番使われているデータベース：SQLite。その生みの親であるRichard Hipp氏がSQLiteリリース4の2年間の開発を通して学んだ新しい知見を語ってもらいました。最後に大どんでん返し。Sqlite3に戻ってきます！

通知

SQLiteの歴史

2000年リリース1 HashベースのGDBMストレージエンジン 　
　SQLite1はGPLのGDBM(GNU Database Manager)エンジンを使ったので、その流れからライセンスはGPLで始まります(現在はパブリックドメイン)。この時からServerlessとSinglefile databaseがSQLiteの基本方針です。しかし、元となったGDBMはHashテーブルでありレンジスキャンができないので、Berkeley DBのドキュメントを2日ほど読んでからB-Treeストレージエンジンの開発を始めました。

2001年リリース2 B-Treeストレージエンジン 　
　SQLiteが携帯電話や自動車、冷蔵庫などに搭載され広がり始めたのです。今はもうなくなりましたが携帯大手のモトローラから「バイナリーデータをサポートしてほしい」と言われてSQLite3の開発が始まりました。

2004年リリース３　バイナリデータのサポート

LSMへの挑戦

　まず初めに、データベースとストレージエンジンを混同しないでください。MySQLやPostgresと言ったらデータベースです。そして以下は有名なストレージエンジンの一部です：

Berkeley DB 　GDBM 　LevelDB　 LMDB　 RocksDB　 Kyoto Cabinet

　データベースはSQLを解析してエンジンの実行バイトコードにします。対してストレージエンジンはバイトコードを解析しファイルにアクセスします。

B-TreeとLSM(Log Structured Merge)

　現在の二大ストレージエンジンと言えばB-TreeとLSMです。LSMが新しくて良いという風潮もありますが、果たして本当にそうなのでしょうか?

B-tree = slow and bad
LSM = fast and good

B-Treeの問題はWrite Amplification（書き込み増幅）

　たった20バイトのInsertでも「ページ単位で書き込まなければいけない」のを表しているのが以下の図です。隣り合うデータは物理的に書き戻されていることになります。これは無駄だしSSDなんかには最適とは言えません。新しい波はLSMをベースにしています。

LSMの魅力は”blind” write

　NoSQLのHBaseやBigTableなんかがB-Treeのように隣り合う値をページ単位でReadしてからWriteするなんて無駄なI/Oは、扱うデータ量を考えると致命的ですよね？ blind writeは「無条件にWriteする」という点で優れているのです。

まずメモリ上で作られたB-Treeが塊でディスクにwriteされ

３回writeされたイメージがこうなります

そして次にバックグラウンドプロセスとかで溜まったb-treeをMergeします

このmergeで階層(Level)が作られていくわけです。そう、これが有名なLevelDBの語源です。

　SQLite4のLSM開発にはTokuDBの開発者でもあるDan Kennedyが参加しました。当然、SQLite3より高速にするのが目的です。確かにLevelDBより高速になるための改良点はたくさんありました。ところがそこには盲点もあったのです。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます
・翔泳社の本が買える！
500円分のポイントをプレゼント

メールバックナンバー

新規会員登録無料

Page 1
Page 2
- LSMの魅力blind write
- SQLite3のI/Oは通常のファイルシステムより高速
Page 3
- 最後に
- 追記

次のページ
LSMの魅力blind write

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

DB Press連載記事一覧: パナソニックコネクト／NTTドコモに見る、Snowflakeを駆使した“AI現場実装”の...

サミットの小売りDXを加速させるDB戦略──「ラフに扱っても止まらない」TiDBで実現した...

Snowflakeが年次サミットで示したエージェント“司令塔”の価値──AI暴走の懸念にど...

もっと読む

この記事の著者: 小幡一郎（オバタイチロウ）

DBOnline特命記者　ユーザ企業としてPCやオフコンからコンピュータキャリアはスタートし、メインフレーム・パッケージベンダーそして日本オラクルを経て1995年インサイトテクノロジーを設立。2007年、インサイトテクノロジーから離れ、デンマークのMiracleグループに参加、ミラクル・アジアパシフ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事