PostgreSQLのJSONB型を利用してタグ検索を行う

(Last Updated On: 2014/12/17)

遅れてしまいましたが、PostgreSQL Adventカレンダー2014の9日目です。昨年はタグ検索するならPostgreSQLで決まり!でPostgreSQLの特徴でもある配列型を使ったタグ検索を紹介しました。今年はJSONを使ってみたいと思います。

つい先程、PostgreSQL GitリポジトリからPostgreSQL 9.4のソースを取得&ビルドして記事を書いています。(記事を書くことを忘れていたので大急ぎで書きました)

お店や記事にタグ機能を付けたいことはくあります。PostgreSQLのJSONBなら簡単かつ高速なタグ検索機能を追加できます。Webシステムの強い味方になるはずです。

JSONB型を含むテーブルを作成

昨年書いた通りRDBMSはタグ検索が苦手です。しかし、PostgreSQLはRDBMSですが得意です!GINインデックスを使うと効率的に管理&検索できます。特にPostgreSQL 9.4からはGINが更に高速化されています。

基本的な構造は配列版と変わりません。

 

JSONBカラムにGINインデックスを作成

JSONB型として作ったtagsカラムにGINインデックスを作成します。

 

データを挿入してみる

JSONの配列型で新しいデータを挿入してみます。

tagsを配列型を使った場合は次のようになります。

解りづらいかも知れませんが、'{ }’と囲んでいる部分を'[ ]’に変えただけです。たったこれだけでWebアプリと親和性が高いJSONを使ってタグ検索ができるようになります。

 

検索してみる

単純にSELECTすると以下のようになります。

JSONB型として保存されていることがわかります。

 

タグ検索してみる

昨年の配列型の場合は以下のように検索しました。

今回はJSONB型を使っているので違う検索方法になります。JSONB/JSON型には9.15. JSON Functions and Operatorsのオペレータが使えます。マニュアルを見れば色々操作ができることが判ると思います。昨年と同じような感じで JSON配列から指定した要素を含むレコードを検索するには

?& text[] Do all of these key/element strings exist? ‘[“a”, “b”]’::jsonb ?& array[‘a’, ‘b’]

が利用できることが分かります。

無事検索できました。

 

インデックスが利用されていること確認

たった一行しかありませんが、インデックスが利用されていることがEXPLAIN ANALYZEで確認できました。(行数を増やすとオプティマイザが働いてSeqScanになりました。もっと増やすとインデックスを使うと思います)

JSONB型のインデックスは8.14.4. jsonb Indexingを参照すると使い方が分かります。

 

まとめ

以前、配列型でタグ検索を実装したので今回もJSON配列で作りました。もちろんオブジェクトでもGINで検索可能です。詳しくはPostgreSQLマニュアルを参照してください。

JSONBを使う場合の注意点は2つです。

  • 重複するキーは登録できない
  • キーの順序は維持されない

これはJSONBがハッシュを利用して実装されているためです。この制限がどうしても困る場合はJSON型を使いましょう。JSON型を使ってもPostgreSQLには関数インデックスという強力な味方があります。関数インデックスを使えば、テキストとして保存されているJSON型でも高速に検索可能です。

PostgreSQLのマニュアルも参照すると、配列型に較べ更に便利かつ強力になっていることがわかると思います。

PostgreSQLでタグ検索するならJSONBです!

Comments

comments

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です