【事例】株式会社リクルート
当社監訳書籍『アジャイルデータモデリング - 組織にデータ分析を広めるためのテーブル設計ガイド』の寄稿事例をWEB掲載しています。
- 本書における寄稿事例の位置づけについては寄稿事例について を参照してください。
- 本ページに掲載している画像および図表については、いずれも同書籍からの引用となります。
株式会社リクルート
寄稿者:SaaSデータマネジメントグループ グループマネージャー 白子佳孝
株式会社リクルートのSaaSデータマネジメントグループでは、アジャイルなデータ分析を行えるようにさまざまな取り組みを行っています。より多くの人が、より迅速にデータを分析できるようになることを重視しています。風音屋では1年以上に渡ってリクルートのデータ整備に伴走しています。
リクルートの事例では、データモデリングはビジョン達成のための武器の1つです。綺麗なテーブルを設計することがゴールではありません。組織にデータ分析を広めるにあたって、データモデリングという活動の位置付けを考えるヒントにしていただければと思います。
SaaSデータマネジメントグループでは「Air ビジネスツールズ *1」のプロダクト関係者が意思決定の速度と精度を向上できるように、データ整備やデータ活用支援を行っています。メイン業務を担う役割を当社ではアナリティクスエンジニアと呼んでいます *2。
*1 「Air ビジネスツールズ」は、『Airレジ』『Airペイ』『Airシフト』をはじめとしたリクルートの業務・経営支援サービス
*2 https://blog.recruit.co.jp/data/articles/analytics_engineer_introduction/
「Air ビジネスツールズ」を利用するクライアントが日々直面する困りごとを解決するには、早期に課題を特定し、迅速に意思決定することが必要です。リクルートでは30分という短いミーティングで意思決定を行う場面があります。
プロダクトにかかわる人が、限られた時間内で迅速かつ正確な意思決定を行えるように、SaaSデータマネジメントグループでは「1秒で数値の確認」「2分で原因の深堀り」「30分で意思決定」できる状態の実現をビジョンとして掲げています(図1)。

図1 SaaSデータマネジメントグループが掲げるビジョン
「1秒で数値の確認」とは、ブックマークしておけばワンクリックで最新かつ正確な数値にアクセスできる状態を指します。そのためにダッシュボードとポータルサイトを整備しています。
ダッシュボードはステークホルダーに役立つものでなければいけません。「どのデータをどのように視覚化したいのか」「その数値をもとにどのような行動を取るのか」という点について、意思決定者の要望を聞き取りながら、段階的にダッシュボードを構築しています(図2)。
図2 段階的なダッシュボード構築
ダッシュボードのカラーコードや表現方法についてはデザインガイドラインを定めています(図3)。一貫性のあるUI(ユーザーインターフェース)を提供することで、ステークホルダーが短時間で直感的に数値を読み取ることが可能となります。
図3 ダッシュボードのカラーコード
社内ポータルサイトではKPI(重要業績評価指標)の論理定義および物理定義(SQL)を公開しています(図4)。データ利用者がサイトを開けば、すぐに用語や算出方法を確認できるようになっています。GitHub PagesとSphinxで構築しました。
図4 KPI定義の社内ポータルサイト
「2分で原因の深堀り」を実現するには、データ分析の迅速化が不可欠です。複雑なSQLを書かなくてもデータを深堀りできるように「信頼できる唯一の情報源」(SSOT:Single Source of Truth)となるテーブルを整備し、SSOTマートと呼んでいます。SQLレシピ集も提供しており、簡単なデータ集計であればサンプルSQLをコピー&ペーストするだけで実現可能です。
利用者に「信頼できる」と思ってもらうには、品質の維持・担保が重要です。SQLのコーディング規則を設けて保守性や再利用性を高める、テーブル名やカラム名の命名規則を適用して認識しやすくする、データの重複やNULL値の混入を監視するなど、さまざまな取り組みを行っています。その一つがテーブル設計の見直しです。
SSOTマートはワイドテーブル(大福帳)と呼ばれる形式で提供しています。ファクトとディメンションを結合した横長のテーブルです。最初はローデータからワイドテーブルを直に作成していたのですが、品質や保守性を向上させるべく、中間のレイヤーを設けるように作り直しているところです。ローデータに前処理や集計ロジックを適用した後、ファクト(fact_xxx)とディメンション(dim_xxx)のテーブルを作成し、最後にワイドテーブルにまとめるという構成を目指しています(図5)。入口と出口は変えずにデータ集計過程を整理するプロジェクトなので「SSOTマートのリファクタリング」と呼んでいます。
図5 SSOTマートに至るまでのテーブル構成
このテーブル設計にあたって、風音屋さんとワークショップを開催し、本書に出てくるイベントマトリックスの軽量版を作成しました(図6)。プロダクト利用をモニタリングするためのビジネスイベントとしては「申込」や「契約」が、分析の切り口となる7Wとしては「業種」「都道府県」などの企業属性や「申込日」などの契約情報が挙げられます。データモデリング推進の第一歩として、データの全体像と意味付けを把握できるようになりました。

図6 Air ビジネスツールズのイベントマトリックス(サンプル)
SaaSデータマネジメントグループでは「1秒・2分・30分」のビジョン達成に向けて、さまざまな取り組みを行ってきました。データモデリングはビジョン達成のための武器の1つとして位置付けています。綺麗なテーブルを設計することがゴールではありません。我々はまだ目指す世界を実現する途上にあります。さらなるデータ活用推進のため、今後もデータ分析環境を継続的にアップデートしていく予定です。