@@ -135,7 +135,7 @@ head:
135135
1361361 . ** データ探索** : データ活用するために保持されているデータを発見または検索する
1371372 . ** データ準備** : 探索したデータを活用できる状態に加工し、分析基盤で扱える状態にする
138- 3 . ** データ活用** : ダッシュボード化や部門を横断してデータ分析を行ったり 、データ駆動の業務プロセスを確立する
138+ 3 . ** データ活用** : ダッシュボード化や部門を横断してデータ分析の実施や 、データ駆動の業務プロセスを確立する
1391394 . ** データ運用** : データ自体やデータ基盤のガバナンスの維持・運用を行う
140140
141141下記にそれぞれのフェーズにおいて発生しがちな課題や解決策およびユースケースを例示する。
@@ -203,21 +203,21 @@ head:
203203
204204# ロール定義
205205
206- データガバナンスを効かせつつ、オペレーションを行なっていくためには 、役割を定め、責任を明確化することが必要となる。必要なロールは組織のデータ利活用の成熟度や、組織・データの規模にも依存するが、データ基盤を運用するにあたって最低限設定することを推奨するロールを下記で表す 。専任であることは必須ではないが、各ロールに対してそれぞれ1名以上を配置することが望ましい。
206+ データガバナンスを効かせつつ、運用するためには 、役割を定め、責任を明確化することが必要となる。必要なロールは組織のデータ利活用の成熟度や、組織・データの規模にも依存するが、データ基盤を運用するにあたって最低限設定することを推奨するロールを下記で示す 。専任であることは必須ではないが、各ロールに対してそれぞれ1名以上を配置することが望ましい。
207207
208208| ロール名 | 説明 | 主な作業 | 求められるスキル |
209209| :----------------- | :--------------------------------------------------------------- | :-------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | :----------------------------------------------------------------------------------------------------------------- |
210- | データ基盤管理者 | データ基盤のルールを策定し、周知・監査を行いガバナンスを効かせる | ・データ管理ポリシー、ガイドラインの策定 ・データ品質の統制、コンプライアンス遵守の推進<br > ・アクセス権の管理 ・監視、監査の実施 | ・ポリシーやガイドラインを決めることができる推進力<br > ・リスク評価と改善の打ち手の実行力<br > ・各ロールとの調整力 |
210+ | データ基盤管理者 | データ基盤のルールを策定し、周知・監査を行いガバナンスを効かせる | ・データ管理ポリシー、ガイドラインの策定 ・データ品質の統制、コンプライアンス遵守の推進<br > ・アクセス権管理ポリシーの策定< br > ・監視、監査の実施 | ・ポリシーやガイドラインを決めることができる推進力<br > ・リスク評価と改善の打ち手の実行力<br > ・各ロールとの調整力 |
211211| データエンジニア | データ基盤の構築、運用を行う | ・データモデルの設計、構築<br > ・データ基盤のインフラ設計構築、運用<br > ・データ収集、変換、蓄積のためのデータパイプラインの開発、保守<br > ・データ基盤の実際のアクセス管理 | ・SaaS、クラウドインフラの設計・構築<br > ・プログラミングスキル(Python、SQLなど) |
212212| データスチュワード | データを利活用しやすいように、データやメタデータを維持管理する | ・データの管理者として特定のデータセットの品質、セキュリティ、利用を推進<br > ・データ利用のためのメタデータの登録<br > ・データコンシューマからのフィードバック収集 | ・データやメタデータに対する業務知識 |
213- | データコンシューマ | データを元に現状の分析分析や予測を行い 、業務を推進する | ・データ可視化、分析、レポート作成<br > ・業務への適用<br > ・データ利活用における問題点の提示 | ・データを業務適用させるための業務知識<br > ・BI利用経験 |
213+ | データコンシューマ | データを元に現状の分析や予測を行い 、業務を推進する | ・データ可視化、分析、レポート作成<br > ・業務への適用<br > ・データ利活用における問題点の提示 | ・データを業務適用させるための業務知識<br > ・BI利用経験 |
214214
215215各ロールを設定することを推奨するが、下記の場合はデータスチュワード不在を許容する。
216216
217217- データコンシューマのシステム知識が豊富であり、テーブル本体や、テーブル定義書を読んで理解することが可能
218218- データの参照方式がパターン化されており、新規のデータ利用が発生しない
219219
220- またどうしても人が足りない場合はデータ基盤管理者をデータエンジニア、スチュWordが兼任することを許容する 。ただし兼任としてしまうことで、データエンジニア、データスチュワードの行うデータマネジメントに対して、ガバナンスを効かせづらくなってしまうことが懸念点としてあげられる。
220+ またどうしても人が足りない場合はデータ基盤管理者をデータエンジニア、データスチュワードが兼任することを許容する 。ただし兼任としてしまうことで、データエンジニア、データスチュワードの行うデータマネジメントに対して、ガバナンスを効かせづらくなってしまうことが懸念点としてあげられる。
221221
222222``` mermaid
223223flowchart TD
@@ -1302,7 +1302,7 @@ graph TD
13021302
13031303# ## 列レベル可視性の制御による影響
13041304
1305- [列レベル可視性の制御](#列レベル可視性の制御) で、列そのものを非表示にする制御を行った場合は 、列レベルのデータカタログで該当列を除外する制御の追加が必要である。またサンプルデータなどテーブル粒度であっても該当の列が登場するようなメタデータは取り除く必要がある。マスキングを選択した場合もサンプルデータに対しては同様の対応が必要となる。この場合、サンプルデータはマスキングまたは除外済みのデータという厳しい側に倒したデータのみを提供するか、パターン別に提供する必要があるが、後者は設計・運用の両方の負荷が高い。
1305+ [列レベル可視性の制御](#列レベル可視性の制御) で、列そのものを非表示にする制御をする場合は 、列レベルのデータカタログで該当列を除外する制御の追加が必要である。またサンプルデータなどテーブル粒度であっても該当の列が登場するようなメタデータは取り除く必要がある。マスキングを選択した場合もサンプルデータに対しては同様の対応が必要となる。この場合、サンプルデータはマスキングまたは除外済みのデータという厳しい側に倒したデータのみを提供するか、パターン別に提供する必要があるが、後者は設計・運用の両方の負荷が高い。
13061306
13071307▼列の「存在秘匿」表示制御する際のサンプルデータ提供パターン
13081308
0 commit comments