Toilを無くして徒然なるままに日暮し硯に向かひたい

生成AIアプリケーション開発などを行うエンジニアのブログです。

Google Cloud DLP(Data Loss Prevention)を使ってデータのマスキングしてみた

DLP(Data Loss Prevention)とは?

DLP(Data Loss Prevention)は、直訳で「データ損失防止」を意味し、企業や組織が保有する機密データや個人情報などの漏えいを防止するための仕組み、またはそのプロセス全体を指します。

DLPの目的は、以下の通りです。

  • 機密データの特定: 個人情報、クレジットカード番号、社会保障番号など、企業にとって重要なデータを特定します。
  • データの分類: 特定されたデータを、機密レベルや種類などに応じて分類します。
  • データの保護: 分類されたデータに対して、アクセス制限、暗号化、匿名化などの適切な保護策を施します。
  • データ漏えいの検出: データ漏えいが発生した場合、早期に検出し、その原因を特定します。

Google CloudでDLPを使用してみた

Google Cloud Storage上にある個人情報を含むテスト用テキストデータを用意し、

下記記事の通り、コンソール上だけで個人情報のマスキングができました!便利!

ops.jig-saw.com

Geminiだけだとプロンプトを工夫してもマスキングはしてくれなかったので、DLPと併用しましょう。

なお、要約文中に個人情報を入れるな、というプロンプトは言うことを聞いてくれました。