プライバシー保護連合学習技術を活用した
銀行不正送金検知
PPFLとは
プライバシー保護連合学習( PPFL:Privacy-Preserving Federated Learning) は、複数の個人や組織がもつ機微なデータを互いに直接共有しなくても、一つのAIモデルを協力し合って学習するスキームであり、医療、健康、金融分野などの、特に非競争分野での応用が期待されています。






PPFLが必要とされる理由
プライバシー保護データ解析とは、収集されたパーソナルデータが何らかの理由で漏えいして、攻撃者(興味本位でのぞき見する者も含む)が入手したとしても、そこから個人を特定できないようにする技術です。これには、匿名化、差分プライバシー、秘密計算、準同型暗号を用いる方法などがあり、それぞれを単独または組み合わせて使うことで、データの秘匿化を実現します。一般に、匿名性と有用性はトレードオフの関係にあり、匿名性を高めるとデータ漏えいによる損失を小さくできるが、そのデータから得られる情報量は少なくなります。これに対し、プライバシー保護連合学習(PPFL)は、匿名性と有用性を両立させる手法として期待されています。つまり、PPFLは組織間で互いに不足する情報を補って学習することに重点を置いており、個々の組織だけではカバーできない希少事例を直接共有せずに学習できるため、社会実装向きの技術と言えます。
これまでの取り組み
本研究室は、2016年度~2021年度にかけて、JST CREST『[人工知能] イノベーション創発に資する人工知能基盤技術の創出と統合化』を通して、国立研究開発法人情報通信研究機構(NICT)サイバーセキュリティ研究所セキュリティ基盤研究室と共同して、プライバシー保護連合学習の有効性を金融分野における社会課題の解決で実証する試みを行ってきました。具体的には、オレオレ詐欺のような特殊詐欺による被害者(高齢者など)の銀行口座からの不正出金をリアルタイムで検知したり、非合法ビジネス(違法薬物取引、ヤミ金融、違法カジノなど)の資金洗浄(マネーロンダリング)のために利用する犯罪者の口座特定などを、最大5銀行から提供された顧客口座データを使って行ってきました。この社会実証実験で開発された不正送金検知AIエンジンは再現率で0.8以上の検知精度をもち、連合学習の有効を示しました。また、実際の銀行業務のなかでAIエンジンを試用して頂き、その有効を実運用でも実証してきました。詳細は以下のプレスリリースをご覧下さい。
神戸大学プレスリリース
『プライバシー保護連合学習技術を活用した不正送金検知の実証実験を実施』
(2022.03.10発表)
フェーズ1で開発・実証した結果をさらに実用に資するものとするため、2022年度~2024年度にかけて、JST AIP加速課題『秘匿計算による安全な組織間データ連携技術の社会実装(JPMJCR22U5)』とNICT高度通信・放送研究開発委託研究『プライバシー保護連合学習の高度化に関する研究開発(課題番号229)』の助成を受け、さらに実用に資する不正送金検知AIエンジンとするため、NICTおよびEAGLYS株式会社と共同して以下の社会実証実験の取組みを継続しました(図参照)。
(1) 複数銀行間で継続的に協力して、新たな犯罪手口に適応しながら、安定して高い検知精度を維持する「継続学習」の技術
(2) 不正送金事例(正例データ)の希少性に起因する不均衡データ問題の解決のため、不正取引データを疑似的に生成する技術
(3) 不正送金検知AIへの敵対的攻撃による検知回避を意図したサイバー攻撃の検知と対策技術
これら技術を最大4銀行から提供された顧客口座データを使って開発を行い、複数銀行間での連合学習により検知精度を向上し得ること、疑似データの不均衡問題に対する有効性や不正検知を回避する攻撃の可能性を検証しました。
さらに、不正送金検知AIエンジンを銀行で実運用するための不正送金検知MLOpsのプロトタイプ(バックエンド)と銀行不正取引監視者が使うユーザインタフェース(フロントエンド)のシステムをEAGLYS株式会社が開発しました。

これまで得られた研究成果を、さらに実用に資する技術とするため、今後は金融機関と直接連携した社会実証実験が必要になると考えています。このため、EAGLYS株式会社が開発した不正送金検知プロトタイプとフロントエンドを金融機関にビジネス展開し、フェーズ2で得られた不正検知AIシステムの高精度化と高度化を実用化して行きます。これについては、神戸大学発ベンチャー企業である株式会社テラアクソン(代表:小澤誠一、安田一平)が神戸大学、NICT、EAGLYS株式会社と連携して進めて参ります。
開発したプライバシー
保護連合学習モデル
(eFL-Boost)
本研究室では、NICTと共同で勾配ブースティング決定木の連合学習方式である eFL-Boost(Efficient Federated Learning for Gradient Boosting Decision Trees)を開発*1し、特許申請*2を行っています。このeFL-Boostは、勾配ブースティング決定木の代表モデルであり、現在もコンペなどでよく使われるXGBoostの学習アルゴリズムとほぼ等価となります。
また、eFL-Boostに対してプライバシーを保護したまま、安定した継続学習を実現する新しい連合学習方式を開発しています。今後、この継続学習方式を拡張し、欠損値を自動補完する方式や連合学習に参加する組織への公平なインセンティブ配分をする仕組みの開発を行っていきます。
*1 F. Yamamoto, S. Ozawa, L. Wang, “eFL-Boost: Efficient Federated Learning for Gradient Boosting Decision Trees,” IEEE Access, vol.10, pp.43954-43963, 2022.
*2 国際出願PCT/JP2021/48383「協調学習システム及び協調学習方法」、発明者 王立華、山本楓己、小澤誠一

ユースケース
eFL-Boostの活用先として考えられる
ユースケースをご紹介します。
-
銀行不正取引の検知
銀行間でデータ共有が困難な状況でも、精度の高い不正取引の監視が可能
-
医療データの分析
患者様のプライバシーを守りながら、病気の早期発見や診断支援に活用可
-
防犯
監視カメラ等でプライバシーに配慮しながら、異常行動の検知や事故予測などが可能
お知らせ
あとがき

本研究室では、長年、機械学習の理論構築やアルゴリズム開発に携わってきました。それが、2016年にJST CREST『[人工知能] イノベーション創発に資する人工知能基盤技術の創出と統合化』に主たる共同研究者として参画することとなり、社会貢献を強く意識した応用研究に大きく方向転換をしました。当時、振り込め詐欺などにより高齢者の銀行口座がターゲットとされて社会問題となっており、これを何とかしたくて、NICTや株式会社エルテスと連携して、組織間連合学習を用いた不正送金検知AIの開発に乗り出しました。2016年10月にプロジェクトを始めてから、最初の2年程度は銀行から顧客データの提供をまったく受けられず、個人データの分析の難しさを痛感し、もどかしい思いをしたのは今となってはよい思い出です。
2019年からは千葉銀行、三菱UFJ銀行など5行が参加した社会実証実験を実施し、プライバシー保護連合学習が実データでも有効であることを実証する実験を2022年3月まで行いました。そして、2022年度からはJST「AIP加速課題」としてさらに3年間、マネーロンダリングで使われる犯罪者口座の特定を行うAI開発を行いました。この取り組みも、一定の成果を得て終わろうとしています。思い返せば、いろいろ大変だったことを思い出します。それでも、多くの方に意味のある取組みと言って頂ける社会課題に取り組めたことは、この上ない幸せでした。たいへん充実した8年間でした。
しかし、特殊詐欺や非合法ビジネスによる不正取引がなくなったわけではなく、むしろ深刻化している状況です。このプロジェクトで開発したプライバシー保護連合学習が真に実運用可能なレベルになるには、まだまだ努力と時間が必要となります。これを、自ら起業した神戸大学発ベンチャー「テラアクソン株式会社」で行えることは、つくづく幸運と思っています。今後とも皆様のご協力とご支援を賜りますようお願い申し上げます。
お問い合わせ
PPFLについてのお問い合わせは
こちらにお願いします。
〒657-8501 神戸市灘区六甲台町1-1
神戸大学 大学院工学研究科
電気電子工学専攻 知的学習論研究室
eng-es5-staff@lab.kobe-u.ac.jp