防止聊天機器人受到黑箱私隱推斷攻擊

香港科技大學
簡介

以語言模型為基礎的聊天機器人傾向透露講者的私隱,這項發明提供有效方法,防止黑箱私隱推斷攻擊入侵GPT-2。

  • 防止聊天機器人受到黑箱私隱推斷攻擊
商品化機會
技術授權協議/產業合作
解決方案

社交聊天機器人透過大型的預先訓練語言模型迅速進化,雖然進展可觀,但近年來引起對私隱的關注,特別是可經模型逆向攻擊擷取大型語言模型的培訓數據。這項發明可把人格推理準確度由37.6%大幅下降至0.5%,同時維持語言模型的強大生成能力。

創新技術
  • 提出人格推理攻擊可從聊天機器人隱藏的狀態取得講者的個人特質。
  • 結合兩種損失(KL和MI損失)以防止聊天機器人透露講者的私下人格。
主要成效
  • 識別聊天機器人透露個人資訊的威脅
  • 建議有效抵禦聊天機器人屬性推理攻擊的方法
  • 保障私隱,而不損害聊天機器人的功能
應用範疇
  • 邊緣設備(智能電話)的聊天機器人
  • 個人助理
  • 客戶服務聊天機器人
香港科技大學

香港科技大學(科大)(https://www.hkust.edu.hk/)是國際知名的研究型大學,其科學、工程、商業管理及人文社會科學領域,均臻達世界一流水準。科大校園國際化,提供全人教育及跨學科研究,培育具國際視野、創業精神及創新思維的優秀人才。逾八成的科大研究,於香港的大學教育資助委員會「2020研究評審工作」被評為「國際卓越」或「世界領先」水準。我們於最新的《泰晤士高等教育全球年輕大學排名榜2022》中排行第三,而科大的畢業生在2021年度的全球大學就業能力調查排名第23位,為亞洲院校前列。

查詢