防止聊天机器人受到黑箱私隐推断攻击

香港科技大学
简介

以语言模型为基础的聊天机器人倾向透露讲者的私隐,这项发明提供有效方法,防止黑箱私隐推断攻击入侵GPT-2。

  • 防止聊天机器人受到黑箱私隐推断攻击
商品化机会
技术授权协议/产业合作
解决方案

社交聊天机器人通过大型的预先训练语言模型迅速进化,虽然进展可观,但近年来引起对私隐的关注,特别是可经模型逆向攻击撷取大型语言模型的培训数据。 这项发明可把人格推理准确度由37.6%大幅下降至0.5%,同时维持语言模型的强大生成能力。

创新技术
  • 提出人格推理攻击可从聊天机器人隐藏的状态取得讲者的个人特质。
  • 结合两种损失(KL和MI损失)以防止聊天机器人透露讲者的私下人格。
主要成效
  • 识别聊天机器人透露个人资讯的威胁
  • 建议有效抵御聊天机器人属性推理攻击的方法
  • 保障私隐,而不损害聊天机器人的功能
应用范畴
  • 边缘设备(智能电话)的聊天机器人
  • 个人助理
  • 客户服务聊天机器人
香港科技大学

香港科技大学(科大)(https://www.hkust.edu.hk/)是国际知名的研究型大学,其科学、工程、商业管理及人文社会科学领域,均臻达世界一流水准。科大校园国际化,提供全人教育及跨学科研究,培育具国际视野、创业精神及创新思维的优秀人才。逾八成的科大研究,于香港的大学教育资助委员会「2020研究评审工作」被评为「国际卓越」或「世界领先」水平。我们于最新的《泰晤士高等教育全球年轻大学排名榜2022》中排行第三,而科大的毕业生在2021年度的全球大学就业能力调查排名第23位,为亚洲院校前列。

查询