防止聊天机器人受到黑箱私隐推断攻击

简介

以语言模型为基础的聊天机器人倾向透露讲者的私隐，这项发明提供有效方法，防止黑箱私隐推断攻击入侵GPT-2。

商品化机会

技术授权协议／产业合作

解决方案

社交聊天机器人通过大型的预先训练语言模型迅速进化，虽然进展可观，但近年来引起对私隐的关注，特别是可经模型逆向攻击撷取大型语言模型的培训数据。这项发明可把人格推理准确度由37.6%大幅下降至0.5%，同时维持语言模型的强大生成能力。

创新技术

提出人格推理攻击可从聊天机器人隐藏的状态取得讲者的个人特质。
结合两种损失（KL和MI损失）以防止聊天机器人透露讲者的私下人格。

主要成效

识别聊天机器人透露个人资讯的威胁
建议有效抵御聊天机器人属性推理攻击的方法
保障私隐，而不损害聊天机器人的功能

应用范畴

边缘设备（智能电话）的聊天机器人
个人助理
客户服务聊天机器人

香港科技大学

香港科技大学（科大）（https://www.hkust.edu.hk/）是国际知名的研究型大学，其科学、工程、商业管理及人文社会科学领域，均臻达世界一流水准。科大校园国际化，提供全人教育及跨学科研究，培育具国际视野、创业精神及创新思维的优秀人才。逾八成的科大研究，于香港的大学教育资助委员会「2020研究评审工作」被评为「国际卓越」或「世界领先」水平。我们于最新的《泰晤士高等教育全球年轻大学排名榜2022》中排行第三，而科大的毕业生在2021年度的全球大学就业能力调查排名第23位，为亚洲院校前列。

查询