3月13日 消息:清华大学与阿里安全联合发布了概念半透膜模型(SPM),这一模型能够在 Diffusion 架构的 AI 作图模型中,精准、可控地擦除各类具象或抽象概念。
该模型的推出解决了传统 AI 作图模型存在的生成涉黄、侵权等危险概念的问题,实现了对特定概念的精确擦除。
概念半透膜模型通过一维 Adapter 和微调策略实现概念擦除,同时保留其他生成内容。Adapter 作为一种「半透薄膜」插入到预训练的 Diffusion Model(DM)中,学习特定概念的可迁移识别及擦除,同时保持模型完整性。通过微调策略 Latent Anchoring,模型获得对特定概念的擦除半渗透性,有效地擦除目标概念并保留其他概念。模型在推理过程中通过 Facilitated Transport 机制动态适配擦除信号,控制擦除效果,保证生成内容的准确性和完整性。
概念半透膜模型的实验效果表明,在单概念或多概念擦除时,模型能够稳定且彻底地擦除目标概念,同时对其他概念几乎没有影响。与其他方法相比,该模型具有更高的精确性和可控性,为 AI 作图模型的应用带来新的可能性。
这一研究成果有望在 AI 内生安全领域、可控生成等方面发挥重要作用,推动 AI 技术产品向着可用、可靠、可信、可控的方向发展。
SPM特色功能亮点总结如下:
项目入口:https://top.aibase.com/tool/spm
论文网址:https://arxiv.org/abs/2312.16145
如果您对概念半透膜模型感兴趣,请点击链接查看更多详情,欢迎留下您宝贵的评论,关注我们的最新动态,点赞支持,感谢您的观看!