漏洞总结:LM-Sys FastChat <= 0.2.36 内容审核绕过 (CVE-670) 漏洞概述 LM-Sys FastChat 平台(包括 Anonymous Arena 和 Vision Arenas 模式)存在内容审核绕过漏洞。在部分模块中,由于复制粘贴错误,应用错误地读取了 而不是 ,导致整个对话上下文被用户的短输入消息替换,从而跳过了对话历史检查。 影响范围 受影响版本:LM-Sys FastChat <= 0.2.36 受影响模块: - - - 漏洞类型:内容审核绕过、安全策略违规 修复方案 将代码中错误使用的 替换为正确的 ,以确保模型 B 的生成历史被正确读取。 POC 代码 利用步骤 1. 导航到 FastChat Anonymous Arena (Battle) 或 Vision Anonymous Arena 网页界面。 2. 发起多轮对话。首先,提示两个模型生成可能接近审核边界但能成功的内容。 3. 在第二轮中,发送一个简短的良性后续提示(例如,“告诉我更多”或“继续”)。后端在不检查模型 B 先验上下文的情况下评估短提示,从而允许严重违反政策的上下文无限期地持续存在,因为内容审核过滤器会丢弃历史窗口。 危害 内容审核绕过:完全无视模型 B 的历史,导致严重违反政策的上下文无限期持续。 安全策略违规:用户可以生成不受限制的有害文本或图像,连续多轮会话安全地绕过过滤器。