漏洞概述 该漏洞涉及在调度器准入时未正确执行 的限制,导致在并发请求中, 断言失败并引发 SIGQUIT。此问题仅在模型级别强制执行,而调度器在准入时遗漏了其中一个已提交的 UID。 影响范围 并发请求:在并发请求中,当 被超过时, 断言失败。 调度器行为:调度器在准入时未正确计算和限制 LoRA 适配器数量,导致潜在的资源竞争和系统崩溃。 修复方案 1. 提取辅助函数: - 创建 函数,用于收集正在运行的解码批次和已提交的 LoRA 适配器 ID。 - 该函数确保在 之前正确计算 LoRA 适配器数量。 2. 更新调度器逻辑: - 在 中,使用新的 函数替代原有的 逻辑。 - 确保在 时,正确计算并限制 LoRA 适配器数量。 3. 测试验证: - 添加单元测试,验证修复后的逻辑是否正确处理各种场景,包括拒绝新适配器、接受相同适配器、未处理的行为等。 POC 代码 总结 该漏洞通过引入 函数并更新调度器逻辑,确保在调度器准入时正确执行 的限制,从而避免并发请求中的资源竞争和系统崩溃问题。