漏洞概述 漏洞名称: temperature=NaN and temperature=Infinity bypass validation and propagate to GPU kernels CVE ID: CVE-2024-54235 严重程度: Moderate 弱点: CWE-1287 摘要 所有温度验证门使用比较运算符(),这些运算符在Python的IEEE 754浮点语义中会静默评估为False,对于NaN和正Infinity。这两个值都通过了所有守卫并传播到GPU采样内核,导致未定义行为或CUDA错误,可能使推理工作器崩溃。注意:-Infinity被正确捕获。 根本原因 没有 或 检查存在于 中。 Python语义(已验证): , 影响 在GPU内核执行期间,NaN/Inf softmax输入导致推理工作器崩溃,降低所有并发用户的服务质量。 修复方案 添加 检查在 中。拒绝非有限浮点值,并返回400错误。 修复 该漏洞的修复已合并:#45116