关键漏洞信息 漏洞概述 漏洞类型: SSRF Bypass in RecursiveUrlLoader via insufficient URL origin validation CVE ID: CVE-2026-26019 严重性: Moderate (CVSS v3分数: 4.1/10) 影响范围 受影响版本: <= 1.1.13 修复版本: 1.1.14 包: @langchain/community 描述 RecursiveUrlLoader 类在 @langchain/community 中是一个从起始 URL 递归地跟踪链接的网络爬虫。 选项(默认启用)旨在将爬行限制在同一站点作为基础 URL。 问题: 实现使用 比较 URL,不进行语义 URL 验证。攻击者可以控制爬行页面的内容,包括链接到共享字符串前缀的域名,导致爬虫访问攻击者控制的或内部基础设施。 其他问题: 未对私有或保留的 IP 地址进行验证。 影响 攻击者可以利用此漏洞影响爬行页面的内容,导致爬虫: 获取云实例元数据(AWS, GCP, Azure) 访问私有网络上的内部服务 连接到 localhost 服务 通过攻击者控制的重定向链窃取响应数据 解决方案 替换 检查为严格的源比较,使用 URL API 确保方案、主机名、端口的正确验证。 添加 SSRF 验证到所有取操作,阻塞访问云元数据端点、私有 IP 范围、IPv6 等效地址。 解决措施 用户应避免在不受信任或用户影响的内容上使用 RecursiveUrlLoader ,或在没有访问云元数据或内部服务的网络环境中运行爬虫。