王苑：人工智能预训练中大规模抓取个人信息的合法性困境与出路

发布者：宋宁伟发布时间：2025-10-15浏览次数：10

【摘要】人工智能（AI）预训练中大规模抓取个人信息的法律根据存疑。目前欧盟已明确数据控制者正当利益系该场景下的合法性基础，但我国实在法上并无类似条款。而大规模抓取的无差别性导致抓取时已公开个人信息与元数据或敏感个人信息难以界分，因此已公开个人信息的合理使用规则在此情形下无法适用，同时敏感个人信息单独同意规则亦欠缺实践可行性。《个人信息保护法》第13条第1款第5项公共利益条款适用范围狭窄，可通过扩张解释具有普惠价值的AI预训练有公共利益，寻求现行法的合法性支撑。但鉴于AI发展下的多重利益格局，应考虑在未来AI相关立法中明确“预训练场景下个人信息的原则可抓取”，辅以配套制度确保抓取的合法、正当、必要及安全。

【关键词】大规模抓取;人工智能预训练;数据保护;正当利益;

【文章来源】《中国法律评论》2025年第5期

导航

王苑：人工智能预训练中大规模抓取个人信息的合法性困境与出路