互联网内容保护再添典型案例:同业抓取百科词条被判赔1500万元

问题—— 近年来,平台内容与数据要素价值凸显,围绕“公开可见内容能否任意抓取复用”的争议增多。

此次纠纷的核心在于:同业经营者是否可以通过技术手段绕开或忽视对方平台对抓取行为的规则提示,批量复制词条内容并用于自身产品运营,以形成市场竞争优势。

法院判决明确指出,被诉方大规模抓取并使用词条内容,与权利方形成同业竞争关系,相关行为对权利方的流量收益与用户规模造成冲击,构成《反不正当竞争法》第二条所规制的不正当竞争。

原因—— 一是“低成本扩容”的商业驱动。

百科产品的竞争逻辑之一在于词条规模、更新速度与检索可见度。

自主采编需要人力、时间与审核机制投入,而直接抓取可在短期内迅速补齐内容供给,形成“以复制替代建设”的成本优势。

二是对平台规则边界的忽视。

robots协议虽属于互联网通行的抓取约定机制,但其背后承载的是经营者对数据使用方式的明确态度与商业安排。

判决强调“无视robots协议公示的商业意愿”,说明规则提示并非可有可无。

三是数据竞争从“流量竞争”走向“内容与规则竞争”。

在算法分发、搜索入口、聚合服务等场景中,内容抓取容易引发“替代效应”,一旦形成可替代供给,市场竞争将从创新投入转为规则套利,破坏行业生态。

影响—— 对平台与行业而言,该案对“抓取—复用—替代”的链条提出了清晰的司法评价:以技术手段批量获取他人长期投入形成的内容资产,并用于同业竞争,可能被认定为违背诚实信用原则和商业道德。

其结果不仅是流量分流与收益减损,更重要的是削弱持续投入的动力,不利于互联网内容创新与公共信息服务质量提升。

对市场秩序而言,判决通过“停止侵害+赔偿损失”的责任配置,提高了不当抓取的违法成本,强化了对数据合规、平台治理和公平竞争的制度导向。

值得注意的是,法院在赔偿计算上采用“成本替代法”,以词条平均投入成本测算被诉方节省的经营成本,从而确定赔偿额,这对同类案件的损害认定提供了可参照的裁判思路。

此前相关案件中,亦出现因大规模抓取百科词条被判承担高额赔偿的判例,显示司法对数据竞争领域的规范力度持续增强。

对策—— 从企业合规角度,应把“可访问”与“可使用”区分开来,建立抓取、采集、引用、转载的全流程合规机制:一要尊重并遵守对方平台公开的抓取规则与技术协议,对涉及限制抓取的页面与数据边界保持审慎;二要完善来源标注、授权管理与内部审查制度,避免将第三方内容直接作为核心供给,形成实质性替代;三要提升自主采编与结构化知识建设能力,通过原创生产、权威来源校验与内容更新机制形成竞争壁垒;四要在行业层面推动更可执行的规则共识,探索数据接口、授权合作、可追溯标识等机制,减少“各自为政”带来的冲突成本。

监管与司法层面,可继续通过典型案例释法明理,引导平台在保护创新投入与保障公众信息获取之间把握平衡。

前景—— 随着数据要素市场化配置加快,围绕抓取、聚合、训练与再利用等环节的边界问题将持续出现。

可以预期,司法裁判将更注重对“竞争关系、替代效果、获取方式、使用目的、行业惯例与公共利益”的综合考量:既保护经营者对内容建设的合理收益,亦避免以过度排他阻碍信息流通。

对企业而言,未来竞争将更强调合规能力、原创能力与合作能力。

谁能在尊重规则的前提下持续提高内容质量、降低重复建设、形成可持续的知识服务体系,谁就更可能在新一轮竞争中赢得主动。

互联网的发展离不开知识的流动和共享,但这种流动和共享必须建立在尊重知识产权、遵守商业规则的基础之上。

浦东法院的这份判决,以及此前海淀法院的相关判决,共同为互联网平台的竞争划定了法律底线。

这不仅是对知识产权的保护,更是对互联网竞争秩序的维护。

随着互联网产业的不断发展,类似的法律问题还会继续出现,但这一系列判决已经为行业树立了明确的规范标准。

可以预见,在司法的引导下,互联网企业将更加理性地认识到,真正的竞争力来自于自主创新和优质服务,而不是对他人成果的简单复制。

这对于推动整个互联网产业向更加健康、更加规范的方向发展,具有重要的现实意义。