首席律师徐新明

13910160652

ciplawyer@163.com

关于我们

在线咨询

专利

更多 >>
商标

更多 >>
版权

更多 >>
商业秘密

更多 >>
反不正当竞争

更多 >>
植物新品种

更多 >>
地理标志

更多 >>
集成电路布图设计

更多 >>
技术合同

更多 >>
传统文化

更多 >>

点击展开全部

律师动态

更多 >>

2026.05.11

徐新明律师接受《天津日报》采访：解读2025年度天津市专利行政保护案例

2026.03.09

著名知识产权律师徐新明接受《中国经营报》采访：技术革新下知识产权保护面临新挑战与应对策略

2026.02.10

徐新明律师经典案例：刘某与西安某生物科技有限公司技术合作开发合同纠纷案

知产速递

更多 >>

审判动态

更多 >>

案例聚焦

更多 >>

法官视点

更多 >>

裁判文书

更多 >>

法律宝库

更多 >>

中国法库

法律法规立法动态政策指引
国际法库

他国法律国际公约

返回列表

首页 > 咨询荟萃 > 版权

版权律师解答：创业开发在线查重网站，是否会构成版权侵权？

发布时间：2025-06-20 来源：中国知识产权律师网

标签：查重网络爬虫版权

字号: +-

563

问题咨询：

我计划创业开发一个在线查重网站，旨在为用户提供学术作品的原创性检查服务。在筹备过程中，我对数据来源和版权合规方面有一些疑问，希望能得到您的专业意见。

具体情况如下：

（1）数据库计划来源：
部分数据来源于淘宝上购买的数据库。
另一部分是从公开资源中通过爬虫技术获取的数据。
还有一部分是从中国知网（CNKI）下载的论文数据。
（2）计划提供的服务内容：
我的服务将包括对比用户提交的文档与上述数据库中的文献，并生成查重报告。
查重报告不仅会指出重复率，还会展示原文片段并给出来源链接以便用户参考。

问题核心：

（1）使用上述方法构建数据库并提供查重服务是否构成侵权行为？
如果是，具体违反了哪些法律法规？
（2）如何合法地构建查重数据库而不侵犯他人的版权？
是否需要获得特定的授权或许可？
对于公开可用的数据，是否有明确的指导原则或先例说明其使用界限？
（3）【重要盼重点回复】在查重报告中展示原文片段及来源是否合法？如果不合法，应该如何调整服务模式以符合法律要求？

我希望了解如何确保我的业务既能满足客户需求，又能严格遵守相关法律法规。期待您的专业建议和指导。

北京版权律师回复：

您好，主要从三个方面来回答您的问题。

一、数据库来源问题：

1.对于知网下载的论文数据明确侵权。知网论文受《著作权法》保护，其授权仅限个人学习使用。商业性查重服务属于“复制+信息网络传播”行为，需知网及作者双重授权。未经许可使用将面临高额赔偿。

2.淘宝售卖的论文数据库多为盗用高校知网账号或非法爬取的数据。购买此类数据可能需要承担《著作权法》第五十三条规定的侵权责任。

3.网络公开数据并不意味着爬虫可以在网络上自由的抓取数据，绝大多数网站的服务条款明确禁止未经授权的爬取行为，即使数据是公开的。

(1)合法范围：少量、低频，仅限无需登录即可访问的数据（如政府公开报告、开放存取的学术摘要）；但是如果在传播过程中损害国家利益、社会利益和其他主体的合法权益，特别是原始主体的合法权益，仍有可能违反法律法规的规定。

(2)爬取网络数据分为三种情况：

a.抓取开放网站的数据库。实践中对爬取行为通常使用反不正当竞争法进行规制。如“用药助手”案中，即使爬取的网站本身不具独创性，对方数据来自于公共数据，依照《反不正当竞争法》第二条规定，仍然涉嫌构成侵权。另外，即使数据是公开的，但是如果爬取行为对原平台的服务构成了实质性替代，损害了原平台的竞争优势，法院通常会考察被爬取平台对数据所作的实质性投资，并结合竞争损害来认定是否构成不正当竞争；

b.违反网站Robots协议或服务条款（如绕过反爬机制），或采取一定的技术手段，构成不正当竞争；

c.抓取需登录才可查看的内容，如知网全文、付费论文，或者采取一定的技术手段，如破解验证码、伪造User-Agent、使用代理池规避IP封锁、绕过登录限制等行为，属于突破技术措施的非法获取；涉嫌违反《网络安全法》第二十七条规定、《反不正当竞争法》第二条、第十二条规定。

二、展示原文片段

在未获得授权的情况下，在查重报告中展示原文片段，涉嫌侵犯复制权，展示原文片段属于“部分复制”，合理引用需限于评论、研究且注明出处，该复制超出《著作权法》第24条规定的“合理引用”的范围；此外还涉嫌侵犯信息网络传播权，用户通过报告获取原文内容，构成对原作品的传播。

三、数据库合规的构建

需要注意法定许可与合理使用不适用于商业营利性质的数据库查重服务。您可以通过作者自愿入库授权，如作者在期刊投稿、学位论文提交时签署著作权许可协议，授权将其文献纳入比对数据库来实现数据合规；也可以通过与机构批量授权合作，与高校、期刊等学术机构签订资源共建协议，批量获取学位论文、期刊文献的检测使用权。例如：学信网向应届毕业生提供免费查重服务，其论文在学生同意的情况下自动进入万方比对库；期刊社将录用论文授权万方入库，同步解决查重底库版权与学术传播需求。此外，授权范围需限定在数据仅用于查重算法匹配，禁止全文公开或二次销售。

感谢您对本网的支持，请继续关注本网！

认真解答每一个知产问题

首席律师 徐新明

专利

商标

版权

商业秘密

反不正当竞争

植物新品种

地理标志

集成电路布图设计

技术合同

传统文化

律师动态

徐新明律师接受《天津日报》采访：解读2025年度天津市专利行政保护案例

著名知识产权律师徐新明接受《中国经营报》采访：技术革新下知识产权保护面临新挑战与应对策略

徐新明律师经典案例：刘某与西安某生物科技有限公司技术合作开发合同纠纷案

知产速递

知识产权环球资讯 | 重庆虬龙在美赢得近9000万赔偿及永久禁令；华...

WIPO发布《2026世界知识产权报告》 含报告全文

全球5G标准必要专利及标准提案研究报告（2026年）全文发布

知识产权律师须读！最高法举行2026年知识产权宣传周新闻发布会 附...

浙江省市场监督管理局关于规范数据知识产权作价出资（入股）的通...

审判动态

假印章炮制“真”协议 地理标志申请岂容造假？

法院依法确认“陆地航母”不侵权

植物新品种侵权案件中土地承包经营者的责任认定和停止侵害诉请的...

涉“试题”数据不正当竞争案

利用“AI换脸”对他人作品局部合成处理，构成侵权吗？

案例聚焦

最高人民法院发布第六批人民法院种业知识产权司法保护典型案例 含...

上海高院发布依法打击新型网络犯罪典型案例

国家发展改革委、最高人民法院联合发布贯彻实施民营经济促进法典...

2025年度全国打击侵权盗版十大案件

上海知产法院集中宣判多起商标侵权上诉案

法官视点

作品独创性理论的司法适用研究

知识产权侵权案件计量赔偿的标准化审理路径

数据赋权的纵向展开与区分登记制度

新司法解释实施背景下侵犯服务商标类刑事案件的审判要点

商业数据爬取行为司法审查的路径优化

裁判文书

法律宝库

中国法库

国际法库

版权律师解答：创业开发在线查重网站，是否会构成版权侵权？

相关文章

北京版权律师解答：AI训练使用未经授权内容是否侵权？

北京版权律师：汇集公众号文章链接的app是否构成侵权？

在他人的软件基础上二次开发，是否会构成侵权？

版权律师徐新明解答：学术论文中引用图片的跨国版权风险与应对建议

非商业性使用注册商标是否会构成侵权？

评论

首席律师徐新明

WIPO发布《2026世界知识产权报告》含报告全文

知识产权律师须读！最高法举行2026年知识产权宣传周新闻发布会附...

假印章炮制“真”协议地理标志申请岂容造假？

最高人民法院发布第六批人民法院种业知识产权司法保护典型案例含...