中文

认真解答每一个知产问题

点击展开全部

法律宝库

更多 >>

创业开发在线查重网站,是否会构成版权侵权?

发布时间:2025-06-20 来源:中国知识产权律师网
字号: +-
563

问题咨询:

我计划创业开发一个在线查重网站,旨在为用户提供学术作品的原创性检查服务。在筹备过程中,我对数据来源和版权合规方面有一些疑问,希望能得到您的专业意见。

具体情况如下:

(1)数据库计划来源:
    部分数据来源于淘宝上购买的数据库。
    另一部分是从公开资源中通过爬虫技术获取的数据。
    还有一部分是从中国知网(CNKI)下载的论文数据。
(2)计划提供的服务内容:
    我的服务将包括对比用户提交的文档与上述数据库中的文献,并生成查重报告。
    查重报告不仅会指出重复率,还会展示原文片段并给出来源链接以便用户参考。

问题核心:

(1)使用上述方法构建数据库并提供查重服务是否构成侵权行为?
    如果是,具体违反了哪些法律法规?
(2)如何合法地构建查重数据库而不侵犯他人的版权?
    是否需要获得特定的授权或许可?
    对于公开可用的数据,是否有明确的指导原则或先例说明其使用界限?
(3)【重要盼重点回复】在查重报告中展示原文片段及来源是否合法?如果不合法,应该如何调整服务模式以符合法律要求?

我希望了解如何确保我的业务既能满足客户需求,又能严格遵守相关法律法规。期待您的专业建议和指导。

北京版权律师 回复:

您好,主要从三个方面来回答您的问题。

一、数据库来源问题:

1.对于知网下载的论文数据明确侵权。知网论文受《著作权法》保护,其授权仅限个人学习使用。商业性查重服务属于“复制+信息网络传播”行为,需知网及作者双重授权。未经许可使用将面临高额赔偿。

2.淘宝售卖的论文数据库多为盗用高校知网账号或非法爬取的数据。购买此类数据可能需要承担《著作权法》第五十三条规定的侵权责任。

3.网络公开数据并不意味着爬虫可以在网络上自由的抓取数据,绝大多数网站的服务条款明确禁止未经授权的爬取行为,即使数据是公开的。

(1)合法范围:少量、低频,仅限无需登录即可访问的数据(如政府公开报告、开放存取的学术摘要);但是如果在传播过程中损害国家利益、社会利益和其他主体的合法权益,特别是原始主体的合法权益,仍有可能违反法律法规的规定。

(2)爬取网络数据分为三种情况:

a.抓取开放网站的数据库。实践中对爬取行为通常使用反不正当竞争法进行规制。如“用药助手”案中,即使爬取的网站本身不具独创性,对方数据来自于公共数据,依照《反不正当竞争法》第二条规定,仍然涉嫌构成侵权。另外,即使数据是公开的,但是如果爬取行为对原平台的服务构成了实质性替代,损害了原平台的竞争优势,法院通常会考察被爬取平台对数据所作的实质性投资,并结合竞争损害来认定是否构成不正当竞争;

b.违反网站Robots协议或服务条款(如绕过反爬机制),或采取一定的技术手段,构成不正当竞争;

c.抓取需登录才可查看的内容,如知网全文、付费论文,或者采取一定的技术手段,如破解验证码、伪造User-Agent、使用代理池规避IP封锁、绕过登录限制等行为,属于突破技术措施的非法获取;涉嫌违反《网络安全法》第二十七条规定、《反不正当竞争法》第二条、第十二条规定。

二、展示原文片段

在未获得授权的情况下,在查重报告中展示原文片段,涉嫌侵犯复制权,展示原文片段属于“部分复制”,合理引用需限于评论、研究且注明出处,该复制超出《著作权法》第24条规定的“合理引用”的范围;此外还涉嫌侵犯信息网络传播权,用户通过报告获取原文内容,构成对原作品的传播。

三、数据库合规的构建

需要注意法定许可与合理使用不适用于商业营利性质的数据库查重服务。您可以通过作者自愿入库授权,如作者在期刊投稿、学位论文提交时签署著作权许可协议,授权将其文献纳入比对数据库来实现数据合规;也可以通过与机构批量授权合作,与高校、期刊等学术机构签订资源共建协议,批量获取学位论文、期刊文献的检测使用权。例如:学信网向应届毕业生提供免费查重服务,其论文在学生同意的情况下自动进入万方比对库;期刊社将录用论文授权万方入库,同步解决查重底库版权与学术传播需求。此外,授权范围需限定在数据仅用于查重算法匹配,禁止全文公开或二次销售。

感谢您对本网的支持,请继续关注本网!

没有了 下一篇下一篇

评论

在线咨询