通过“网络爬虫”恶意爬取数据行为的刑事法律风险分析
更新时间: 2025年9月11日 9:22:21
网络爬虫(Web Crawler),又称为网页蜘蛛,是一种按照一定的规则,自动抓取网络数据的程序或脚本,它可以从数据网站、移动APP、小程序等各个渠道检索、收集数据。网络爬虫作为一项网络信息搜索技术,具有技术中立性,并未被我国现行法律所禁止。但近年来,恶意使用网络爬虫技术非法窃取数据、个人信息和商业秘密的行为日益猖獗,通过恶意爬虫攻击网络系统引发严重后果的案件也日益增多,上述行为可能会涉嫌刑事犯罪,值得重视。本文试对恶意使用网络爬虫爬取数据行为的刑事法律风险进行分析。
一、恶意爬取数据行为违法性的本质
网络爬虫的核心功能在于网络数据的搜索和提取,但法律对网络数据的获取并非完全没有限制。如果网络数据性质上属于符合法律规定的数据信息,且任何人都可以公开、自由地获取,则使用爬虫工具爬取上述数据的行为不会出现违法的问题。相反,如果网络数据的获取方式、途径、范围有相应的限制,在未经授权同意的情况下,通过破解、绕过上述限制进行数据爬取的行为,则属于违法,在符合相关情形下,则构成刑事犯罪。另外一方面,在恶意爬取数据的过程中,网络爬虫可能造成对计算机信息系统的功能损害,这也为法律所不允许。
因此,我们认为通过网络爬虫恶意爬取数据的行为,其违法性的本质在于未经授权或者许可而采取技术手段获取不应获得的网络数据,从而侵犯刑法所保护的法益。
二、恶意网络爬取数据行为可能涉嫌的罪名
(一)非法侵入计算机信息系统罪
《刑法》第二百八十二条第一款规定:“违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,构成非法侵入计算机信息系统罪。”
本罪侵犯的客体是国家事务、国防建设、尖端科学技术领域的计算机信息系统安全及其运营维护下的社会公共秩序。由于上述三领域的计算机信息系统可能具备的功能及存储的数据直接关系到国家主权及人民生命财产安全,一旦被非法入侵,给国家主权、公共安全、社会秩序及人民生命财产安全造成不可估量的危害。
如果通过网络爬虫侵入“国家事务、国防建设、尖端科学技术领域的计算机信息系统”,侵入行为会构成非法侵入计算机信息系统罪。
(二)非法获取计算机信息系统数据罪
《刑法》第二百八十五条第二款规定:“行为人违反国家规定,采用侵入不属于国家事务、国防建设、尖端科学技术领域的计算机信息系统或采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,或者对该计算机信息系统实施非法控制,情节严重的,构成非法获取计算机信息系统数据罪。”
行为人采用网络爬虫手段爬取他人数据,如果采用了的是未经授权或者他人同意的技术手段爬取了不属于国家事务、国防建设、尖端科学技术领域的计算机信息系统中存储、处理或者传输的数据,达到一定严重程度的,会构成本罪。
在林镇平等非法获取计算机信息系统数据案中,房麦公司(法定代表人为被告人林镇平)使用网络爬虫技术爬取北京A信息技术有限公司经营的某网站房产数据。在A公司增加反爬取策略后,2019年10月至2020年7月间,被告单位房麦公司使用破解验证码、绕开挑战登录等方式破解某公司的反爬取措施,非法获取某网站的房源数据,并将非法获取的房产数据存放在自己的服务器中调用,并向自己开发的APP用户收取会员费盈利。自2019年10月至案发,被告单位房麦公司的上述行为给某公司造成直接损失共计人民币10万余元。后被告单位及实际控制人、工程师等均被判决认定构成非法获取计算机信息系统数据罪,单位被判处罚金,相关责任人员被判处有期徒刑并处罚金。
通过上述案例可以看出,房麦公司及林镇平等人使用了未经他人同意的手段爬取收据,即某公司增加了反爬取策略后,房麦公司使用破解验证码、绕开挑战登录等方式继续爬取数据,对应本条罪状中的“侵入”行为,因此构成非法获取计算机信息系统数据罪。
(三)侵犯公民个人信息罪
《刑法》第二百五十三条之一规定:“违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
违反国家有关规定,将在履行职责或者提供服务过程中获得的公民个人信息,出售或者提供给他人的,依照前款的规定从重处罚。
窃取或者以其他方法非法获取公民个人信息的,依照第一款的规定处罚。
单位犯前三款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照各该款的规定处罚。”
《刑法》第二百五十三条之一规定的“公民个人信息”,指“以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等”(《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第一条)。
大数据时代,公民个人信息多以电子数据的方式储存于计算机信息系统中,使用网络爬虫手段非法获取存储在于计算机信息系统中的公民个人信息则会涉嫌刑事犯罪。
比如在周某侵犯公民个人信息罪案件一案中,2019年2月份,被告人周某为获取其私自研究程序所需的公民个人信息,使用自己编写的网络爬虫程序擅自进入XX学院教务管理系统,窃取了包括照片、姓名、性别、身份证号码等数据内容的4万余条学生个人信息,并将窃取的学生信息存放在自己的服务器内。最终法院认定周某构成侵犯公民个人信息罪。
实际上,周某采用网络爬虫爬取个人信息的行为,还牵扯想象竞合犯的问题。周某采用网络爬虫爬取学生个人信息的行为,属于采用网络爬虫擅自进入学院教务管理系统中获取数据,这符合非法获取计算机信息系统数据罪的构成要件,但其采取网络爬虫爬取的数据又属于法律所保护的公民个人信息,上述一个行为触犯了两个罪名,属于想象竞合犯,应从一重罪论处。非法获取计算机信息系统数据罪的定罪量刑标准无论从信息数量还是从违法所得数额看,均低于侵犯公民个人信息罪,故周某被判处侵犯公民个人信息罪。
(四)侵犯著作权罪
在数字时代,网络作品已经成为著作权中“作品”的主流形式之一,例如电子书、视频等。如未经著作权人许可,使用网络爬虫技术采集、复制他人作品并通过信息网络传播,可能构成侵犯著作权罪。
在鼎阅公司侵犯著作权罪案件中,自2016年起,覃某某、柯某、刘某共同成立鼎阅公司及关联公司,鼎阅集团自2018年开始,在覃某某等12名被告人管理或参与运营下,未经权利公司许可,利用内容爬取等信息网络技术,爬取正版电子书后,在其推广运营的“鸿雁传书”“txt全本免费小说”等10余个APP平台上展现,供他人访问并下载阅读,并通过广告收入、付费阅读等方式进行牟利,构成侵犯著作权罪。
除文字作品外,未著作权人许可将爬取的电影、电视剧、综艺、动漫等各类视频资源经网络爬虫视频在网络传播的也会被认定构成侵犯著作权罪。
另外,通过网络爬虫爬取淫秽视频并进行传播的,还会构成传播淫秽物品罪、传播淫秽物品牟利罪 ,在本文中不展开论述。
(五)破坏计算机信息系统罪
《刑法》第二百八十六条规定了破坏计算机信息系统罪。该罪是指违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,以及对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,或者故意制作、传播计算机病毒等破坏性程序,影响计算机系统正常运行,后果严重的行为。
网络爬虫技术的运用并不代表对爬取对象的信息系统进行直接破坏,但如果网络爬虫短时间内持续对计算机信息系统爬取数据,对计算机信息系统进行干扰,导致计算机信息系统瘫痪,导致计算机信息系统瘫痪、崩溃等不能运行状态,则行为可能构成破坏计算机信息系统罪。
在杨某等破坏破坏计算机信息系统罪案件中,2018年1月,杨某授权公司员工张某开发一款名为“快鸽信贷系统”的软件,该软件内的“网络爬虫”功能能与深圳市居住证网站链接,可以在深圳市居住证网站上查询到房产地址、房屋编码等对应的资料,该软件对深圳市居住证网站访问量能达到每小时数十万次,以达到为其公司主营业务便捷的目的。2018年5月2日10时至5月2日12时许两小时内,该软件对深圳市居住证系统查询访问量为每秒183次,共计查询信息1510140条次并将查询的信息以阿某云网络云盘的形式保存,造成为5万以上用户提供服务的计算机信息系统不能正常运行累计1小时以上的,后果特别严重,最终被判破坏计算机信息系统罪。
(六)提供侵入、非法控制计算机信息系统程序、工具罪
根据《刑法》第二百八十五条第三款的规定,提供侵入、非法控制计算机信息系统程序、工具罪是指提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的行为。
本罪实际上是帮助犯的正犯化。在行为人明知他人意图实施侵入、非法控制计算机信息系统犯罪行为时,仍为其犯罪行为提供网络爬虫技术服务的,如果提供程序、工具数量、违法所得及造成经济损失等达到情节严重标准时,则会构成本罪。
在丁某提供侵入计算机信息系统程序案中,2021年10月5日,被告人丁某在经营马鞍山耀腾信息咨询有限公司期间,从丁某强(另案处理)处购买“汇易获客”软件代理权,丁某明知该款专门用于入侵短视频平台服务器非法获取用户昵称、留言、评论等数据,仍将软件改名为“客多多精准获客”并对外销售,违法所得共计人民币2.436万元,丁某最终被判提供侵入计算机信息系统程序罪。
三、结语
随着人工智能时代来临,数据蕴含着巨大的经济价值。当前,网络爬虫与人工智能的结合已成为互联网企业获取数据的重要技术手段。但必须看到,网络爬虫技术其在便利与效率之外,也伴随着显著的法律与合规风险。
人工智能与网络爬虫的应用不应成为灰色地带,而应在法律的框架内运行。只有将合规纳入企业战略,真正做到“合法采集、合规使用”,企业才能在数据驱动的竞争中稳健前行,避免因忽视风险而陷入被刑事追责的境地。
作者:张超 高泽传