本篇文章2047字,读完约5分钟

北京青年报8月2日1日报道,从北京青年报所在的网购商城来看,最高人民法院审判文件网的数据从定价0.1元到1元不出售。 裁判文书网发表的判决书明明是公开的,为什么还要卖? 获取审判文件网数据的手段对网站有危害吗?

网络销售数据、价格必须通过“闲谈”取得

北新闻记者在某网购中心看到湖南、广东、山东等多家商家声称销售裁判文书网的数据,其中不少商家声称有超过6000万条数据。 根据审判文件网的公开数据,现在公开于审判文件网的文件总量在7395万件以上,如果商家说的数量是真实的,商家就可以提供大部分已经公开的文件数据。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

许多主张可以销售审判文件网数据的商家在商品复印件的描述中说,该数据是通过“网络爬虫类”的方法获得的。 “网络爬虫类”也称为web蜘蛛、web机器人,是根据一定的规则自动捕获web新闻的程序或脚本。 相当于自动访问网页进行相关操作的小机器人。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

北报记者表示,各商家在商品页面上,其数据售价从0.1元到1元,但各商家是复印描述,数据的售价不是显示标准,需要“私聊”。

据销售审判文件数据的商家透露,购买审判文件数据的购买者需要的数据量为数千篇至数千篇,为了无法打开审判文件网,有些人不得不向数据销售者求助。 “为了写论文,有很多学生。 这种情况下几千根就足够了。 商用的话可能需要数百万条到数千条。 ”。 据商家透露,每月他们可以收到四五份文件数据收集的订单,但价格与购买者需要的数据量有关。 “数百万的数据大致需要数千美元。 现在加密技术很严格,所以有点贵。 ”。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

正常客户无法访问的“爬虫类”系统

北报记者说,一些技术机构通过网络爬虫类系统获取审判文件网数据的行为给审判文件网正常顾客的访问带来了不便。 很多网上网民在自己搜索裁判文件时,经常遇到裁判文件网站,表示由于系统上的理由无法查询的情况。

对此,最高人民法院在官网上表示,如果网民应对审判文件网运行缓慢、故障频繁等情况,由于中国审判文件网的公开文件数量和影响大幅增加,访问人数在增加。 另外,年5月初以后,很多技术企业通过爬虫类系统无限制地同时访问裁判文件数据,网站负荷过大,很多正常的顾客要求堵车,访问变慢,有些页面无法显示。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

今年5月,最高人民法院新闻中心主任许建峰在接受媒体采访时表示,“中国审判文件网现在每天访问数千万级,其中包括数据爬虫类的攻击,我们的中心服务器受到了很大的压力。”

“我们时刻监视着它的应用状况,想一有问题就马上处理,但确实不能统一步调,所以要停止网络运营。 ”许建峰表示,最高法已经成立了专业的运维保障小组来维持管理中国裁判文书网,技术和人力也将投入越来越多的力量。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

相关机构使用多种玩法进行“逆爬”

据北新闻记者介绍,迄今为止,相关方面采取了多种玩法,对抗“爬虫类技术”。 最高人民法院曾经宣布,为了更好地确保正常顾客的访问性能,在相关方面用验证码的方法在线了系统软件的防爬功能。 “验证码技术是防止爬虫类的比较有效的措施,阅览次数在一定时间内达到一定数量后,使验证码机构有效进行核对。 之后,我们不定期更新爬虫技术,加强了网站的维护,提高了网站的运用效率和稳定性。 ”。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

另外,对网民的提问,比较了为什么不能以“公开时间”进行检索条件的审判文件检索,最高人民法院方面没有将“公开时间”设定为检索条件的主要原因是爬虫类系统根据“公开时间”项增量文件

另外,最高人民法院方面说:“前期爬虫行为太猖獗,无限制的暴力访问大幅度降低了正常顾客的访问性能,因此采取了通过限制名单页面的翻页数来防止爬虫系统的措施。”

律师解体:强制突破“反爬”技术或构成犯罪

金杜律师事务所从事ip类法律业务的律师瞿溪阐述了网络爬虫类相关的法律问题。 从技术中立的立场来说,爬虫类技术本身没有违法违反。 但是,随着数据产业的迅速发展,数据爬行带来的各种问题和担忧在增加。 野蛮的爬虫类网站负荷太大,网站可能瘫痪,无法访问。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

“因为爬虫类的批量访问会给网站带来很大的压力和负担,所以这个多个网站经营者会采取技术手段阻止爬虫类批量获取自己网站的新闻。 与这些技术手段相比,爬虫类开发者可以通过优化自己的代码、采用ip池等各种方法避免上述技术措施,从而实现网络新闻的批量捕获和复制。 ”。 据悉,由于网络爬虫类根据特定的战略访问尽可能多的页面,因此爬虫类的采用占用了被访问网站的互联网带宽,增加了互联网服务器的解决成本,无法正常提供服务。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

根据《反不正当竞争法》的网络相关条款,网站运营者已经采取了一定的反爬虫类措施,爬虫类控制者根据经营目的强行突破网站运营者采取的反爬虫类技术措施,如果客观捕获的网站不能正常工作,就进行不正当竞争 另外,强行突破特定被攀登方式的技术措施也有可能构成刑事犯罪行为。

【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

对此,北京市社会组织法律调整中心副理事长张新年律师认为:“这些审判文件是以司法公开为目的的,免费的公共资源,未经最高人民法院许可,商家销售审判文件网的数据构成了侵权。”

(原题是“审判文件网数据竟然以标价出售给商家”)

标题:【裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权】

地址:http://www.china-huali.com/cjxw/15262.html