题目描述
在现实生活中,传统企业,互联网巨头和政府机关都收集和保有大量的数据,但是对于数据的利用效率往往不高,对于拥有这些数据的企业而言,使用爬虫技术和类似的自动搜索访问工具,可以打破信息孤岛,使得数据能够流通,从而充分利用这些数据发挥效能,带来巨大的经济价值和社会效益。
但是爬虫技术也饱受争议,对于拥有很多数据的公司,纵使没有充分利用这些数据,也会将这些数据是为私有资产,拒绝第三方通过爬虫技术获得和收集额数据,因为爬虫会造成以下几种可能的危害:
- 爬虫技术与 DDOS 攻击具有相关性,对网络安全形成巨大的威胁;
- 被爬网站的反爬措施降低了消费者体验;
- 爬虫技术使得数据和信息流通不受控制,侵害了权利人的正当利益;
- 爬虫技术导致用户的个人信息和隐私受到极大威胁。
那么,爬虫的法律红线有哪些,哪些数据能抓,哪些数据不能抓呢?
思路点拨
爬虫不能涉及个人隐私。
如果爬虫程序采集到公民的姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等个人信息,并将之用于非法途径的,则肯定构成非法获取公民个人信息的违法行为。
也就是说你爬虫爬取信息没有问题,但不能涉及到个人的隐私问题,如果涉及了并且通过非法途径收益了,那肯定是违法行为。
另外,还有下列三种情况,爬虫有可能违法,严重的甚至构成犯罪:
- 爬虫程序规避网站经营者设置的反爬虫措施或者破 & 解服务器防抓取措施,非法获取相关信息,情节严重的,有可能构成 “非法获取计算机信息系统数据罪”;
- 爬虫程序干扰被访问的网站或系统正常运营,后果严重的,触犯刑法,构成 “破坏计算机信息系统罪”;
- 爬虫采集的信息属于公民个人信息的,有可能构成非法获取公民个人信息的违法行为,情节严重的,有可能构成 “侵犯公民个人信息罪”。