大數(shù)據(jù)終于走向了平穩(wěn)期,發(fā)展過程中的各種隱私、合規(guī)問題也終于開始暴露了出來,昨天網(wǎng)絡(luò)尖刀犯罪情報團(tuán)隊監(jiān)測到一個非常有代表性的民事裁判案件,深圳市騰訊科技有限公司訴杭州快憶科技有限公司,通過針對微信公眾號開發(fā)爬蟲工具提供爬取結(jié)果數(shù)據(jù)包的行為,干擾了微信公眾平臺的正常運行,涉嫌構(gòu)成不正當(dāng)競爭。
近日,杭州鐵路運輸法院就騰訊公司提出的申請作出裁定,認(rèn)為杭州快憶科技有限公司違反《微信公眾平臺服務(wù)協(xié)議》,開發(fā)出多款用于爬取微信公眾平臺各類數(shù)據(jù)的產(chǎn)品并以此牟利的行為,構(gòu)成不正當(dāng)競爭的可能性大,杭州快憶需立即停止被訴侵權(quán)行為,目前,該網(wǎng)站涉案的相關(guān)產(chǎn)品及服務(wù)已下架。
提取一下整體的案件情況,我們收集了一系列相關(guān)的內(nèi)容,做了一次完整的事件分析,來對這次案件做一次騰訊側(cè)的“還原”。
神箭手違反了哪些法律?
雖然騰訊訴訟的是以民事訴訟其反不正當(dāng)競爭,但是實際上神箭手通過爬蟲大規(guī)模拉取騰訊數(shù)據(jù)這件事兒上,爬取來的內(nèi)容其實是在侵犯“微信公眾號平臺作者”的著作權(quán),屬于知識產(chǎn)權(quán)范疇;
設(shè)定規(guī)則模擬人的方式通過爬蟲的去請求微信公眾號數(shù)據(jù),這種行為其實也是一種“資源消耗型攻擊”,如果請求量足夠大的線層足夠多的前提下,說其向騰訊發(fā)起CC流量攻擊其實也是合情合理的,所以這一點屬于網(wǎng)絡(luò)法范疇;
神箭手在其平臺上提供了“微信公眾號文章信息API”、“微信訂閱號和最新文章API”、“微信熱搜榜”、“訂閱熱詞API”等針微信數(shù)據(jù)爬取的服務(wù),這一點才是屬于反不正當(dāng)競爭范疇;
為什么選擇告其反不正當(dāng)競爭?
說句實話爬取微信公眾號平臺內(nèi)容的應(yīng)該會有很多,包括之前某些媒體平臺也提供了將微信公眾號內(nèi)容爬取下來同步到自身平臺的工具,當(dāng)然市場上還有一些圖文同步的工具,也可以做很多內(nèi)容分發(fā),但是這個性質(zhì)與目前神箭手的性質(zhì)完全不一樣。
之前的這些“同步工具”其實都是給媒體作者用的工具,雖然爬取的方式嚴(yán)格來講不合法,但是實際上在知識產(chǎn)權(quán)的角度來講,這些工具都是在原作者同意的前提下,為內(nèi)容創(chuàng)業(yè)者為提供方便的工具,并沒有嚴(yán)重的侵犯商業(yè)權(quán)益,并且從爬取的請求角度來講,只是部分作者用了這種工具,而且不是集中性的任務(wù),其實對微信公眾號來說確實也沒有造成太大的數(shù)據(jù)壓力;
神箭手不一樣,神箭手是一個經(jīng)營性的爬蟲平臺,提供爬取微信公眾號爬取規(guī)則的,并通過賣節(jié)點的方式進(jìn)行商業(yè)變現(xiàn),所有使用神箭手平臺的人,其實基本都沒有獲取到原作者的授權(quán),單純的就是在神箭手平臺上定制爬蟲規(guī)則、節(jié)點進(jìn)行數(shù)據(jù)抓取,而且是持續(xù)高頻。
新增一個爬蟲節(jié)點就多一臺服務(wù)器在這里進(jìn)行非法“攻擊請求”,這一點對微信公眾號平臺確實造成了實際的資源損耗和數(shù)據(jù)壓力;
不懂法規(guī)的就不要上來噴騰訊亂告,騰訊告其反不正當(dāng)競爭其實已經(jīng)算是蠻保守的了。
爬蟲涉及哪些相關(guān)法律問題?
目前國內(nèi)還沒有真正意義針對爬蟲技術(shù)有法律或者相關(guān)規(guī)范,從技術(shù)角度爬蟲存在是為了高效的收集信息,本身是沒有違法違規(guī)之處,界定違規(guī)其實在于爬蟲的用途,常見的爬蟲是遵守中國互聯(lián)網(wǎng)協(xié)會《互聯(lián)網(wǎng)搜索引擎服務(wù)自律公約》中協(xié)議,但此內(nèi)容不具備實際的法律約束,反倒是屬于商業(yè)道德范疇;
目前無視協(xié)議抓取網(wǎng)站內(nèi)容的行為,大部分都會以涉嫌構(gòu)成《反不正當(dāng)競爭法》的第二條,即違反誠實信用原則和商業(yè)道德的不正當(dāng)競爭行為原則進(jìn)行訴訟。
當(dāng)然這也要取決于爬蟲爬取的內(nèi)容到底是什么,比如爬取文章可能侵犯的是原作者的“著作權(quán)”;爬取別人公司的商業(yè)數(shù)據(jù),侵犯的即是商業(yè)秘密;爬取微博、微信、、甚至其他平臺的用戶(姓名、手機、郵箱)等敏感信息,侵犯的則是個人用戶隱私;
維護(hù)民營企業(yè)市場競爭秩序,這樣的民事訴訟一般都會依照《民法通則》、《反不正當(dāng)競爭法》、《民事訴訟法》進(jìn)行延展。
但侵犯公民用戶隱私則可以依照《網(wǎng)絡(luò)安全法》44條非法獲取個人信息的角度進(jìn)行處理,如果抓取了這些數(shù)據(jù)不但自己用還往外面賣,那么就可以參考《刑法》修正案253條侵犯公民個人信息罪進(jìn)行處理。
謹(jǐn)慎考慮使用爬蟲的風(fēng)險
不是所有的爬蟲都一棒子敲死,存在就都是危害別人利益的,比如像百度、谷歌、360、搜狗這些搜索引擎,其實本身都在使用爬蟲技術(shù),但是其索引抓取網(wǎng)頁內(nèi)容的方式,應(yīng)用到業(yè)務(wù)里實際上是為被爬取方帶來利益的,所以不但我們不希望禁止他們的爬蟲,還期望更多的迎接他們的爬蟲的到來,當(dāng)然如果不想著爬蟲抓取我的內(nèi)容,我也可以直接通過搜索引擎爬蟲協(xié)議,對其進(jìn)行禁止爬取的設(shè)定,這樣搜索引擎就不會抓你,自然就不會有風(fēng)險。
但反之爬取網(wǎng)頁數(shù)據(jù)的工具,我明令寫了《許可協(xié)議》告知了不讓你爬你還爬,我上了“反爬取措施”你就用非法手段繞過,高頻請求對我運營平臺造成了服務(wù)器高負(fù)荷的技術(shù)壓力爬取網(wǎng)頁數(shù)據(jù)的工具,影響我正常經(jīng)營,還把爬取我的數(shù)據(jù)出去賣????
家里有礦嗎?敢這樣搞,不弄你弄誰啊?
寫在最后
很多不良機構(gòu)培訓(xùn)都打著大數(shù)據(jù)工程師培訓(xùn)的頭銜,實際上都在引導(dǎo)很多不懂行業(yè)的無知小白去學(xué)習(xí)爬蟲技術(shù),這些人沒有專業(yè)的法律法規(guī)科普,很容易在不明情況下走向了犯罪的道路,不是所有的公開數(shù)據(jù)都隨意爬的,各位一定要有這樣的認(rèn)知。
還去培訓(xùn)機構(gòu)學(xué)寫爬蟲嗎,從入門到入獄的那種?