人工(gōng)智能犯罪細節首次披露:你的個人信息是這樣被破解的

發布日期:2017-11-07首頁 > IT資(zī)訊

 一(yī)起個人信息罪案中(zhōng),人工(gōng)智能技術參與到數據洩露的核心環節,從而助長“徐玉玉案”式精準詐騙,且非法獲取個人信息的成本大(dà)幅降低。

  (2016年8月19日,山東省臨沂市羅莊區高考錄取新生(shēng)徐玉玉被犯罪嫌疑人以發放(fàng)助學金的名義,實施電(diàn)信詐騙騙走9900元。案發後,徐玉玉與父親到公安機關報案,回家途中(zhōng)心髒驟停,送醫院搶救無效死亡。2017年7月19日,山東臨沂,徐玉玉的父親相信法律的公平。圖/視覺中(zhōng)國)

  人類圍棋界“最強大(dà)腦”敗于人工(gōng)智能Alphago時,另一(yī)人工(gōng)智能已經進入違法犯罪的黑色領域。

  一(yī)起普通的網絡代付詐騙,牽出一(yī)個利用人工(gōng)智能技術、一(yī)秒鍾盜取2000組公民信息數據的犯罪團夥。通過深挖公民個人信息賬号密碼買賣這條線索,浙江紹興警方發現一(yī)條涉及利用黑客技術非法獲取網站後台用戶注冊數據、數據撞庫、繞開(kāi)互聯網公司安全策略的打碼平台、網絡詐騙、非法信息推廣的互聯網黑色産業鏈。

  這一(yī)黑産鏈條中(zhōng),參與到數據洩露環節的人工(gōng)智能技術頗爲關鍵,使得非法獲取個人信息的成本大(dà)幅降低。

  量販個人信息

  2017年2月9日晚,紹興市公安局越城區分(fēn)局城南(nán)派出所接到公民虞玉華報案稱,虞當晚收到好友王甜的一(yī)條信息,王甜購買一(yī)件價值1922元的商(shāng)品,因手機支付不成功,請虞幫忙代付。虞玉華通過手機爲好友支付貨款後,對方再次要求付款,她疑心被騙因而報案。結果證明,王甜的賬号被盜,有人冒充王甜對其好友實施詐騙。

  接到虞玉華報警後,越城警方在哈爾濱抓獲這個利用社交軟件冒充好友實施代付詐騙的犯罪團夥。團夥成員(yuán)十餘人,均爲同學關系。

  他們在哈爾濱一(yī)個居民小(xiǎo)區裏租了一(yī)套兩居室,客廳被改造成工(gōng)作室,碼放(fàng)8台電(diàn)腦作爲作案工(gōng)具,吃住、詐騙都在這套出租屋内進行。團夥分(fēn)工(gōng)明确,頭目鄭前負責招募人員(yuán)、培訓和購買作案工(gōng)具,其他成員(yuán)登錄不同種類的社交軟件實施詐騙。

  在這個團夥的電(diàn)腦中(zhōng),紹興警方發現大(dà)量公民個人信息。“信息最多的一(yī)台電(diàn)腦中(zhōng)有300多GB的個人信息,包括多個郵箱、社交軟件的賬号和密碼,而且都很準确。”越城區公安分(fēn)局網警大(dà)隊大(dà)隊長錢立鋒向《财經》記者介紹。

  這些信息從何而來?鄭前稱,這些信息是他以一(yī)組2元左右的價格,共花40多萬元從吳傑等人手中(zhōng)買來的。而吳傑手中(zhōng)的信息則來自一(yī)個黑客犯罪團夥,該團夥利用超級SQL注入工(gōng)具、網站漏洞掃描軟件,批量掃描網站程序漏洞,非法獲取網站後台用戶注冊數據,這被稱爲“脫庫”。

  這些數據大(dà)多是郵箱賬号和密碼。獲取網站後台數據後,黑客團夥将包含各類郵箱和密碼的數據分(fēn)門别類進行銷售,以每10萬條數據50元到100元的價格賣給吳傑等人。

  獲取數據後,吳傑等人用“撞庫”軟件進行批量撞庫、匹配,進而将各類賬号與密碼匹配成功的賬戶以1.2元到2元一(yī)個的價格,販賣給網絡詐騙犯罪團夥。

  “撞庫”是黑客通過收集互聯網已洩露的用戶賬戶和密碼信息,生(shēng)成對應的字典表,嘗試批量登錄其他網站後,得到一(yī)系列可以登錄的賬号。

  “脫庫”竊取到的郵箱、社交軟件等賬号密碼信息大(dà)多是單一(yī)的、無效的,需要将這些信息進行“清洗”。

  錢立鋒告訴《财經》記者,很多用戶習慣在不同網站使用相同的郵箱賬号登錄,甚至登錄賬号密碼也和郵箱一(yī)樣。黑客可以通過獲取用戶在A網站的賬戶從而嘗試登錄B網址,這就完成一(yī)次“撞庫”嘗試。

  經過“撞庫”清洗後,一(yī)些賬号關聯的其他平台賬号被順利登錄,完成“清洗”後的數據更爲豐富,可以精準獲知(zhī)該用戶的許多平台注冊信息,這在犯罪分(fēn)子眼中(zhōng)極有價值,價格也随之漲高。

  去(qù)年山東女大(dà)學生(shēng)徐玉玉被詐騙分(fēn)子以發放(fàng)助學金的名義,騙走全部學費(fèi)9900元,在報警回家的路上猝死,就是由于騙子掌握了徐玉玉準确的錄取信息、手機号碼等個人信息,精準實施詐騙。

  “碼奴”産業

  爲了防止黑客批量測試賬戶密碼,各網站和平台動了不少腦筋,“驗證碼”是常用防範手段之一(yī)。

  網絡用戶在各大(dà)網站或者平台注冊、登錄賬号時,經常可以見到包括字符式、數字、字符+點選式、滑塊拼圖式、圖片人工(gōng)答題式等驗證碼,其中(zhōng)字符型驗證碼形式是互聯網行業普遍采用的驗證碼形式。

  驗證碼的防範機制是:提出的問題要容易被人類解答,而讓機器無法解答。

  當賬号登錄存在異常的時候,爲了保護賬号安全,系統會提示輸入驗證碼。其目的是防止黑産人員(yuán)批量惡意登錄——他們可以利用機器大(dà)量輸入賬号和密碼,但是機器無法識别驗證碼。由此,對于想要獲取精準個人賬戶信息的犯罪團夥,在“撞庫”環節中(zhōng),如何進行批量驗證就成爲關鍵。

  由于無法規避驗證碼,黑客們若要試出有效密碼,需要人工(gōng)逐條輸入信息和識别驗證碼,比對、驗證并成功匹配個人信息的賬号密碼,确認信息準确可以使用,再交給數據商(shāng)——這些人在圈内被稱爲“碼奴”,這一(yī)環節也被稱爲“打碼”。

  一(yī)位“碼奴”向《财經》記者透露,根據驗證碼的複雜(zá)程度和輸入的準确率,打1000個驗證碼會掙取1元至25元不等,每天工(gōng)作12小(xiǎo)時,最多可以輸入2萬個驗證碼,掙到300多元。

  最熟練的“碼奴”輸入一(yī)個驗證碼也需要一(yī)秒鍾時間。在傳統的信息洩露相關犯罪中(zhōng),因高昂的人力資(zī)本和較爲漫長的工(gōng)作周期,被“清洗”的數據相對有限。

  因此在查獲巨量個人信息後,越城警方意識到,這一(yī)系列案件中(zhōng)的“打碼”絕非人工(gōng)識别完成。随後警方調查發現,該案中(zhōng),拿到原始數據的數據商(shāng),通過一(yī)個名爲“快啊”的打碼平台進一(yī)步進行深加工(gōng)。

  工(gōng)商(shāng)信息顯示,“快啊”平台是沈陽納信科技有限公司旗下(xià)産品,該公司經營範圍爲計算機科學技術研究、計算機軟件開(kāi)發、網絡技術研究、網絡工(gōng)程設計、計算機軟件銷售等。警方在調查中(zhōng)發現,該平台專爲網絡黑産和灰産識别破解字符型驗證碼提供技術幫助。

  打碼平台上有多種針對不同互聯網産品進行“撞庫”的軟件,數據商(shāng)将驗證碼傳給“快啊”打碼平台的某一(yī)“撞庫”軟件識别接口,打碼平台将驗證碼發給後端的“碼奴”進行識别,并獲取識别結果。

  越城警方對“快啊”平台數據分(fēn)析獲知(zhī),接入該平台提供驗證碼識别服務的“撞庫”軟件有100多款,接入平台的用戶達1.1萬餘人,從2016年6月到2017年3月,平台資(zī)金進賬累計達1650萬元,爲國内最大(dà)的“打碼”平台。

  錢立鋒介紹說,“打碼”平台目前遊走在法律邊緣,界定并不清晰。“什麽樣的人需要批量識别驗證碼?往往都是從事網絡黑産和灰産的人員(yuán)。”
 

8677-1G106125SD22.jpg
 

  (犯罪嫌疑人使用的部分(fēn)作案工(gōng)具)

  除黑色産業的詐騙人員(yuán),打碼平台的通常使用者是“羊毛黨”、搶票(piào)的“黃牛”及論壇刷帖“水軍”。

  以“羊毛黨”爲例,一(yī)些網貸平台爲吸引投資(zī)者常推出一(yī)些收益豐厚的活動,如注冊認證獎勵、充值返現、投标返利等,催生(shēng)了以此寄生(shēng)的投機群體(tǐ)“羊毛黨”。“羊毛黨”去(qù)某網站刷活動優惠券,但該網站有較複雜(zá)的驗證碼,通常“羊毛黨”會在打碼平台注冊賬号并充值,并通過打碼平台提供的接口,提交驗證碼識别。打碼平台将驗證碼分(fēn)發到各個“碼奴”客戶端裏,獲取識别結果,并最終反饋給“羊毛黨”。

  據辦案民警介紹,“快啊”平台被查的前三個月,已提供驗證碼識别服務259億次。
 

8677-1G106125UD36.jpg
 

  (犯罪嫌疑人與贓款)

  在人力資(zī)源有限的情況下(xià),“快啊”平台如何做到可以提供巨量的驗證碼識别服務?越城警方在其背後發現一(yī)個無需“碼奴”的高級“打碼”技術。

  AI“打碼”

  随着偵查深入,越城警方發現,爲“快啊”平台提供驗證碼識别服務的一(yī)個重要軟件系統名爲NID,這一(yī)人工(gōng)智能程序由廈門人楊柯設計。

  楊柯現年33歲,家境優越,父親是當地房地産開(kāi)發商(shāng),他和妻兒住在廈門一(yī)處140多平方米的住宅裏,每平方米售價近5萬元。

  畢業于廈門某大(dà)學計算機專業的楊柯研究人工(gōng)智能已有十餘年。楊柯稱,他使用伯克利大(dà)學開(kāi)發的caffe框架作爲深度學習框架,并且使用VGG16結構創建了一(yī)個神經網絡,之後從網絡上下(xià)載了幾乎全世界所有字體(tǐ),對神經網絡進行訓練,使它具有圖文轉換的能力,再将這個神經網絡與具有圖像接受和處理結果返回功能的服務端進行網絡連接,構成一(yī)個系統,命名爲NID。

  每天,像教兒童一(yī)樣,楊柯要培訓NID學習識别各種驗證碼。在他的“培養”下(xià),NID破解驗證碼的能力越來越強。
 

8677-1G106125924R8.jpg
 

  (楊柯制作的驗證碼樣本庫)

  錢立鋒告訴《财經》記者,通過運用人工(gōng)智能機器深度學習技術訓練機器,楊柯讓NID如AlphaGo一(yī)樣自主操作識别,有效識别圖片驗證碼,輕松繞過互聯網公司設置的賬戶登錄安全策略——驗證碼。

  由于人工(gōng)智能的幫助,NID“打碼”速度很快,平均一(yī)秒可以識别出2000個驗證碼,是人工(gōng)“打碼”的2000倍;且正确率很高,可以識别出98%以上的驗證碼。

  楊柯稱,NID程序剛編寫完成,正确率就高達95%,基本能正确識别所有清晰圖片中(zhōng)的文本,楊柯還不斷充實樣本庫,給NID程序輸入大(dà)量的圖片文件讓其進行識别,NID程序本身就具備很高的識别應對能力;此外(wài),NID系統也會自動學習,它每秒鍾會從用戶反饋的識别錯誤樣本庫中(zhōng)抽取一(yī)張比對正确答案進行學習,這個學習過程從編寫出程序到案發前,時刻進行。

  驗證碼被NID系統識别出後,黑客竊取的半成品信息,相當于完成了深加工(gōng)。數據商(shāng)拿到這些精準信息,打包組合,出售給個人信息産業鏈下(xià)遊的詐騙集團、廣告商(shāng),一(yī)條精準的個人信息,甚至可以賣到幾百元。

  “快啊”打碼平台收取信息處理費(fèi)用,收入的50%給了撞庫軟件作者,50%由平台開(kāi)發商(shāng)李奇和楊柯平分(fēn)。短短一(yī)年内,平台牟利1300多萬元,楊柯分(fēn)得300多萬元。利用NID程序,多的時候,楊柯一(yī)個月可以掙六七十萬元。

  2017年3月23日,“快啊”平台涉案被越城警方偵查。由于該案犯罪手法新穎、社會危害大(dà),越城公安分(fēn)局成立由網警牽頭,刑偵、特警、派出所等多部門配合組成的專案組。

  圍繞該産業鏈的上下(xià)遊,專案組輾轉福建、廣東、江西、黑龍江、遼甯、山東等13個省展開(kāi)偵查、抓捕,抓獲利用黑客技術非法獲取網站後台數據的嫌疑人4人,使用撞庫軟件獲取賬戶密碼的嫌疑人19人,提供圖片驗證服務的“快啊”打碼平台嫌疑人2人,制作“撞庫”軟件的9人,利用公民個人信息實施網絡犯罪的團夥28個,共159人。

  防範難題

  一(yī)位數據安全專家介紹,“快啊”打碼平台利用NID程序對字符型驗證碼的破解,是基于人工(gōng)智能的深度學習框架,使用相關的網絡模型訓練學習,來實現對字符型驗證碼的海量快速識别破解。由于字符型驗證碼是互聯網通用的安全策略,一(yī)旦被破解攻陷,将會給包括政企網站在内的互聯網行業用戶數據安全帶來風險。

  基于深度學習原理,隻要樣本庫足夠豐富,這一(yī)智能程序可以識别的東西會越來越多——即使複雜(zá)如鐵路訂票(piào)平台12306的驗證碼,也隻是物(wù)品種類多、形态多樣的圖片識别,假以時日,NID程序一(yī)樣可以破解。

  騰訊安全專家周正認爲,互聯網行業的安全防範主要是對抗有規律、有特點的惡意行爲,對抗這種有深度學習能力的人工(gōng)智能犯罪,有必要提升防範等級,增加多維度的安全驗證環節。

  比如,登錄時使用字符型驗證碼,二次登錄用短信或郵件驗證,輔助以滑塊解鎖等方式,“對抗不斷升級的入侵攻擊,提高犯罪門檻,強化動态機制,是互聯網安全行業一(yī)直在做的事情”。

  人工(gōng)智能(Artificial Intelligence),英文縮寫爲AI,是研究、開(kāi)發用于模拟、延伸和擴展人的智能的理論、方法、技術及應用系統的一(yī)門新的技術科學。

  随着科技發展,近幾年,“人工(gōng)智能”這一(yī)概念通常指的是谷歌等公司開(kāi)源的一(yī)些基于神經網絡進行深度學習、可以不斷訓練強化神經網絡的人工(gōng)智能。楊柯開(kāi)發的NID程序即屬于這一(yī)人工(gōng)智能範疇。

  基于“深度學習”的新型人工(gōng)智能,極大(dà)降低了網絡黑産犯罪成本。如NID程序對字符型驗證碼的識别破解已快到毫秒級,“打碼”平台的效率和業務量借此呈指數級别增長。而作爲“驗證”這一(yī)重要的網絡安全環節,被攻陷後可被不法分(fēn)子用于多個不同場景作惡,如撞庫、竊取信息、惡意灌水發帖、刷單、刷點擊量等,危害互聯網生(shēng)态。

  錢立鋒感慨,以往的黑客攻擊針對網站漏洞入侵,相當于“開(kāi)鎖式進入”,而借助于人工(gōng)智能,進攻方式變成了“硬闖”。

  值得關注的是,這一(yī)案例是否意味着人工(gōng)智能犯罪時代已經到來?

  北(běi)京交通大(dà)學計算機與信息技術學院副教授王偉介紹,目前人類已經掌握了“弱人工(gōng)智能”,即能制造出真正推理和解決問題的智能機器,這些機器并不真正擁有智能,也不會有自主意識,同在各方面能和人類比肩的“強人工(gōng)智能”和比人類大(dà)腦聰明許多的“超人工(gōng)智能”相比,“弱人工(gōng)智能”隻是人工(gōng)智能的初級階段,NID系統屬于此列。

  基于此,上海财經大(dà)學法學院副院長胡淩認爲,上述案件中(zhōng),“人工(gōng)智能”隻是輔助犯罪嫌疑人實施犯罪的工(gōng)具和手段,犯罪主體(tǐ)仍然是人而非機器,尚在中(zhōng)國刑法規制範圍内。

  不過,錢立鋒認爲,在打擊互聯網技術類犯罪面前,《刑法》在适用上還有很多待商(shāng)榷之處,譬如如何理解主觀明知(zhī)、證據标準如何把握、宣告刑普遍偏輕等問題,在适用上應統一(yī)認識。

  另外(wài),電(diàn)信詐騙等犯罪的辦案主體(tǐ)往往是縣一(yī)級公安機關。雖然電(diàn)信詐騙辦案難度不大(dà),但爲打掉整個黑色産業鏈,需要辦案人員(yuán)向上追溯到信息洩露、“打碼”等技術環節。但實際中(zhōng),證據固定難度通常很大(dà)——數據會被犯罪分(fēn)子删除,數據經網絡流轉後,調取比較困難,縣級公安的技術能力往往有限。

  錢立鋒以上述案件舉例,該案技術門檻高,複雜(zá)程度也很大(dà),辦案機關扣留涉案設備後需要将“撞庫”軟件、“打碼”平台程序、神經網絡圖片驗證碼識别程序三個不同功能的軟件重新搭建,模拟現實環境,全程錄像取證,協同作業後,才能認定爲一(yī)個能完整實現破解識别字符型驗證碼、“撞庫”、“洗庫”的軟件系統。

  今年10月16日,在最高檢察院召開(kāi)的新聞發布會上,最高檢公訴廳副廳長張相軍表達了類似觀點。他指出,與傳統的刑事犯罪相比,網絡犯罪具有主體(tǐ)的智能性、行爲的隐蔽性、手段的多樣性、傳播的廣域性等突出特點。

  與這些特點緊密相連,檢察機關懲治計算機網絡犯罪方面遇到的難點主要有取證和證明難——網絡空間所有行爲通過數字化的形式完成,沒有目擊證人,網絡犯罪證據多以電(diàn)子數據爲主要形态,偵查取證主要依賴技術手段完成;此外(wài),網絡犯罪的取證、鑒定、定性等都需要很強的專業知(zhī)識,檢察機關辦理此類案件需要大(dà)量專業人才。但從目前的實際情況看,檢察機關網絡技術人才十分(fēn)缺乏,既精通法律業務又(yòu)熟悉網絡技術的複合型檢察人才更是匮乏。

  周正對未來表示擔憂。他認爲,上述案件雖然僅是個案,有一(yī)定的技術門檻。但可以看出,網絡黑産犯罪分(fēn)子對技術應用到如此程度,已極盡所能。“人工(gōng)智能本身是一(yī)種技術,但随着高速發展,已成爲雙刃劍,如何用好這項技術,值得更加深入地研究和實踐。”

  整體(tǐ)而言,技術犯罪數量在不斷上升。最高檢新聞發言人王松苗在前述新聞發布會上表示,2016年以來,全國因涉嫌計算機犯罪被檢方提起公訴的共1568人,僅今年1月至9月就有710人,同比上升80.7%。41169人因涉嫌網絡電(diàn)信侵财犯罪被公訴,今年前九個月就有22268人,同比上升118.6%。

  最高檢會同最高法正在共同研究起草《關于辦理網絡犯罪案件适用法律若幹問題的解釋》,将針對《刑法修正案(九)》增設的拒不履行信息網絡安全管理義務罪、非法利用信息網絡罪、幫助信息網絡犯罪活動罪,明确定罪量刑标準和有關法律适用問題。

  (文中(zhōng)受害人、犯罪嫌疑人均使用化名)