深圳新聞網(wǎng)2026年4月9日訊(記者 張金 通訊員 王雪純)在人工智能快速發(fā)展、數(shù)據(jù)越來(lái)越重要的今天,怎么規(guī)范網(wǎng)絡(luò)爬蟲、讓數(shù)據(jù)安全又合規(guī)地使用,已經(jīng)成為數(shù)字政府建設(shè)的一道必答題。尤其是通過(guò)自動(dòng)化程序收集公開信息,既是數(shù)據(jù)利用的重要方式,也一直是行業(yè)關(guān)注的合規(guī)焦點(diǎn)。
近日,坪山區(qū)緊跟前沿步伐,全省率先完成政府門戶網(wǎng)站robots協(xié)議部署落地,這意味著,坪山區(qū)政府網(wǎng)站不僅給爬蟲劃定了“能爬什么、不能爬什么”的明確邊界,更給群眾的信息安全筑牢了“防護(hù)網(wǎng)”,讓大家查信息、辦業(yè)務(wù)更放心、更便捷。
robots協(xié)議是什么?robots協(xié)議也稱爬蟲協(xié)議、爬蟲規(guī)則,它并不是復(fù)雜的程序,而是由網(wǎng)站所有者生成的一個(gè)指定配置文件(robots.txt),相當(dāng)于給網(wǎng)站貼了“訪問(wèn)說(shuō)明書”,告訴來(lái)訪爬蟲哪些頁(yè)面可以抓取;哪些頁(yè)面禁止抓取;哪些頁(yè)面可以優(yōu)先爬取。
合規(guī)友好的爬蟲在抓取該網(wǎng)站的網(wǎng)頁(yè)前,通常會(huì)先讀取并遵守這份“說(shuō)明書”,對(duì)于禁止抓取的網(wǎng)頁(yè)不進(jìn)行下載。
robots協(xié)議可以解決什么問(wèn)題?要回答robots協(xié)議可以解決什么問(wèn)題,讓我們先看看網(wǎng)上沖浪可能會(huì)帶來(lái)哪些風(fēng)險(xiǎn)。
2015年,某社交平臺(tái)A公司與某職場(chǎng)社交平臺(tái)B公司終止合作后,B公司非法抓取用戶信息,被索賠金額高達(dá)千萬(wàn)元;2017年,某海外數(shù)據(jù)分析C公司擅自爬取某海外職業(yè)社交平臺(tái)D公司公開數(shù)據(jù),經(jīng)算法分析后對(duì)外售賣,引發(fā)法律糾紛。這些案例看似只與企業(yè)相關(guān),實(shí)則背后都涉及普通用戶的個(gè)人信息是否被濫用。
從法律層面來(lái)說(shuō),我國(guó)雖然沒(méi)有直接規(guī)定數(shù)據(jù)財(cái)產(chǎn)權(quán),但明確了大量數(shù)據(jù)處理行為規(guī)則,如數(shù)據(jù)安全、個(gè)人信息保護(hù)、商業(yè)秘密,不管是企業(yè)還是其他主體,都必須嚴(yán)格遵守。在合法合規(guī)前提下,數(shù)據(jù)控制主體可依法對(duì)數(shù)據(jù)進(jìn)行開發(fā)、利用與收益,這是受法律保護(hù)的正常行為。
而部署robots協(xié)議,正是從源頭規(guī)范爬蟲行為的關(guān)鍵一步。通過(guò)提前明確網(wǎng)站數(shù)據(jù)的抓取范圍、權(quán)限和禁止性規(guī)定說(shuō)清楚,既能避免非法爬蟲違規(guī)抓取敏感數(shù)據(jù),也給數(shù)據(jù)抓取行為劃好了合法邊界。與此同時(shí),針對(duì)自動(dòng)化程序收集公開數(shù)據(jù)的行為,國(guó)內(nèi)外司法實(shí)踐已形成一定共識(shí),這也為robots協(xié)議的落地實(shí)施提供了堅(jiān)實(shí)的合規(guī)依據(jù),進(jìn)一步筑牢數(shù)據(jù)安全的防線。
坪山區(qū)robots協(xié)議部署與落實(shí)守住了大家數(shù)據(jù)安全的底線,提高了政府網(wǎng)站的運(yùn)行效率,讓大家辦事查詢更加便捷,真正做到了“安全、合規(guī)、便民”三者兼顧,也為坪山區(qū)以數(shù)字技術(shù)賦能政務(wù)服務(wù)、護(hù)航AI產(chǎn)業(yè)發(fā)展提供堅(jiān)實(shí)有力保障。
下一步,坪山區(qū)將持續(xù)深化政府?dāng)?shù)據(jù)資源開放共享,積極探索人工智能與數(shù)字政府融合應(yīng)用路徑,以技術(shù)創(chuàng)新賦能政務(wù)服務(wù)提質(zhì)增效,為全區(qū)產(chǎn)業(yè)高質(zhì)量發(fā)展注入數(shù)字動(dòng)能。