315前,百度通過其首頁文字鏈發布名為“網絡打假百度亮劍”的3.15專題,集中曝光網絡虛假網頁和網站信息,涉及8大領域、1921家虛假網站。此外,百度首度披露了兩年來打擊網絡虛假信息的成果。數據顯示,兩年中,百度近千人監察團隊從百度所收錄的2000億網頁中逐一排查,處理下線虛假網頁達6000萬個。
搜索引擎被稱為互聯網和移動互聯網的第一入口,作為全球最大的中文搜索引擎,百度每天接受超過60億次的搜索請求。海量的搜索結果為消費者提供參考和決策的信息源的同時,卻也成為不法分子踐踏誠信的溫床。為遏制虛假信息對網民利益的侵害,多年來,百度不斷升級技術管理,組建擴充了一支擁有千名員工的專業巡查團隊,針對搜索結果實現365×24小時嚴密盯防巡查,構筑抵抗虛假不良信息的堅實城墻。
百度技術人員告訴筆者,在搜索結果審查上,百度建立起打擊虛假信息的三道壁壘。據百度介紹,智能化的 “蜘蛛抓取”技術,可以在海量的互聯網信息中,繞過存在釣魚隱患、木馬風險的問題網站,只將安全網站“抓”入百度搜索索引庫中;通過百度特有的防作弊系統,百度又會將進入索引庫的網站進一步篩查,將含有作弊信息等問題的網站再次清除。經過兩道篩查的網站,將通過百度強大的技術算法,根據網民的具體檢索需求被重新進行排序,這還沒完。最后,百度在線巡查團隊,還要就搜索結果頁中的內容進行人工排查,一旦發現違規不良信息,立刻進行人工處理。
然而,在如此嚴密的多重審核系統下,依然有一些不法分子懷揣僥幸心理瞞天過海。這個時候,最后一道人工排查的審核程序就顯得至關重要。在這家年輕的互聯網公司里,每天在浩如煙海般的網絡推廣資訊中甄別出違規信息、逐一進行人工排查的群體,正是由這些平均年齡還不到25歲的工作人員。他們有個共同的名字——“網絡監察員”。百度“網絡監察員”肩負著巡查、快速發現并處理不良信息的重任,他們常常隱匿在網絡信息發布前線,一出招即化風險于無形,為維護網絡正常秩序貢獻力量。
“敵人特別狡猾,所以需要網絡監察員的嗅覺變得越來越敏銳”,一名自稱為“老貓”的百度網絡監察員說。作為監察員,“老貓”的工作是每天坐在電腦前,監控和刪除不法分子騙過機器識別,利用作弊等手段發布在網絡上的問題網頁。“夜間是違規分子偷偷更換網站內容的多發期。白天看起來還很正規的網站可能突然‘變臉’,多了很多垃圾內容。”他說。
互聯網上的虛假不良信息讓老貓們感到責任重大。“多消滅一個問題網站,就少幾個網民被這些垃圾信息侵害,他們的財產損失也就有可能降低一分”。
技術嚴查、人力嚴打,百度織著一張縝密的網,層層把關,步步為營。據了解,2010年12月百度打擊互聯網虛假信息的陽光行動啟動以來,百度已打擊虛假網頁6000萬個,涉及虛假站點超過505萬個,為中國數億網民打造了更加安全可靠的互聯網搜索環境。