從HTTP到HTTPS,搜索史上最大遷徙
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
當(dāng)下,互聯(lián)網(wǎng)、手機(jī)已經(jīng)成為人們生活依賴度相當(dāng)高的工具,但就像一把雙刃劍,互聯(lián)網(wǎng)也是一個(gè)“黑白”都存在的世界。近年來(lái),用戶數(shù)據(jù)泄露、流量劫持、頁(yè)面篡改等安全事件頻發(fā),昨晚3.15晚會(huì)曝光了免費(fèi)WiFi的安全問(wèn)題就是一個(gè)典型的場(chǎng)景。對(duì)此,很多普通公眾可能并不明白,為什么自己的訪問(wèn)行為和隱私數(shù)據(jù)突然會(huì)被“偷走”,域名沒(méi)輸錯(cuò),結(jié)果卻跑到了一個(gè)釣魚(yú)網(wǎng)站上? 回答這個(gè)問(wèn)題,就不得不提下HTTPS,很多人對(duì)此感覺(jué)陌生,因?yàn)榛ヂ?lián)網(wǎng)發(fā)展20多年,習(xí)慣了在瀏覽器地址里輸入HTTP格式的網(wǎng)址。前不久,百度搜索引擎也啟動(dòng)了史上規(guī)模最大的一次“遷徙”,目標(biāo)就是從HTTP切換到HTTPS上去,通俗來(lái)講,就是用戶搜索關(guān)鍵詞的數(shù)據(jù)請(qǐng)求和頁(yè)面訪問(wèn),會(huì)增加一個(gè)“數(shù)據(jù)加密”的技術(shù),中間一些“傳輸”過(guò)程都被加密和認(rèn)證,第三方無(wú)法獲取,這樣就輕松化解了數(shù)據(jù)被劫持、篡改的隱患。 想一下,過(guò)去的互聯(lián)網(wǎng)是一個(gè)單純的娛樂(lè)、游戲、社交的虛擬空間,但隨著移動(dòng)互聯(lián)網(wǎng)的興起,特別是餐飲、電影、購(gòu)物、金融理財(cái),甚至是買(mǎi)汽車(chē)、租房、打車(chē)等生活服務(wù),緊密地綁定在手機(jī)及網(wǎng)絡(luò)上時(shí),人們不僅是單一的獲取信息,產(chǎn)品和服務(wù)的交易閉環(huán)也逐步成熟了。但這也進(jìn)一步放大了數(shù)據(jù)安全、被劫持或泄露的風(fēng)險(xiǎn)。最近這兩年,頻頻出現(xiàn)的欺詐、數(shù)據(jù)泄露往往會(huì)引發(fā)大的經(jīng)濟(jì)損失,也就是這個(gè)道理。 無(wú)疑,現(xiàn)在已經(jīng)到了必須HTTPS化的時(shí)間了。 HTTPS是個(gè)什么樣的世界? 先看一下,百度這次都做了哪些工作。技術(shù)術(shù)語(yǔ)是全站HTTPS安全加密服務(wù),即通過(guò)對(duì)傳統(tǒng)HTTP通道添加SSL安全套接層,將所有百度搜索請(qǐng)求全部變成加密狀態(tài),以此解決“中間者”對(duì)用戶隱私的嗅探和劫持,為網(wǎng)友提供安全可靠的上網(wǎng)和搜索環(huán)境。 那么,HTTPS究竟是一個(gè)什么樣的世界呢?接下來(lái)先普及一下知識(shí)。可以模擬一下通過(guò)互聯(lián)網(wǎng)訪問(wèn)網(wǎng)站或服務(wù)的場(chǎng)景,每個(gè)訪問(wèn)都是一次網(wǎng)絡(luò)連接鏈條的“接力游戲”,傳統(tǒng)HTTP模式下,搜索或訪問(wèn)請(qǐng)求通過(guò)“明文信息”,經(jīng)過(guò)中間的代理服務(wù)器、路由器、wifi熱點(diǎn)、服務(wù)運(yùn)營(yíng)商等“中間人”的通路,最終將數(shù)據(jù)或服務(wù)“取”回來(lái)。這個(gè)“中間”渠道就存在大量的數(shù)據(jù)泄露或劫持的風(fēng)險(xiǎn),很多雙眼睛都盯著,幾乎步步驚心。HTTPS通過(guò)加密的形式,防止中途被劫持或篡改,規(guī)避了風(fēng)險(xiǎn)。 你可能會(huì)說(shuō),不就是做一個(gè)從HTTP到HTTPS的切換嗎?其實(shí),背后卻是一個(gè)復(fù)雜的工程。拿百度來(lái)說(shuō),因?yàn)樗阉鲙缀跏前俣茸詈诵牡摹皟?nèi)核”,連接了圖片、百科、知道、貼吧、Video、地圖等幾乎所有的產(chǎn)品,數(shù)億的用戶都會(huì)影響到,個(gè)性化推薦和千人千面的趨勢(shì)更如此,這就成了一件浩瀚的工程,而且還必須保持業(yè)務(wù)的連續(xù)性,不能中斷業(yè)務(wù),穩(wěn)定響應(yīng)用戶請(qǐng)求,復(fù)雜度幾乎是難以想象的。所以,百度去年才會(huì)從小入手開(kāi)始做小流量的測(cè)試,選擇用戶和應(yīng)用負(fù)載小的入口開(kāi)始。 那么,從技術(shù)角度看,難度主要體現(xiàn)在哪呢,類(lèi)似IPV4到IPV6的升級(jí)。首先這是一次聯(lián)合作戰(zhàn),涉及到的所有產(chǎn)品和部門(mén)技術(shù)聯(lián)合作戰(zhàn),所有的鏈接資源都要切到HTTPS上,產(chǎn)生錯(cuò)誤就會(huì)出現(xiàn)空白頁(yè)或訪問(wèn)錯(cuò)誤;二是速度優(yōu)化,任何一個(gè)加密的過(guò)程,相當(dāng)于多了一次SSL握手、RSA校驗(yàn),耗時(shí)變長(zhǎng),性能降低,而搜索頁(yè)面常態(tài)下保守也會(huì)有數(shù)十個(gè)資源鏈接,疊加在一起,會(huì)影響訪問(wèn)及響應(yīng)速度;三是即使全網(wǎng)切換,也要做好HTTPS和HTTP的過(guò)渡和兼容,referer、cookie等數(shù)據(jù)如何保持一致,避免出現(xiàn)訪問(wèn)故障;四考慮到大多數(shù)網(wǎng)站,CDN的內(nèi)容和應(yīng)用的分發(fā)已是標(biāo)配,這要求所有的CDN節(jié)點(diǎn)都支持HTTPS,如果非自建而是第三方,更增加了難度。 百度為什么要遷移到HTTPS? 大家可能會(huì)有一個(gè)疑問(wèn),既然這么復(fù)雜的工程,涉及到巨大的投入和成本,還給產(chǎn)品和業(yè)務(wù)帶來(lái)一定的風(fēng)險(xiǎn),在國(guó)內(nèi)大多數(shù)互聯(lián)網(wǎng)企業(yè)紛紛“避開(kāi)”時(shí),百度憑什么敢“越雷池一步”呢?我們主要從微觀和宏觀兩個(gè)層面探討下。 微觀層面,互聯(lián)網(wǎng)是一個(gè)奇怪的世界,水面下總是暗流涌動(dòng),就算是技術(shù)很強(qiáng)悍的百度,每天有來(lái)自于全球的數(shù)十億次的搜索請(qǐng)求,但其中不可避免地會(huì)有小部分的流量會(huì)遭劫持或篡改,由于區(qū)域分布散、廣等特點(diǎn),很難完全解決。更不要提一些小網(wǎng)站,所以圈兒里也有專(zhuān)門(mén)做流量劫持和販賣(mài)的營(yíng)生的。而反饋到用戶前端,常見(jiàn)的現(xiàn)象很多,一個(gè)是搜索結(jié)果頁(yè)被篡改或加載上廣告,謀取商業(yè)利益;一個(gè)是比如用戶剛搜了一個(gè)汽車(chē),賣(mài)車(chē)的電話就找上門(mén)了。這都影響了用戶的搜索體驗(yàn),用戶會(huì)誤認(rèn)為是百度泄露了數(shù)據(jù),背了黑鍋。這樣灰色的利益鏈條很多,未來(lái)會(huì)高頻發(fā)生。 宏觀層面,未來(lái)的互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)越來(lái)越是一個(gè)服務(wù)交易的閉環(huán)鏈,意味著用戶對(duì)技術(shù)的依賴度日益提升,需要一個(gè)更安全的網(wǎng)絡(luò)承載環(huán)境,否則安全事件就會(huì)此起彼伏。另一方面,未來(lái)會(huì)是一個(gè)網(wǎng)絡(luò)鏈路日趨復(fù)雜的結(jié)構(gòu),WIFI熱點(diǎn)的普及和移動(dòng)網(wǎng)絡(luò)的加入,放大了數(shù)據(jù)被劫持、篡改的風(fēng)險(xiǎn)。這兩點(diǎn)與傳統(tǒng)的HTTP的網(wǎng)絡(luò)鏈路模式間的矛盾日益突出。 以上兩個(gè)層面,決定了百度從核心搜索入手,進(jìn)行HTTPS的大遷移,從長(zhǎng)遠(yuǎn)看,這就成了一場(chǎng)攻堅(jiān)戰(zhàn)。 平臺(tái)遷移,應(yīng)用層會(huì)更流暢過(guò)渡 其實(shí),作為HTTP的安全版本,HTTPS并非是全新的。從全球來(lái)看,這絕對(duì)是巨頭推動(dòng)的工程,因?yàn)槎唐诳词峭度氪?、回?bào)少,還會(huì)影響用戶體驗(yàn),但長(zhǎng)期看,對(duì)產(chǎn)業(yè)的積極意義明顯。與百度一樣,谷歌去年開(kāi)始,由搜索和Chrome瀏覽器挑頭,推動(dòng)往HTTPS協(xié)議的過(guò)渡,提醒網(wǎng)站明文傳輸?shù)腍TTP“不安全”。同樣,F(xiàn)acebook、Twitter也陸續(xù)在做這樣的嘗試。早早規(guī)劃HTTPS項(xiàng)目的百度這次大魄力推進(jìn),也是希望產(chǎn)業(yè)界認(rèn)識(shí)到“HTTP = 不安全”的嚴(yán)重性。越是大企業(yè),擔(dān)負(fù)的也就越多,責(zé)任意識(shí)也就越強(qiáng)。 放眼中國(guó),推進(jìn)互聯(lián)網(wǎng)HTTPS化,是一件關(guān)乎產(chǎn)業(yè)發(fā)展環(huán)境和生態(tài)的大事,就像空氣和土壤一樣,失去了這個(gè),就動(dòng)了根基。升級(jí)HTTPS需要聯(lián)動(dòng),基礎(chǔ)設(shè)施、網(wǎng)絡(luò)架構(gòu)、底層服務(wù)提供商都要同步轉(zhuǎn)換,跨過(guò)所謂的緩存終結(jié)者、性能殺手等潛在矛盾。像BAT這樣級(jí)別的企業(yè),最應(yīng)該及早動(dòng)手,為產(chǎn)業(yè)未來(lái)搭建一個(gè)安全、穩(wěn)定、可靠的網(wǎng)絡(luò)環(huán)境。今天百度第一家站出來(lái),敢于在核心搜索上“動(dòng)手”,做出樣板和參考出來(lái),也做了一個(gè)好的示范。 互聯(lián)網(wǎng)巨頭站出來(lái),更容易帶動(dòng)一批企業(yè)的整體切換,因?yàn)榫揞^往往搭的是平臺(tái)和生態(tài),上面跑著各種應(yīng)用和服務(wù)提供商,只有平臺(tái)進(jìn)行“遷移”,應(yīng)用層自然會(huì)流暢過(guò)渡。很多技術(shù)上的難題都容易化解。 當(dāng)然,百度第一個(gè)吃螃蟹,難免要做一些開(kāi)路先鋒和修路搭橋的活兒,這或許也是其他同行們暫時(shí)觀望的理由。但如果放在中國(guó)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的頂層設(shè)計(jì)高度看,這件事最終會(huì)惠澤產(chǎn)業(yè)和生態(tài),就沒(méi)理由只圍觀了。所以我們更期待看到在百度之后,更多的企業(yè)一起去推進(jìn)完成HTTPS化的過(guò)程。 該文章在 2015/3/19 8:09:14 編輯過(guò) |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |