Comet:基于 HTTP 長(zhǎng)連接的“服務(wù)器推”技術(shù)
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
很多應(yīng)用譬如監(jiān)控、即時(shí)通信、即時(shí)報(bào)價(jià)系統(tǒng)都需要將后臺(tái)發(fā)生的變化實(shí)時(shí)傳送到客戶(hù)端而無(wú)須客戶(hù)端不停地刷新、發(fā)送請(qǐng)求。本文首先介紹、比較了常用的“服務(wù)器推”方案,著重介紹了 comet - 使用 http 長(zhǎng)連接、無(wú)須瀏覽器安裝插件的兩種“服務(wù)器推”方案:基于 ajax 的長(zhǎng)輪詢(xún)方式;基于 iframe 及 htmlfile 的流方式。最后分析了開(kāi)發(fā) comet 應(yīng)用需要注意的一些問(wèn)題,以及如何借助開(kāi)源的 comet 框架-pushlet 構(gòu)建自己的“服務(wù)器推”應(yīng)用。 “服務(wù)器推”技術(shù)的應(yīng)用 傳統(tǒng)模式的 web 系統(tǒng)以客戶(hù)端發(fā)出請(qǐng)求、服務(wù)器端響應(yīng)的方式工作。這種方式并不能滿(mǎn)足很多現(xiàn)實(shí)應(yīng)用的需求,譬如: 監(jiān)控系統(tǒng):后臺(tái)硬件熱插拔、led、溫度、電壓發(fā)生變化; 將“服務(wù)器推”應(yīng)用在 web 程序中,首先考慮的是如何在功能有限的瀏覽器端接收、處理信息: 客戶(hù)端如何接收、處理信息,是否需要使用套接口或是使用遠(yuǎn)程調(diào)用。客戶(hù)端呈現(xiàn)給用戶(hù)的是 html 頁(yè)面還是 java applet 或 flash 窗口。如果使用套接口和遠(yuǎn)程調(diào)用,怎么和 javascript 結(jié)合修改 html 的顯示。 flash xmlsocket 如果 web 應(yīng)用的用戶(hù)接受應(yīng)用只有在安裝了 flash 播放器才能正常運(yùn)行, 那么使用 flash 的 xmlsocket 也是一個(gè)可行的方案。 這種方案實(shí)現(xiàn)的基礎(chǔ)是: flash 提供了 xmlsocket 類(lèi)。 關(guān)于如何去構(gòu)建充當(dāng)了 javascript 與 flash xmlsocket 橋梁的 flash 程序,以及如何在 javascript 里調(diào)用 flash 提供的接口,我們可以參考 aflax(asynchronous flash and xml)項(xiàng)目提供的 socket demo 以及 socketjs(請(qǐng)參見(jiàn) 參考資源)。 javascript 與 flash 的緊密結(jié)合,極大增強(qiáng)了客戶(hù)端的處理能力。從 flash 播放器 v7.0.19 開(kāi)始,已經(jīng)取消了 xmlsocket 的端口必須大于 1023 的限制。linux 平臺(tái)也支持 flash xmlsocket 方案。但此方案的缺點(diǎn)在于: 客戶(hù)端必須安裝 flash 播放器; java applet 套接口 在客戶(hù)端使用 java applet,通過(guò) java.net.socket 或 java.net.datagramsocket 或 java.net.multicastsocket 建立與服務(wù)器端的套接口連接,從而實(shí)現(xiàn)“服務(wù)器推”。 這種方案最大的不足在于 java applet 在收到服務(wù)器端返回的信息后,無(wú)法通過(guò) javascript 去更新 html 頁(yè)面的內(nèi)容。 基于 http 長(zhǎng)連接的“服務(wù)器推”技術(shù) comet 簡(jiǎn)介 瀏覽器作為 web 應(yīng)用的前臺(tái),自身的處理功能比較有限。瀏覽器的發(fā)展需要客戶(hù)端升級(jí)軟件,同時(shí)由于客戶(hù)端瀏覽器軟件的多樣性,在某種意義上,也影響了瀏覽器新技術(shù)的推廣。在 web 應(yīng)用中,瀏覽器的主要工作是發(fā)送請(qǐng)求、解析服務(wù)器返回的信息以不同的風(fēng)格顯示。ajax 是瀏覽器技術(shù)發(fā)展的成果,通過(guò)在瀏覽器端發(fā)送異步請(qǐng)求,提高了單用戶(hù)操作的響應(yīng)性。但 web 本質(zhì)上是一個(gè)多用戶(hù)的系統(tǒng),對(duì)任何用戶(hù)來(lái)說(shuō),可以認(rèn)為服務(wù)器是另外一個(gè)用戶(hù)?,F(xiàn)有 ajax 技術(shù)的發(fā)展并不能解決在一個(gè)多用戶(hù)的 web 應(yīng)用中,將更新的信息實(shí)時(shí)傳送給客戶(hù)端,從而用戶(hù)可能在“過(guò)時(shí)”的信息下進(jìn)行操作。而 ajax 的應(yīng)用又使后臺(tái)數(shù)據(jù)更新更加頻繁成為可能。
下面將介紹兩種 comet 應(yīng)用的實(shí)現(xiàn)模型。 基于 ajax 的長(zhǎng)輪詢(xún)(long-polling)方式 如 圖 1 所示,ajax 的出現(xiàn)使得 javascript 可以調(diào)用 xmlhttprequest 對(duì)象發(fā)出 http 請(qǐng)求,javascript 響應(yīng)處理函數(shù)根據(jù)服務(wù)器返回的信息對(duì) html 頁(yè)面的顯示進(jìn)行更新。使用 ajax 實(shí)現(xiàn)“服務(wù)器推”與傳統(tǒng)的 ajax 應(yīng)用不同之處在于: 服務(wù)器端會(huì)阻塞請(qǐng)求直到有數(shù)據(jù)傳遞或超時(shí)才返回。 圖 2. 基于長(zhǎng)輪詢(xún)的服務(wù)器推模型
在這種長(zhǎng)輪詢(xún)方式下,客戶(hù)端是在 xmlhttprequest 的 readystate 為 4(即數(shù)據(jù)傳輸結(jié)束)時(shí)調(diào)用回調(diào)函數(shù),進(jìn)行信息處理。當(dāng) readystate 為 4 時(shí),數(shù)據(jù)傳輸結(jié)束,連接已經(jīng)關(guān)閉。mozilla firefox 提供了對(duì) streaming ajax 的支持, 即 readystate 為 3 時(shí)(數(shù)據(jù)仍在傳輸中),客戶(hù)端可以讀取數(shù)據(jù),從而無(wú)須關(guān)閉連接,就能讀取處理服務(wù)器端返回的信息。ie 在 readystate 為 3 時(shí),不能讀取服務(wù)器返回的數(shù)據(jù),目前 ie 不支持基于 streaming ajax。 基于 iframe 及 htmlfile 的流(streaming)方式 iframe 是很早就存在的一種 html 標(biāo)記, 通過(guò)在 html 頁(yè)面里嵌入一個(gè)隱蔵幀,然后將這個(gè)隱蔵幀的 src 屬性設(shè)為對(duì)一個(gè)長(zhǎng)連接的請(qǐng)求,服務(wù)器端就能源源不斷地往客戶(hù)端輸入數(shù)據(jù)。
從 圖 3 可以看到,每次數(shù)據(jù)傳送不會(huì)關(guān)閉連接,連接只會(huì)在通信出現(xiàn)錯(cuò)誤時(shí),或是連接重建時(shí)關(guān)閉(一些防火墻常被設(shè)置為丟棄過(guò)長(zhǎng)的連接, 服務(wù)器端可以設(shè)置一個(gè)超時(shí)時(shí)間, 超時(shí)后通知客戶(hù)端重新建立連接,并關(guān)閉原來(lái)的連接)。 使用 iframe 請(qǐng)求一個(gè)長(zhǎng)連接有一個(gè)很明顯的不足之處:ie、morzilla firefox 下端的進(jìn)度欄都會(huì)顯示加載沒(méi)有完成,而且 ie 上方的圖標(biāo)會(huì)不停的轉(zhuǎn)動(dòng),表示加載正在進(jìn)行。google 的天才們使用一個(gè)稱(chēng)為“htmlfile”的 activex 解決了在 ie 中的加載顯示問(wèn)題,并將這種方法用到了 gmail+gtalk 產(chǎn)品中。alex russell 在 “what else is burried down in the depth's of google's amazing javascript?”文章中介紹了這種方法。zeitoun 網(wǎng)站提供的 comet-iframe.tar.gz,封裝了一個(gè)基于 iframe 和 htmlfile 的 javascript comet 對(duì)象,支持 ie、mozilla firefox 瀏覽器,可以作為參考。(請(qǐng)參見(jiàn) 參考資源) 使用 comet 模型開(kāi)發(fā)自己的應(yīng)用 上面介紹了兩種基于 http 長(zhǎng)連接的“服務(wù)器推”架構(gòu),更多描述了客戶(hù)端處理長(zhǎng)連接的技術(shù)。對(duì)于一個(gè)實(shí)際的應(yīng)用而言,系統(tǒng)的穩(wěn)定性和性能是非常重要的。將 http 長(zhǎng)連接用于實(shí)際應(yīng)用,很多細(xì)節(jié)需要考慮。 不要在同一客戶(hù)端同時(shí)使用超過(guò)兩個(gè)的 http 長(zhǎng)連接 我們使用 ie 下載文件時(shí)會(huì)有這樣的體驗(yàn),從同一個(gè) web 服務(wù)器下載文件,最多只能有兩個(gè)文件同時(shí)被下載。第三個(gè)文件的下載會(huì)被阻塞,直到前面下載的文件下載完畢。這是因?yàn)?http 1.1 規(guī)范中規(guī)定,客戶(hù)端不應(yīng)該與服務(wù)器端建立超過(guò)兩個(gè)的 http 連接, 新的連接會(huì)被阻塞。而 ie 在實(shí)現(xiàn)中嚴(yán)格遵守了這種規(guī)定。 http 1.1 對(duì)兩個(gè)長(zhǎng)連接的限制,會(huì)對(duì)使用了長(zhǎng)連接的 web 應(yīng)用帶來(lái)如下現(xiàn)象:在客戶(hù)端如果打開(kāi)超過(guò)兩個(gè)的 ie 窗口去訪(fǎng)問(wèn)同一個(gè)使用了長(zhǎng)連接的 web 服務(wù)器,第三個(gè) ie 窗口的 http 請(qǐng)求被前兩個(gè)窗口的長(zhǎng)連接阻塞。 所以在開(kāi)發(fā)長(zhǎng)連接的應(yīng)用時(shí), 必須注意在使用了多個(gè) frame 的頁(yè)面中,不要為每個(gè) frame 的頁(yè)面都建立一個(gè) http 長(zhǎng)連接,這樣會(huì)阻塞其它的 http 請(qǐng)求,在設(shè)計(jì)上考慮讓多個(gè) frame 的更新共用一個(gè)長(zhǎng)連接。 服務(wù)器端的性能和可擴(kuò)展性 一般 web 服務(wù)器會(huì)為每個(gè)連接創(chuàng)建一個(gè)線(xiàn)程,如果在大型的商業(yè)應(yīng)用中使用 comet,服務(wù)器端需要維護(hù)大量并發(fā)的長(zhǎng)連接。在這種應(yīng)用背景下,服務(wù)器端需要考慮負(fù)載均衡和集群技術(shù);或是在服務(wù)器端為長(zhǎng)連接作一些改進(jìn)。 應(yīng)用和技術(shù)的發(fā)展總是帶來(lái)新的需求,從而推動(dòng)新技術(shù)的發(fā)展。http 1.1 與 1.0 規(guī)范有一個(gè)很大的不同:1.0 規(guī)范下服務(wù)器在處理完每個(gè) get/post 請(qǐng)求后會(huì)關(guān)閉套接口連接; 而 1.1 規(guī)范下服務(wù)器會(huì)保持這個(gè)連接,在處理兩個(gè)請(qǐng)求的間隔時(shí)間里,這個(gè)連接處于空閑狀態(tài)。 java 1.4 引入了支持異步 io 的 java.nio 包。當(dāng)連接處于空閑時(shí),為這個(gè)連接分配的線(xiàn)程資源會(huì)返還到線(xiàn)程池,可以供新的連接使用;當(dāng)原來(lái)處于空閑的連接的客戶(hù)發(fā)出新的請(qǐng)求,會(huì)從線(xiàn)程池里分配一個(gè)線(xiàn)程資源處理這個(gè)請(qǐng)求。 這種技術(shù)在連接處于空閑的機(jī)率較高、并發(fā)連接數(shù)目很多的場(chǎng)景下對(duì)于降低服務(wù)器的資源負(fù)載非常有效。 但是 ajax 的應(yīng)用使請(qǐng)求的出現(xiàn)變得頻繁,而 comet 則會(huì)長(zhǎng)時(shí)間占用一個(gè)連接,上述的服務(wù)器模型在新的應(yīng)用背景下會(huì)變得非常低效,線(xiàn)程池里有限的線(xiàn)程數(shù)甚至可能會(huì)阻塞新的連接。jetty 6 web 服務(wù)器針對(duì) ajax、comet 應(yīng)用的特點(diǎn)進(jìn)行了很多創(chuàng)新的改進(jìn),請(qǐng)參考文章“ajax,comet and jetty”(請(qǐng)參見(jiàn) 參考資源)。 控制信息與數(shù)據(jù)信息使用不同的 http 連接 使用長(zhǎng)連接時(shí),存在一個(gè)很常見(jiàn)的場(chǎng)景:客戶(hù)端網(wǎng)頁(yè)需要關(guān)閉,而服務(wù)器端還處在讀取數(shù)據(jù)的堵塞狀態(tài),客戶(hù)端需要及時(shí)通知服務(wù)器端關(guān)閉數(shù)據(jù)連接。服務(wù)器在收到關(guān)閉請(qǐng)求后首先要從讀取數(shù)據(jù)的阻塞狀態(tài)喚醒,然后釋放為這個(gè)客戶(hù)端分配的資源,再關(guān)閉連接。 所以在設(shè)計(jì)上,我們需要使客戶(hù)端的控制請(qǐng)求和數(shù)據(jù)請(qǐng)求使用不同的 http 連接,才能使控制請(qǐng)求不會(huì)被阻塞。 在實(shí)現(xiàn)上,如果是基于 iframe 流方式的長(zhǎng)連接,客戶(hù)端頁(yè)面需要使用兩個(gè) iframe,一個(gè)是控制幀,用于往服務(wù)器端發(fā)送控制請(qǐng)求,控制請(qǐng)求能很快收到響應(yīng),不會(huì)被堵塞;一個(gè)是顯示幀,用于往服務(wù)器端發(fā)送長(zhǎng)連接請(qǐng)求。如果是基于 ajax 的長(zhǎng)輪詢(xún)方式,客戶(hù)端可以異步地發(fā)出一個(gè) xmlhttprequest 請(qǐng)求,通知服務(wù)器端關(guān)閉數(shù)據(jù)連接。 在客戶(hù)和服務(wù)器之間保持“心跳”信息 在瀏覽器與服務(wù)器之間維持一個(gè)長(zhǎng)連接會(huì)為通信帶來(lái)一些不確定性:因?yàn)閿?shù)據(jù)傳輸是隨機(jī)的,客戶(hù)端不知道何時(shí)服務(wù)器才有數(shù)據(jù)傳送。服務(wù)器端需要確保當(dāng)客戶(hù)端不再工作時(shí),釋放為這個(gè)客戶(hù)端分配的資源,防止內(nèi)存泄漏。因此需要一種機(jī)制使雙方知道大家都在正常運(yùn)行。在實(shí)現(xiàn)上: 服務(wù)器端在阻塞讀時(shí)會(huì)設(shè)置一個(gè)時(shí)限,超時(shí)后阻塞讀調(diào)用會(huì)返回,同時(shí)發(fā)給客戶(hù)端沒(méi)有新數(shù)據(jù)到達(dá)的心跳信息。此時(shí)如果客戶(hù)端已經(jīng)關(guān)閉,服務(wù)器往通道寫(xiě)數(shù)據(jù)會(huì)出現(xiàn)異常,服務(wù)器端就會(huì)及時(shí)釋放為這個(gè)客戶(hù)端分配的資源。 pushlet 是一個(gè)開(kāi)源的 comet 框架,在設(shè)計(jì)上有很多值得借鑒的地方,對(duì)于開(kāi)發(fā)輕量級(jí)的 comet 應(yīng)用很有參考價(jià)值。 觀察者模型 pushlet 使用了觀察者模型:客戶(hù)端發(fā)送請(qǐng)求,訂閱感興趣的事件;服務(wù)器端為每個(gè)客戶(hù)端分配一個(gè)會(huì)話(huà) id 作為標(biāo)記,事件源會(huì)把新產(chǎn)生的事件以多播的方式發(fā)送到訂閱者的事件隊(duì)列里。 客戶(hù)端 javascript 庫(kù) pushlet 提供了基于 ajax 的 javascript 庫(kù)文件用于實(shí)現(xiàn)長(zhǎng)輪詢(xún)方式的“服務(wù)器推”;還提供了基于 iframe 的 javascript 庫(kù)文件用于實(shí)現(xiàn)流方式的“服務(wù)器推”。 javascript 庫(kù)做了很多封裝工作: 定義客戶(hù)端的通信狀態(tài):state_error、state_abort、state_null、state_ready、state_joined、state_listening; 客戶(hù)端與服務(wù)器端通信信息格式 pushlet 定義了一套客戶(hù)與服務(wù)器通信的信息格式,使用 xml 格式。定義了客戶(hù)端發(fā)送請(qǐng)求的類(lèi)型:join、leave、subscribe、unsubscribe、listen、refresh;以及響應(yīng)的事件類(lèi)型:data、join_ack、listen_ack、refresh、heartbeat、error、abort、subscribe_ack、unsubscribe_ack。 服務(wù)器端事件隊(duì)列管理 pushlet 在服務(wù)器端使用 java servlet 實(shí)現(xiàn),其數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)框架仍可適用于 php、c 編寫(xiě)的后臺(tái)客戶(hù)端。 pushlet 支持客戶(hù)端自己選擇使用流、拉(長(zhǎng)輪詢(xún))、輪詢(xún)方式。服務(wù)器端根據(jù)客戶(hù)選擇的方式在讀取事件隊(duì)列(fetchevents)時(shí)進(jìn)行不同的處理?!拜喸?xún)”模式下 fetchevents() 會(huì)馬上返回?!绷鳌昂汀崩澳J绞褂米枞姆绞阶x事件,如果超時(shí),會(huì)發(fā)給客戶(hù)端發(fā)送一個(gè)沒(méi)有新信息收到的“heartbeat“事件,如果是“拉”模式,會(huì)把“heartbeat”與“refresh”事件一起傳給客戶(hù)端,通知客戶(hù)端重新發(fā)出請(qǐng)求、建立連接。 客戶(hù)服務(wù)器之間的會(huì)話(huà)管理 服務(wù)端在客戶(hù)端發(fā)送 join 請(qǐng)求時(shí),會(huì)為客戶(hù)端分配一個(gè)會(huì)話(huà) id, 并傳給客戶(hù)端,然后客戶(hù)端就通過(guò)此會(huì)話(huà) id 標(biāo)明身份發(fā)出 subscribe 和 listen 請(qǐng)求。服務(wù)器端會(huì)為每個(gè)會(huì)話(huà)維護(hù)一個(gè)訂閱的主題集合、事件隊(duì)列。 服務(wù)器端的事件源會(huì)把新產(chǎn)生的事件以多播的方式發(fā)送到每個(gè)會(huì)話(huà)(即訂閱者)的事件隊(duì)列里。 小結(jié) 本文介紹了如何在現(xiàn)有的技術(shù)基礎(chǔ)上選擇合適的方案開(kāi)發(fā)一個(gè)“服務(wù)器推”的應(yīng)用,最優(yōu)的方案還是取決于應(yīng)用需求的本身。相對(duì)于傳統(tǒng)的 web 應(yīng)用, 目前開(kāi)發(fā) comet 應(yīng)用還是具有一定的挑戰(zhàn)性。 “服務(wù)器推”存在廣泛的應(yīng)用需求,為了使 comet 模型適用于大規(guī)模的商業(yè)應(yīng)用,以及方便用戶(hù)構(gòu)建 comet 應(yīng)用,最近幾年,無(wú)論是服務(wù)器還是瀏覽器都出現(xiàn)了很多新技術(shù),同時(shí)也出現(xiàn)了很多開(kāi)源的 comet 框架、協(xié)議。需求推動(dòng)技術(shù)的發(fā)展,相信 comet 的應(yīng)用會(huì)變得和 ajax 一樣普及。 關(guān)于作者
周婷,軟件工程師,目前在 ibm 中國(guó)軟件開(kāi)發(fā)技術(shù)實(shí)驗(yàn)室從事刀片服務(wù)器管理固件的開(kāi)發(fā)工作。您可以通過(guò)
本文來(lái)自csdn博客,轉(zhuǎn)載請(qǐng)標(biāo)明出處: 該文章在 2023/12/17 23:58:04 編輯過(guò) |
關(guān)鍵字查詢(xún)
相關(guān)文章
正在查詢(xún)... |