科技就是發(fā)展。
而科技發(fā)展的另一面,就是對舊有生活的反叛。
如果給原始人打火機,原始人第一件事情就是扔掉打火石。
如果中國兩輪電動車企給布隆迪捐助電瓶車
,奧德彪們都會紛紛棄暗投明。
如果塞給2006年的宅男一塊裝滿外國視頻的硬盤,他或許會賣掉自己的外國雜志。
互聯(lián)網(wǎng)也是一樣,而且更加殘酷。
互聯(lián)網(wǎng)的更新迭代,不僅要摧毀產品,更要摧毀信息。
比如說,當大家開始用視頻網(wǎng)站看視頻了。DVD光碟就會成了被時代遺棄的廢品,許多狂野的導演也可能因此失去了自己的創(chuàng)意大舞臺。
當人們開始玩QQ了,聊天室就會被紛紛拋棄。
那么當現(xiàn)在,有人把佟大為笑稱為佟 Dark 為的時候。
沒人記得他曾經(jīng)也是個站在互聯(lián)網(wǎng)風口的小鮮肉,扮演在聊天室里談情說愛的網(wǎng)民“痞子蔡”。
無數(shù)的聊天室的聊天記錄,那些故事與網(wǎng)民們共有回憶的信息,都會消逝。
互聯(lián)網(wǎng)的發(fā)展就像一個吞噬一切的巨獸一樣,吞噬過去,邁向不可知的深淵。
不久前,一篇《中文互聯(lián)網(wǎng)正在加速崩塌》的文章刷屏社交媒體,里邊講了很多細思極恐的例子。
比如說,如果你搜索1998年到2005年之間的關于馬云的資料,只有一條結果。
明明90年代到00年代是互聯(lián)網(wǎng)蓬勃發(fā)展的黃金年代,可是你用先進的互聯(lián)網(wǎng)搜索引擎就是找不到相關消息。
這個事情不止發(fā)生在中國。
全世界都在面臨著信息消失的問題。
美國的皮尤研究中心做了一項調查,顯示2013~2023年間存在的網(wǎng)頁中,有1/4的網(wǎng)頁已經(jīng)無法訪問。
這還沒有統(tǒng)計更早的網(wǎng)站。
站長不干了、服務器不租了、合伙人鬧掰了、站長去世了……各種原因都有可能讓我們曾經(jīng)樂于瀏覽的頁面消失。
比如說,有個叫做RushB的專業(yè)CS攻略網(wǎng)站,就因為站長去世,一度陷入了停站風波,最后在網(wǎng)友的關注與幫助下得以解決。
甚至政治格局變化也會讓互聯(lián)網(wǎng)消息丟失。
比方說中國的域名是.cn,而南斯拉夫的域名是.yu,在南斯拉夫解體后,這個.yu 域名之下的網(wǎng)頁內容就全部消失了。
遙想00年代,老師教給我們的是,字寫在筆記本上,筆記本可能會丟,就跟寒假作業(yè)一樣。但放在互聯(lián)網(wǎng)上,可以幫你保存一輩子。
可現(xiàn)在看來,很難。
01 黑暗時代來臨
2005年,20歲的精神小伙亞歷克斯·圖想到了一個超越時代的創(chuàng)意。
他建立了“百萬美元主頁”網(wǎng)站,里邊有100萬個像素可供購買,每個像素1美元起拍。買了有什么用?當然是承襲互聯(lián)網(wǎng)商業(yè)的老祖宗:打廣告。
不到一年,100萬個像素廣告位銷售一空,最后一個像素更是拍賣到38100美元的天價。
精神小伙用50歐元的域名成本換來百萬富翁的身份,可謂以小搏大的奇跡。
這個創(chuàng)意影響了后來Reddit的絕活“像素大戰(zhàn)”
如今再去訪問“百萬美元主頁”,其中至少有40%的超鏈接已經(jīng)無法訪問或被重新定向。
這塊互聯(lián)網(wǎng)早期的活化石,難逃“失憶”的命運。
從曾經(jīng)的旅游勝地,變成了如今的互聯(lián)網(wǎng)墓地。
當原始網(wǎng)頁不可訪問,我們還能通過搜索引擎的緩存服務窺見它們的樣貌。
然而像是百度快照、Google Cached這類緩存服務,都在近幾年陸續(xù)關閉。
類似“百萬美元主頁”的事件,還在不斷發(fā)生。
皮尤研究中心 2024 年 5 月的報告提到,2013 年的網(wǎng)絡內容里,有 38% 已經(jīng)無法訪問。
但這只是個數(shù)據(jù),如果細化到微觀視角。
那就是榕樹下、千千靜聽、快播這類承載了人類精神食量的網(wǎng)站,不是倒閉就是關閉。
校內網(wǎng)、開心網(wǎng)這類化石級社交網(wǎng)站早已消失,偷菜和搶車位永遠停留在一代人的青春回憶里。
有許多網(wǎng)民從快播中擴展了國際視野,獲取了文娛的養(yǎng)料。
聽到說快播倒閉,都說欠他一個VIP。
但殊不知,這不是個體的問題,這是互聯(lián)網(wǎng)時代的積弊。
互聯(lián)網(wǎng)的“阿爾茨海默病”已經(jīng)是全世界都在面臨的問題,而且失憶的速度可能比我們想象的更快。
1997 年,國際圖書館協(xié)會聯(lián)合會上,有人提出一個術語叫“數(shù)字黑暗時代”,擔心當前的主流存儲介質可能在未來無法讀取,其中保存的資料就此湮滅在歷史中。
2015 年,設計了 TCP/IP 協(xié)議的互聯(lián)網(wǎng)之父溫特·瑟夫也對數(shù)字黑暗時代深感擔憂。
這可不是杞人憂天,打孔帶、軟盤、磁帶……曾經(jīng)流行的存儲介質如今已成為“硬核玩家”的專屬玩具。
存儲介質的變化,帶來舊存儲信息的流逝。
《賽博朋克2077》就在愚人節(jié)時候整了個活,把游戲放進97619張軟盤里,需要2個月時間才能安裝完
有網(wǎng)友找到了家里抽屜中的老軟盤,想要緬懷一下軟盤里的回憶,結果一打開,差點電腦中毒。
為什么互聯(lián)網(wǎng)的信息那么容易丟失,究竟是不是人類文明發(fā)展的哪個環(huán)節(jié)出現(xiàn)了關鍵性bug?
出于對此的好奇,我必須深入對互聯(lián)網(wǎng)歷史探究一番。
02 從四個節(jié)點到萬物互聯(lián)
為什么今天的互聯(lián)網(wǎng)正在加速崩塌?
因為我們的內容生產和消費模式產生了天翻地覆的變化。
互聯(lián)網(wǎng)上最早出現(xiàn)信息崩潰的例子,發(fā)生在1969年。
1969年,L和O這兩個字母從加州大學洛杉磯分校的電腦里出發(fā),穿行566公里抵達斯坦福研究所的電腦里。
這兩個字母就是人類用網(wǎng)絡傳輸?shù)牡谝粭l信息,背后有什么含義?其實,當時操作電腦的查理·克萊恩本想輸入“LOGIN”(登錄),沒想到只輸入了兩個字母,系統(tǒng)就崩潰了。
對互聯(lián)網(wǎng)第一條信息的文字記載,右側的CSK就是查理·克萊恩的名字縮寫
這個崩潰的系統(tǒng)名為“阿帕網(wǎng)”,是人類歷史上最早的計算機網(wǎng)絡之一。最早的阿帕網(wǎng)只有4個節(jié)點,隨著后來節(jié)點越來越多,問題也越來越多。
最明顯的是,阿帕網(wǎng)采用的NCP協(xié)議沒有給網(wǎng)絡里的每臺設備指定唯一地址。
當設備太多時就容易找不到目標,信息丟失、運行效率低都是常事。你看,“失憶”從網(wǎng)絡誕生開始就是頑疾。
再加上當時的電腦種類龐雜,軟硬件標準互不兼容,很難接入阿帕網(wǎng)。
想實現(xiàn)真正的萬物互聯(lián),急需搞一個統(tǒng)一的通信標準。
于是1974年,一篇名為《A Protocol for Packet Network Intercommunication》的論文打開了新局面,里邊設計了一種全新的TCP/IP通信協(xié)議,捏住NCP的痛點狠狠改進。
每臺設備都有唯一的地址,通過反復握手確認,保障數(shù)據(jù)傳輸時不丟失,偶爾丟包也能通過校驗、重傳等方法糾錯。
憑著這些碾壓級創(chuàng)新,TCP/IP定義了網(wǎng)絡之間傳輸信息的方法,論文的兩位作者文頓·瑟夫和羅伯特·卡恩在日后共享“互聯(lián)網(wǎng)之父”的頭銜。
1990年底,英國計算機學家蒂姆·伯納斯-李實現(xiàn)了第一次超文本傳輸協(xié)議(HTTP)的通訊。
此后,無數(shù)超鏈接交織在一起,形成一個存在于賽博空間里的萬維網(wǎng)。
World Wide Web這三個單詞也是世界上第一個網(wǎng)頁瀏覽器的名字,為了避免混淆“萬維網(wǎng)”和“萬維網(wǎng)瀏覽器”,瀏覽器后來更名成Nexus。
這也就是我們熟悉的多彩的互聯(lián)網(wǎng)雛形。
但web1.0時代有一個巨大的問題,信息幾乎是單向流動的,你打開一個大型網(wǎng)站,獲得信息,關閉網(wǎng)站,結束了。
你要是想要點贊、轉發(fā)、一鍵三連,那不太可能。
所以,為了解決大家的互動問題,互聯(lián)網(wǎng)加速進入2.0時代,數(shù)據(jù)存儲的問題卻開始顯現(xiàn)了。
為web2.0做出核心突破之一的是谷歌。2003 年后,谷歌連續(xù)發(fā)了三篇研究,這三篇研究都成了谷歌玩轉大數(shù)據(jù)的基礎。
先是Google File System,這種分布式文件系統(tǒng)把數(shù)據(jù)存儲在大量廉價硬盤上,通過多個副本、冗余和故障檢測機制保護數(shù)據(jù)安全,直接降低了數(shù)據(jù)的存儲成本。
也就是說,你的信息不是存在“互聯(lián)網(wǎng)”上,而是藉由“互聯(lián)網(wǎng)”,存在硬盤中。
然后是MapReduce,把輸入的數(shù)據(jù)打散成多個小塊,多個任務并行處理,極大提高了數(shù)據(jù)的處理效率。
最后是BigTable數(shù)據(jù)存儲系統(tǒng),用來管理大規(guī)模數(shù)據(jù),吞吐量高,延遲低。
這三板斧的核心就一個詞:降本增效。
沒有人想要被信息淹沒,那最好的方式就是把信息壓縮、打散,用最廉價的方式存儲起來,畢竟,用戶不是隨時隨地都需要所有信息的。
就好像之前有人發(fā)現(xiàn)微信頭像越來越褪色,就有可能是微信為了信息存儲,而壓縮的畫質。
但光壓縮還不夠,存儲成本對于內容行業(yè)來說,Web 2.0讓普通人也能享有創(chuàng)作內容的資格,但背后卻是更大的“失憶”風險。
曾經(jīng)的個人網(wǎng)站必須在文章里加入多媒體素材,才能順應時代潮流。
可翻倍的存儲成本怎么辦?
所以,最早遇到存儲困境的受害者們,就是那些堅持自己建網(wǎng)站寫博客的人,現(xiàn)在可能比揚子鱷還要瀕危。
網(wǎng)絡提供的解決方式是,你們小散戶就別存儲數(shù)據(jù)了,我們提供一個內容平臺,把數(shù)據(jù)存儲在我們這兒,我們再優(yōu)化管理,就可以降低存儲成本了。
就好像是大家每個人都做一道西紅柿炒蛋,需要用的、洗的盤子就很多。但要是有一個中央廚房,用一口大鍋炒菜,就可以降低做菜損耗。
于是無數(shù)心懷夢想的創(chuàng)作者們一股腦涌進平臺里一片繁榮之下,暗流洶涌。
“失憶”的第一個風險出現(xiàn)了:中心化的平臺掌握了數(shù)據(jù)的生殺大權。
只要平臺腦子一抽,或者某個網(wǎng)站倒閉,海量內容灰飛煙滅。
比如說天涯。
天涯社區(qū)曾經(jīng)是無數(shù)人的精神烏托邦,但2023年4月人們發(fā)現(xiàn),天涯社區(qū)已經(jīng)無法訪問,今年又傳出天涯社區(qū)破產的消息。
從天涯“逃亡”的人群規(guī)模浩浩蕩蕩,不亞于2023年年初《魔獸世界》停服時候的“賽博移民”。
除此之外,我們知道要去搜索內容,就要用搜索引擎搜索。
這看起來是一句廢話。
但其實潛藏著第二個風險:搜索去中心化。
當人們越來越沉迷于視頻、音頻這類“非文本”的內容形式時。
就意味著一個結果,你在搜索引擎很難搜索到你想要的視頻片段,除非有人對此做出標注。
畢竟網(wǎng)絡搜索是靠爬蟲抓取文本信息,如今有價值的內容都被塞進視頻、音頻里,就像在圖書館外邊蓋上一堵柏林墻,外邊的爬蟲進不去,里邊的內容出不來。
當人們很難搜索到關鍵信息,它跟丟失了有什么區(qū)別?
蓋上最后一層棺材板的是第三個風險:信息孤島化。
如今幾乎每個平臺都在圈地自萌,不提供 PC 網(wǎng)頁端,不下載APP不給看內容,甚至禁止網(wǎng)絡爬蟲收集信息。比如就在幾天前(5月27日),有網(wǎng)友發(fā)現(xiàn)知乎開始禁止谷歌、必應爬取數(shù)據(jù)。
就說個看起來十分簡單的,你能把抖音的視頻直接轉發(fā)到微信視頻號嗎?
從搜索引擎里“隱身”的網(wǎng)站,化身成“深網(wǎng)”的一部分,成為只存在于手機里的“小而美”。
當孤島化成為常態(tài),不想被大數(shù)據(jù)推送和繭房效應圍困的人,必須熟知幾十種 app 的搜索規(guī)則,才能撥開云霧找到有用的信息。
如今我們身處Web 2.0的末期,體驗到的一切都與互聯(lián)網(wǎng)的“開放精神”背道而馳,我們被困在一張張網(wǎng)里,不再互聯(lián)。
那么,難道就沒有解決辦法,存儲這些正在消失的數(shù)據(jù)嗎?
有的,建立檔案館。
03 信息存檔異聞錄
你想要文件不丟,就把文件存儲起來。
這看起來又是一句廢話。
但實際上存在著兩個問題,一、存儲在哪個能永久地維護的地方,二、什么存儲方式不會丟失?
比方說埃及法老,想到的永恒存儲方法,就是當自己死了,把自己尸體里的內臟挖出來,然后往里面填上香料,接著在墓地里安上各種機關,最后蓋一個大金字塔上去。
類似的還有1868 年,英軍入侵緬甸,緬甸的文化很可能毀于一旦。緬甸君主為了保存《巴利文大藏經(jīng)》,讓人將其刻在石碑上,安置在新修建的圣祠里。圣祠本身就是一部經(jīng)文,跟《三體》里“把字刻在石頭上”如出一轍。
信息的瀕臨滅絕與絕境重生,伴隨著人類的整個歷史。
就在提出數(shù)字黑暗時代概念的前一年,“互聯(lián)網(wǎng)檔案館”成立,里邊保存了大量的書籍、電影、音樂等等內容。
甚至包括東西半球最強法務部名下的內容
這里不僅保存媒體資料,還把很多實物給虛擬化了。比如這個計算器館,里邊的計算器真的能按鍵(點擊鼠標)操作。
當然,它最主要的功能是使用“網(wǎng)站時光機”保存網(wǎng)頁,前提是用戶需要手動提交希望保存的網(wǎng)址。想保存日新月異的海量互聯(lián)網(wǎng)內容?只能是杯水車薪。
一個習慣了白嫖的互聯(lián)網(wǎng),用戶看完視頻別說一鍵三連了,可能點贊都不會給,你怎么要求他們自發(fā)去上傳存儲網(wǎng)站,很難。
所以,最好的方式就是發(fā)動國家力量。
很多國家機構也沖在對抗數(shù)字黑暗時代的前線。
我國的國家圖書館在2003年啟動“互聯(lián)網(wǎng)信息戰(zhàn)略保存項目”,首個項目是存檔新浪微博,于是在2019年,經(jīng)常逛微博的網(wǎng)友紛紛“留言上墻”,榮獲青史留名的資格。
哇塞,我的微博存檔啦
學術機構和科研人員同樣存檔網(wǎng)絡資料,如“北京大學李曉明”保存了2002 ~2016年的中國互聯(lián)網(wǎng)網(wǎng)頁,數(shù)據(jù)量大約有 200 TB。
最近AI大模型爆火,好多人找李曉明拷貝這組數(shù)據(jù),這著實為中國的AI模型訓練助力不少。
在對抗數(shù)字黑暗時代的過程里,還有一群民間愛好者正在作出努力。
2023年初,任天堂宣布要關閉WiiU和3DS的網(wǎng)絡商城,1000多款沒有發(fā)行過實體卡帶的純數(shù)字版游戲即將陪葬。YouTube頻道“The Completionist”站了出來,花費2萬多美元把這些游戲都買下,數(shù)據(jù)總量大概有1.5TB,全部捐贈給“電子游戲歷史基金會”。
Archive Team由一群國外愛好者組成,在Reddit, Imgur, DeviantArt更改服務條款、刪除大量內容之前,他們及時把寶貴的數(shù)據(jù)從“焚書坑儒”里拯救出來。
Save the Web Project由一群中國愛好者組成,存檔過“半次元”“抽屜”等眾多網(wǎng)站。如果有人把空的硬盤寄給他們,就能收獲一塊裝滿“消失的某個網(wǎng)站”的禮物。
Save the Web Project的Logo
他們也遇到過無力的時刻?!霸娚罹W(wǎng)”截止到2023年關站時已有23年的歷史,要知道中國互聯(lián)網(wǎng)起步于1994年,到現(xiàn)在也只有30年的歷史,所以這個網(wǎng)站有“中文互聯(lián)網(wǎng)活化石”的美譽。
但當Save the Web Project得知關站消息的時候,“活化石”的服務器已經(jīng)關閉,錯過了搶救數(shù)據(jù)的最佳時機。
這個小組的成員經(jīng)常求“哪里有便宜的服務器”“誰能送我們幾塊閑置的硬盤”,真的是為愛發(fā)電。
哪有什么英雄主義,只是一群心懷理想的人默默做著他們認為重要的事情。
但靠著這樣的組織、機構,就能對抗數(shù)字至暗時代了嗎?
04 每個人都要作出選擇
2008年,一位ID是Clash-Cash-Car的豆瓣網(wǎng)友開始活躍,他不知從什么地方找到一堆冷門音樂資料,在幾年里編寫了6000多個條目。直到2016年去世后,網(wǎng)友才得知他是一位普通的保安。
就像《大佛普拉斯》里的肚財,直到離世后,才有人發(fā)現(xiàn)他的內心豐富充沛,閃著炫目的光輝。
每個不起眼的普通人,可能都在不知不覺間對抗著數(shù)字黑暗時代,方法就藏在沖浪段子手都用過的包漿表情包里。
電子包漿當然沒法對抗數(shù)字黑暗時代?但背后的下載、轉發(fā)、上傳一條龍卻可以。
前邊說過,Web 2.0末期最麻煩的是信息孤島化,平臺之間各玩各的,分享個鏈接還要被迫轉換成不知所云的“&%…^$# 長按復制¥#”亂碼,簡直反人類。
現(xiàn)在的年輕人發(fā)揚電子包漿精神,截圖錄屏一鍵轉發(fā),誰跟你玩亂碼?
在B站看抖音,這何嘗不是一種NTR
信息孤島化,沒想到被電子包漿打破了。
《哈利·波特與火焰杯》 里,鄧不利多有一句名言:“黑暗與艱困的時代就要來臨,很快我們就會被迫面臨抉擇,選擇對的,還是方便的?!?br style="box-sizing: inherit;"/>當“數(shù)字黑暗時代”像達摩克利斯之劍一樣懸在頭頂時,也許我們都要做一些正確但艱難的事情。
還好,我們前方有很多先行者,而且每個你我他,都能在這條路上繼續(xù)前行。
來源網(wǎng)易號 酷玩實驗室 https://www.163.com/dy/article/J4GARJOA0511BCOA.html
該文章在 2024/6/14 8:32:38 編輯過