三種東西永遠不要放到數(shù)據(jù)庫里
當(dāng)前位置:點晴教程→知識管理交流
→『 技術(shù)文檔交流 』
我已經(jīng)在很多演講里說過,改進你的系統(tǒng)的最好的方法是先避免做“蠢事”。我并不是說你或你開發(fā)的東西“蠢”,只是有些決定很容易被人們忽略掉其暗含 的牽連,認識不到這樣做對系統(tǒng)維護尤其是系統(tǒng)升級帶來多大的麻煩。作為一個顧問,像這樣的事情我到處都能見到,我還從來沒有見過做出這樣的決定的人有過好 的結(jié)果的。
圖片,文件,二進制數(shù)據(jù) 既然數(shù)據(jù)庫支持BLOB類型的數(shù)據(jù),把文件塞進BLOB字段里一定沒有錯了!?錯,不是這樣的!別的先不提,在很多數(shù)據(jù)庫語言里,處理大字段都不是很容易。 把文件存放在數(shù)據(jù)庫里有很多問題: 對數(shù)據(jù)庫的讀/寫的速度永遠都趕不上文件系統(tǒng)處理的速度 數(shù)據(jù)庫備份變的巨大,越來越耗時間 對文件的訪問需要穿越你的應(yīng)用層和數(shù)據(jù)庫層 這后兩個是真正的殺手。把圖片縮略圖存到數(shù)據(jù)庫里?很好,那你就不能使用nginx或其它類型的輕量級服務(wù)器來處理它們了。 給自己行個方便吧,在數(shù)據(jù)庫里只簡單的存放一個磁盤上你的文件的相對路徑,或者使用S3或CDN之類的服務(wù)。 短生命期數(shù)據(jù) 使用情況統(tǒng)計數(shù)據(jù),測量數(shù)據(jù),GPS定位數(shù)據(jù),session數(shù)據(jù),任何只是短時間內(nèi)對你有用,或經(jīng)常變化的數(shù)據(jù)。如果你發(fā)現(xiàn)自己正在使用定時任務(wù)從某個表里刪除有效期只有一小時,一天或數(shù)周的數(shù)據(jù),那說明你沒有找對正確的做事情的方法。使用redis, statsd/graphite, Riak,它們都是干這種事情更合適的工具。這建議也適用于對于收集那些短生命期的數(shù)據(jù)。 當(dāng)然,用挖土機在后花園里種土豆也是可行的,但相比起從儲物間里拿出一把鏟子,你預(yù)約一臺挖土機、等它趕到你的園子里挖坑,這顯然更慢。你要選擇合適的工具來處理手頭上的事。 日志文件 把日志數(shù)據(jù)存放到數(shù)據(jù)庫里,表面上看起來似乎不錯,而且“將來也許我需要對這些數(shù)據(jù)進行復(fù)雜的查詢”,這樣的話很得人心。這樣做并不是一個特別差的做法,但如果你把日志數(shù)據(jù)和你的產(chǎn)品數(shù)據(jù)存放到一個數(shù)據(jù)庫里就非常不好了。 也許你的日志記錄做的很保守,每次web請求只產(chǎn)生一條日志。對于整個網(wǎng)站的每個事件來說,這仍然會產(chǎn)生大量的數(shù)據(jù)庫插入操作,爭奪你用戶需要的數(shù)據(jù)庫資源。如果你的日志級別設(shè)置為verbose或debug,那等著看你的數(shù)據(jù)庫著火吧。 你應(yīng)該使用一些比如Splunk Loggly或純文本文件來存放你的日志數(shù)據(jù)。這樣去查看它們也許會不方便,但這樣的時候不多,甚至有時候你需要寫出一些代碼來分析出你想要的答案,但總的來說是值得的。 可是稍等一下,你是那片不一樣的雪花,你遇到的問題會如此的不同,所以,如果你把上面提到的三種東西中的某一種放到了數(shù)據(jù)庫里也不會有問題。不,你錯了,不,你不特殊。相信我。 該文章在 2012/5/16 12:01:12 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |