範文齋

如何優化MongoDB以及其它數據庫?

我們知道做數據庫最重要的還是做好優化,那麼優化這兩個看似簡單,但是要怎麼做纔好呢?下面小編就爲大家分享下優化MongoDB以及其它數據庫的方法吧。

如何優化MongoDB以及其它數據庫?

Jared Rosoff 在 Scale Out Camp 發表了一篇簡潔、有效、有趣和令人信服的《8 分鐘 MongoDB 教程》描述瞭如何進行 MongoDB 優化。

文中的方法不僅限於 MongoDB,還可應用到絕大多數數據庫,比如查詢優化、找出你的熱數據、調整文件系統、選擇正確的磁盤設備、分片。下面分別對 5 種策略進行說明:

查詢優化:用 B-tree 搜索的速度顯然比全表掃描來的快,所以你需要優化你的查詢語句。用 explain來分析你的查詢語句,如果返回的結果現實這個查詢用到了 cursor 那麼它會是一個全表掃描,也就是說它會非常慢。分析有多少條記錄會滿足查詢條件,以及查詢會執行多長時間。改進的方法就是爲其增加索引。不管你是有 1 臺還是有 100 臺服務器。

找出你的熱數據尺寸:在數據庫前面使用 Memcached 其實挺可笑的,因爲現在內存很便宜,你可以使用大量的內存來緩存數據庫內容,MongoDB 就是這樣乾的。熱數據 = 活躍記錄 + 使用過的索引。在內存中命中數據是非常快的,而從磁盤獲取數據就非常慢。假設你有上十億的用戶,但只有十萬用戶當前是活躍的,那麼你的熱數據尺寸就是十萬條。你需要規劃足夠的'內存來存放那十萬條熱數據,保證他們能夠從內存而不是磁盤裏讀取,別忘了索引也是需要佔用內存的。

調整文件系統:性能問題往往根源是在文件系統。比如 EXT3 已經過時了,請使用 EXT4、XFS 和其它高性能的文件系統。對於數據庫來說並不需要每次訪問都去更新文件,所以關掉文件的訪問時間跟蹤功能,不然會有很多不必要的磁盤寫操作。在 EXT3 文件系統預分配一個 2GB 大小的文件是非常耗時的,因爲它必須得在分配時完整初始化整個文件。

選擇正確的磁盤設備:尋道時間是需要關注的問題,因爲大多數時候磁盤的 IO 操作是隨機的。尋道時間取決於機械臂在磁盤上來回移動的速度,磁盤的平均尋道操作能力是每秒鐘能完成 200 次。高速磁盤之所以讀取數據更快,是因爲他們有更高的帶寬容量,除此之外他們的尋道時間並沒有區別。使用單個磁盤時,你可以獲得每秒 200 次尋道;而使用 RAID 0(跨多個磁盤),3 塊磁盤可以讓你獲得每秒 600 次的尋道速度;那麼使用 RAID 10(鏡像 + 跨越),6 塊磁盤甚至能讓你獲得每秒 1200 次尋道。所以要考慮用 RAID 來進行優化。如今的 SSD 存儲就更誇張了,一次尋道只要 0.1 毫秒,是機械磁盤的 50 倍,更適用於隨機的讀取操作。

分片:如果你的程序性能很差,索引又建的不正確,磁盤設備的速度也很慢,那麼單點的性能也就非常差了。改善這種情況的方法就是用分片來做橫向擴展,分片可以讓你把系統負責分散到由更多機器組成的高可用的 replica sets 集羣。數據將會按一定範圍被切分成很多的區塊,然後橫向擴展到上百臺服務器,上千次的寫操作在被拆分後每臺服務器只需要處理十來次操作。分片讓橫向擴展變得容易。