上海分布式存儲架構實戰(zhàn)

來源: 發(fā)布時間:2021-12-16

    分布式存儲的興起與互聯(lián)網的發(fā)展密不可分,互聯(lián)網公司由于其數(shù)據量大而資本積累少,而通常都使用大規(guī)模分布式存儲系統(tǒng)。與傳統(tǒng)的高duan服務器、高duan存儲器和高duan處理器不同的是,互聯(lián)網公司的分布式存儲系統(tǒng)由數(shù)量眾多的、低成本和高性價比的普通PC服務器通過網絡連接而成。其主要原因有以下三點(1)互聯(lián)網的業(yè)務發(fā)展很快,而且注意成本消耗,這就使得存儲系統(tǒng)不能依靠傳統(tǒng)的縱向擴展的方式,即先買小型機,不夠時再買中型機,甚至大型機?;ヂ?lián)網后端的分布式系統(tǒng)要求支持橫向擴展,即通過增加普通PC服務器來提高系統(tǒng)的整體處理能力。(2)普通PC服務器性價比高,故障率也高,需要在軟件層面實現(xiàn)自動容錯,保證數(shù)據的一致性。(3)另外,隨著服務器的不斷加入,需要能夠在軟件層面實現(xiàn)自動負載均衡,使得系統(tǒng)的處理能力得到線性擴展。 分布式存儲“避坑”指南。上海分布式存儲架構實戰(zhàn)

分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據庫和分布式緩存等,但其中架構無外乎于三種;以Ceph為代biao的架構是其典型的代biao。在該架構中與HDFS不同的地方在于該架構中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設備映射關系計算出來其寫入數(shù)據的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。以Ceph為代biao的架構是其典型的代biao。在該架構中與HDFS不同的地方在于該架構中沒有中心節(jié)點。客戶端是通過一個設備映射關系計算出來其寫入數(shù)據的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。 紹興什么是分布式存儲架構實戰(zhàn)分布式存儲的小知識,你值得擁有!

    分布式存儲系統(tǒng)具有如下特性:數(shù)據分為多個分片存儲在多臺服務節(jié)點上。每個分片有多個副本,存儲在不同的服務節(jié)點上。許多客戶端并發(fā)訪問系統(tǒng),執(zhí)行讀寫操作,每個讀寫操作在系統(tǒng)中需要花費不等的時間。除非下文中特別注明和討論,讀寫操作是原子的。與數(shù)據庫事務一致性的區(qū)別:數(shù)據庫事務的ACID的中也有一個一致性(consistency),但彼一致性非此一致性。ACID中的一致性是指,數(shù)據庫的事務的執(zhí)行,或者說事務觀察到的數(shù)據,總是要滿足某些全局的一致性約束條件,如性約束,外鍵約束等。這個概念和數(shù)據庫的數(shù)據是否多副本沒關系。而本文的一致性在多副本的語境下才有意義。所以,數(shù)據庫事務的一致性,是指數(shù)據項之間總是滿足某些約束條件,或者說整個數(shù)據庫在滿足約束條件的意義上是正確的。

    軟硬件解耦的分布式存儲在性能設計上存在兩大天然缺陷:標準服務器不具備機房突然斷電時保護內存數(shù)據的電池(BBU),所以只能用SSD卡/盤來做數(shù)據緩存。SSD的時延遠高于內存,導致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲時延無法和生產存儲媲美。單獨采購的分布式存儲軟件無法和第三方服務器的SSD盤緊密配合,從而無法像業(yè)界先進的全閃存存儲一樣實現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導致的生產應用時延波動。軟硬件一體的分布式存儲有機會克服如上兩大缺陷。我們看到業(yè)界先進的分布式存儲產品,采用了類似于全閃存存儲的電池保護(BBU)、系統(tǒng)級全局垃圾回收,達到了媲美傳統(tǒng)生產存儲的高并發(fā)壓力下的1ms穩(wěn)定時延,從而為分布式存儲進入企業(yè)生產應用提供了性能的SLA保障。 布式存儲系統(tǒng),采用Scale-out擴展架構,可實現(xiàn)超大集群規(guī)模的部署。

很多人可能對分布式存儲耳熟能詳,但是,大多數(shù)人對其概念或者知識點卻了解得都過于分散,看了很多卻“只見樹木,不見森林”,學了很多往往只能“知其然,卻不能知其所以然”。因此,有必要對分布式存儲的概念、問題和矛盾進行一下分析和解讀。實際上,如果可能,應該是盡量不使用分布式的,因為這會增加系統(tǒng)的復雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點也不夸張。 分布式存儲在數(shù)據治理過程中的優(yōu)勢。安徽分布式存儲架構實戰(zhàn)

分布式存儲在數(shù)據治理過程中的定位。上海分布式存儲架構實戰(zhàn)

為了保證分布式存儲系統(tǒng)的高可靠和高可用,數(shù)據在系統(tǒng)中一般存儲多個副本。當某個副本所在的存儲節(jié)點出現(xiàn)故障時,分布式存儲系統(tǒng)能夠自動將服務切換到其他的副本,從而實現(xiàn)自動容錯。分布式存儲系統(tǒng)通過復制協(xié)議將數(shù)據同步到多個存儲節(jié)點,并確保多個副本之間的數(shù)據一致性。客戶端將寫請求發(fā)送給主副本,主副本將寫請求復制到其他備副本,常見的做法是同步操作日志(CommitLog)。主副本首先將操作日志同步到備副本,備副本回放操作日志,完成后通知主副本。接著,主副本修改本機,等到所有的操作都完成后再通知客戶端寫成功。下圖中的復制協(xié)議要求主備同步成功才可以返回客戶端寫成功,這種協(xié)議稱為強同步協(xié)議。 上海分布式存儲架構實戰(zhàn)

江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿易型的公司。魏晉元興智能致力于為客戶提供良好的網絡安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制,一切以用戶需求為中心,深受廣大客戶的歡迎。公司從事數(shù)碼、電腦多年,有著創(chuàng)新的設計、強大的技術,還有一批**的專業(yè)化的隊伍,確保為客戶提供良好的產品及服務。魏晉元興智能立足于全國市場,依托強大的研發(fā)實力,融合前沿的技術理念,飛快響應客戶的變化需求。