浙江大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理解析

來源: 發(fā)布時(shí)間:2021-12-05

分布式存儲(chǔ)的種類和比較:分布式存儲(chǔ)包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲(chǔ)和分布式對(duì)象存儲(chǔ)外,還包括分布式數(shù)據(jù)庫(kù)和分布式緩存等,但其中架構(gòu)無(wú)外乎于三種;以HDFS(HadoopDistributionFileSystem)為代biao的架構(gòu)是典型的代biao。在這種架構(gòu)中,一部分節(jié)點(diǎn)NameNode是存放管理數(shù)據(jù)(元數(shù)據(jù)),另一部分節(jié)點(diǎn)DataNode存放業(yè)務(wù)數(shù)據(jù),這種類型的服務(wù)器負(fù)責(zé)管理具體數(shù)據(jù)。這種架構(gòu)就像公司的層次組織架構(gòu),namenode就如同老板,只管理下屬的經(jīng)理(datanode),而下屬的經(jīng)理,而經(jīng)理們來管理節(jié)點(diǎn)下本地盤上的數(shù)據(jù)。 分布式存儲(chǔ)“避坑”指南。浙江大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理解析

分布式存儲(chǔ)系統(tǒng)需要使用多臺(tái)服務(wù)器共同存儲(chǔ)數(shù)據(jù),而隨著服務(wù)器數(shù)量的增加,服務(wù)器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務(wù)器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個(gè)數(shù)據(jù)分成多份存儲(chǔ)在不同的服務(wù)器中。但是由于故障和并行存儲(chǔ)等情況的存在,同一個(gè)數(shù)據(jù)的多個(gè)副本之間可能存在不一致的情況。這里稱保證多個(gè)副本的數(shù)據(jù)完全一致的性質(zhì)為一致性。分布式存儲(chǔ)系統(tǒng)需要多臺(tái)服務(wù)器同時(shí)工作。當(dāng)服務(wù)器數(shù)量增多時(shí),其中的一些服務(wù)器出現(xiàn)故障是在所難免的。我們希望這樣的情況不會(huì)對(duì)整個(gè)系統(tǒng)造成太大的影響。在系統(tǒng)中的一部分節(jié)點(diǎn)出現(xiàn)故障之后,系統(tǒng)的整體不影響客服端的讀/寫請(qǐng)求稱為可用性。 南京視頻分布式存儲(chǔ)的一般架構(gòu)五大主流分布式存儲(chǔ)技術(shù)對(duì)比分析,你 pick 哪一種?

分布式存儲(chǔ)包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲(chǔ)和分布式對(duì)象存儲(chǔ)外,還包括分布式數(shù)據(jù)庫(kù)和分布式緩存等,但其中架構(gòu)無(wú)外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。

開源分布式存儲(chǔ)軟件的出現(xiàn),一定程度上降低了存儲(chǔ)的門檻,小公司可快速包裝出存儲(chǔ)產(chǎn)品,帶動(dòng)服務(wù)器銷售。但產(chǎn)品同質(zhì)化問題是所有開源不得不面臨的問題,由于架構(gòu)限制,很難在不動(dòng)架構(gòu)的情況下,真正做出差異化競(jìng)爭(zhēng)力。互聯(lián)網(wǎng)類公司、部分科研機(jī)構(gòu),以及有技術(shù)情結(jié)和充足資金投入的客戶可能選擇開源,而對(duì)于金融、電信運(yùn)營(yíng)商、大企業(yè)商用HPC、有關(guān)部門等對(duì)可靠性、性能、安全合規(guī)有要求的企業(yè),開源從來不是第yi選擇,因?yàn)閿?shù)據(jù)太重要了。(聽說,國(guó)內(nèi)某知ming銀行曾經(jīng)投入500人基于開源軟件搭建分布式存儲(chǔ),投入巨大且無(wú)法達(dá)銀行業(yè)務(wù)對(duì)性能、可靠性、易運(yùn)維訴求,終于2年后放棄。) 布式存儲(chǔ)系統(tǒng),采用Scale-out擴(kuò)展架構(gòu),可實(shí)現(xiàn)超大集群規(guī)模的部署。

分布式存儲(chǔ)是一種數(shù)據(jù)存儲(chǔ)技術(shù),通過網(wǎng)絡(luò)使用企業(yè)中的每臺(tái)機(jī)器上的磁盤空間,并將這些分散的存儲(chǔ)資源構(gòu)成一個(gè)虛擬的存儲(chǔ)設(shè)備,數(shù)據(jù)分散的存儲(chǔ)在企業(yè)的各個(gè)角落。分布式存儲(chǔ)系統(tǒng),是將數(shù)據(jù)分散存儲(chǔ)在多個(gè)du立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用集中的存儲(chǔ)服務(wù)器存放所有數(shù)據(jù),存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點(diǎn),不能滿足大規(guī)模存儲(chǔ)應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺(tái)存儲(chǔ)服務(wù)器分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。 分布式存儲(chǔ)系統(tǒng)需要使用多臺(tái)服務(wù)器共同存儲(chǔ)數(shù)據(jù),隨著服務(wù)器數(shù)量的增加,出現(xiàn)故障的概率也在不斷增加。鎮(zhèn)江四大開源分布式存儲(chǔ)設(shè)備

如何保證分布式存儲(chǔ)系統(tǒng)的高性能與高可用性呢?浙江大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理解析

很多人可能從來沒有考慮過這個(gè)問題,為什么需要分布式存儲(chǔ)?實(shí)際上,使用分布式存儲(chǔ)是“被迫”的,因?yàn)殡S著互聯(lián)網(wǎng)的飛速發(fā)展、應(yīng)用越來越豐富、用戶數(shù)量越來越多、數(shù)據(jù)也成幾何級(jí)增長(zhǎng),海量數(shù)據(jù)的存儲(chǔ)給本地存儲(chǔ)帶了巨大壓力,存儲(chǔ)系統(tǒng)已經(jīng)不堪重負(fù),處于崩潰的邊緣,因此,必須通過其他手段分散存儲(chǔ)系統(tǒng)壓力,分布式存儲(chǔ)和分布式文件系統(tǒng)應(yīng)運(yùn)而生。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會(huì)增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無(wú)法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 浙江大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理解析

江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿(mào)易型公司。公司自成立以來,以質(zhì)量為發(fā)展,讓匠心彌散在每個(gè)細(xì)節(jié),公司旗下網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制深受客戶的喜愛。公司秉持誠(chéng)信為本的經(jīng)營(yíng)理念,在數(shù)碼、電腦深耕多年,以技術(shù)為先導(dǎo),以自主產(chǎn)品為重點(diǎn),發(fā)揮人才優(yōu)勢(shì),打造數(shù)碼、電腦良好品牌。魏晉元興智能立足于全國(guó)市場(chǎng),依托強(qiáng)大的研發(fā)實(shí)力,融合前沿的技術(shù)理念,飛快響應(yīng)客戶的變化需求。