鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理

來源: 發(fā)布時間:2021-11-03

說到分布式存儲,我們先來看一下傳統(tǒng)的存儲是怎么個樣子。傳統(tǒng)的存儲也稱為集中式存儲,從概念上可以看出來是具有集中性的,也就是整個存儲是集中在一個系統(tǒng)中的,但集中式存儲并不是一個單獨的設(shè)備,是集中在一套系統(tǒng)當中的多個設(shè)備,比如下圖中的EMC存儲就需要幾個機柜來存放。在這個存儲系統(tǒng)中包含很多組件,除了核xin的機頭(控制器)、磁盤陣列和交換機等設(shè)備外,還有管理設(shè)備等輔助設(shè)備。結(jié)構(gòu)中包含一個機頭,這個是存儲系統(tǒng)中為核xin的部件。通常在機頭中有包含兩個控制器,互為備用,避免硬件故障導致整個存儲系統(tǒng)的不可用。 常見的幾種分布式存儲以及應用場景。鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理

    Ceph:目前應用廣的開源分布式存儲系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲都是基于Ceph深度定制。而且Ceph已經(jīng)成為LINUX系統(tǒng)和OpenStack的“標配”,用于支持各自的存儲系統(tǒng)。Ceph可以提供對象存儲、塊設(shè)備存儲和文件系統(tǒng)存儲服務。同時支持三種不同類型的存儲服務的特性,在分布式存儲系統(tǒng)中,是很少見的。a、Ceph沒有采用HDFS的元數(shù)據(jù)尋址的方案,而且采用CRUSH算法,數(shù)據(jù)分布均衡,并行度高。而且在支持塊存儲特性上,數(shù)據(jù)可以具有強一致性,可以獲得傳統(tǒng)集中式存儲的使用體驗。b、對象存儲服務,Ceph支持Swift和S3的API接口。在塊存儲方面,支持精簡配置、快照、克隆。在文件系統(tǒng)存儲服務方面,支持Posix接口,支持快照。但是目前Ceph支持文件的性能相當其他分布式存儲系統(tǒng),部署稍顯復雜,性能也稍弱,一般都將Ceph應用于塊和對象存儲。c、Ceph是去中心化的分布式解決方案,需要提前做好規(guī)劃設(shè)計,對技術(shù)團隊的要求能力比較高。特別是在Ceph擴容時,由于其數(shù)據(jù)分布均衡的特性。 泰州聯(lián)想分布式存儲有哪些分布式存儲不得不要了解的幾大特點。

分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。

正所謂長江后浪推前浪,分布式存儲快速增長是不可否認的,這從各大廠商的業(yè)績報告和分析師報告就能看出來,但想要把企業(yè)外置存儲這個前浪拍死在沙灘上還是步子邁太大,不現(xiàn)實。企業(yè)外置存儲在相當長的一段時間內(nèi),仍然是主流。它主要面向企業(yè)傳統(tǒng)應用如ERP/CRM/HIS等,數(shù)據(jù)量不大但對可靠性、性能有極zhi要求,如銀行Core-Banking,從可靠性、生態(tài)層面,分布式存儲都不是比較好選擇。分布式存儲主要面向海量數(shù)據(jù)、新興業(yè)務場景,如HPC/EDA、大數(shù)據(jù),這類場景以二進制文件、視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)為主,數(shù)據(jù)量極大。所以從場景來看,二者場景是有明確區(qū)隔的,按場景并存是比較好的選擇。 分布式存儲、數(shù)據(jù)湖、數(shù)據(jù)治理之間有何關(guān)系呢?

    分布式存儲早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測試等場景,這些場景無疑是低價值場景,成本是第yi訴求甚至訴求。然此一時彼一時,士別三日也當刮目相看。首先是分布式存儲產(chǎn)品能力已今非昔比,逐漸具備了承載企業(yè)高價值業(yè)務的關(guān)鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業(yè)務級容災、端到端DIF等,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)的承載,功能完備性的比較大短板早已補齊。其次,分布式存儲已走入眾多高價值關(guān)鍵業(yè)務,如運營商BOM業(yè)務、金融渠道類業(yè)務以及超算、油藏探測HPC等高價值業(yè)務,通過大規(guī)模應用實踐來檢驗成色。(小道消息,某些高價值場景全閃出貨價達到1000美金/TB以上啦)看完當下還要看看未來,筆者認為未來高價值的非結(jié)構(gòu)化數(shù)據(jù)場景,分布式存儲的版圖還會持續(xù)擴展。如自動駕駛訓練、4K/8K超高清、5G日志留存等場景,對多協(xié)議訪問、極zhi帶寬、擴展性訴求強烈,分布式存儲已然成為這些未來業(yè)務的優(yōu)先架構(gòu)。 分布式存儲在數(shù)據(jù)治理場景中的價值定位及優(yōu)勢解讀。鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理

布式存儲可實現(xiàn)集群的健康監(jiān)測,在故障潛伏期即可實現(xiàn)故障提醒。鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理

分布式存儲系統(tǒng)需要使用多臺服務器共同存儲數(shù)據(jù),而隨著服務器數(shù)量的增加,服務器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個數(shù)據(jù)分成多份存儲在不同的服務器中。但是由于故障和并行存儲等情況的存在,同一個數(shù)據(jù)的多個副本之間可能存在不一致的情況。這里稱保證多個副本的數(shù)據(jù)完全一致的性質(zhì)為一致性。分布式存儲系統(tǒng)需要多臺服務器同時工作。當服務器數(shù)量增多時,其中的一些服務器出現(xiàn)故障是在所難免的。我們希望這樣的情況不會對整個系統(tǒng)造成太大的影響。在系統(tǒng)中的一部分節(jié)點出現(xiàn)故障之后,系統(tǒng)的整體不影響客服端的讀/寫請求稱為可用性。 鎮(zhèn)江大規(guī)模分布式存儲系統(tǒng)原理

江蘇魏晉元興智能科技有限公司是一家智能技術(shù)、計算機技術(shù)研發(fā)、技術(shù)咨詢,技術(shù)轉(zhuǎn)讓:軟件開 發(fā)、銷售;信息系統(tǒng)集成服務:機電產(chǎn)品、計算機及配件、 電線電纜、儀器儀表、電子元器件、機械設(shè)備、機電設(shè)備 節(jié)能設(shè)備、辦公用品、攝影器材、文化用品、通訊設(shè)備、體 育器材、消防器材銷售;綜合布線工程、水電工程、園林綠 化工程、室內(nèi)裝飾工程、土石方工程設(shè)計、施工,提供勞務 服務;企業(yè)形象策劃:企業(yè)管理咨詢:家用電器銷售、維 修;文化藝術(shù)交流活動組織、 策劃。( 依法須經(jīng)批準的項 目,經(jīng)相關(guān)部門批準后方可開展經(jīng)營活動)的公司,致力于發(fā)展為創(chuàng)新務實、誠實可信的企業(yè)。魏晉元興智能深耕行業(yè)多年,始終以客戶的需求為向?qū)?,為客戶提?**的網(wǎng)絡安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制。魏晉元興智能始終以本分踏實的精神和必勝的信念,影響并帶動團隊取得成功。魏晉元興智能創(chuàng)始人譚國江,始終關(guān)注客戶,創(chuàng)新科技,竭誠為客戶提供良好的服務。