分布式文件操作系統(tǒng)
分布式文件操作系統(tǒng)
分布式文件操作系統(tǒng)是管理文件、存儲(chǔ)數(shù)據(jù)的功能性系統(tǒng)。下面由學(xué)習(xí)啦小編為大家整理了分布式文件操作系統(tǒng)的相關(guān)知識(shí),希望對(duì)大家有幫助!
分布式文件操作系統(tǒng)簡(jiǎn)介
計(jì)算機(jī)通過文件系統(tǒng)管理、存儲(chǔ)數(shù)據(jù),而信息爆炸時(shí)代中人們可以獲取的數(shù)據(jù)成指數(shù)倍的增長(zhǎng),單純通過增加硬盤個(gè)數(shù)來擴(kuò)展計(jì)算機(jī)文件系統(tǒng)的存儲(chǔ)容量的方式,在容量大小、容量增長(zhǎng)速度、數(shù)據(jù)備份、數(shù)據(jù)安全等方面的表現(xiàn)都差強(qiáng)人意。分布式文件系統(tǒng)可以有效解決數(shù)據(jù)的存儲(chǔ)和管理難題:將固定于某個(gè)地點(diǎn)的某個(gè)文件系統(tǒng),擴(kuò)展到任意多個(gè)地點(diǎn)/多個(gè)文件系統(tǒng),眾多的節(jié)點(diǎn)組成一個(gè)文件系統(tǒng)網(wǎng)絡(luò)。每個(gè)節(jié)點(diǎn)可以分布在不同的地點(diǎn),通過網(wǎng)絡(luò)進(jìn)行節(jié)點(diǎn)間的通信和數(shù)據(jù)傳輸。人們?cè)谑褂梅植际轿募到y(tǒng)時(shí),無需關(guān)心數(shù)據(jù)是存儲(chǔ)在哪個(gè)節(jié)點(diǎn)上、或者是從哪個(gè)節(jié)點(diǎn)從獲取的,只需要像使用本地文件系統(tǒng)一樣管理和存儲(chǔ)文件系統(tǒng)中的數(shù)據(jù)。
決定因素
文件系統(tǒng)最初設(shè)計(jì)時(shí),僅僅是為局域網(wǎng)內(nèi)的本地?cái)?shù)據(jù)服務(wù)的。而分布式文件系統(tǒng)將服務(wù)范圍擴(kuò)展到了整個(gè)網(wǎng)絡(luò)。不僅改變了數(shù)據(jù)的存儲(chǔ)和管理方式,也擁有了本地文件系統(tǒng)所無法具備的數(shù)據(jù)備份、數(shù)據(jù)安全等優(yōu)點(diǎn)。判斷一個(gè)分布式文件系統(tǒng)是否優(yōu)秀,取決于以下三個(gè)因素:l 數(shù)據(jù)的存儲(chǔ)方式,例如有1000萬個(gè)數(shù)據(jù)文件,可以在一個(gè)節(jié)點(diǎn)存儲(chǔ)全部數(shù)據(jù)文件,在其他N個(gè)節(jié)點(diǎn)上每個(gè)節(jié)點(diǎn)存儲(chǔ)1000/N萬個(gè)數(shù)據(jù)文件作為備份;或者平均分配到N個(gè)節(jié)點(diǎn)上存儲(chǔ),每個(gè)節(jié)點(diǎn)上存儲(chǔ)1000/N萬個(gè)數(shù)據(jù)文件。無論采取何種存儲(chǔ)方式,目的都是為了保證數(shù)據(jù)的存儲(chǔ)安全和方便獲取。l 數(shù)據(jù)的讀取速率,包括響應(yīng)用戶讀取數(shù)據(jù)文件的請(qǐng)求、定位數(shù)據(jù)文件所在的節(jié)點(diǎn)、讀取實(shí)際硬盤中數(shù)據(jù)文件的時(shí)間、不同節(jié)點(diǎn)間的數(shù)據(jù)傳輸時(shí)間以及一部分處理器的處理時(shí)間等。各種因素決定了分布式文件系統(tǒng)的用戶體驗(yàn)。即分布式文件系統(tǒng)中數(shù)據(jù)的讀取速率不能與本地文件系統(tǒng)中數(shù)據(jù)的讀取速率相差太大,否則在本地文件系統(tǒng)中打開一個(gè)文件需要2秒,而在分布式文件系統(tǒng)中各種因素的影響下用時(shí)超過10秒,就會(huì)嚴(yán)重影響用戶的使用體驗(yàn)。l 數(shù)據(jù)的安全機(jī)制,由于數(shù)據(jù)分散在各個(gè)節(jié)點(diǎn)中,必須要采取冗余、備份、鏡像等方式保證節(jié)點(diǎn)出現(xiàn)故障的情況下,能夠進(jìn)行數(shù)據(jù)的恢復(fù),確保數(shù)據(jù)安全。
分布式文件操作系統(tǒng)分類
網(wǎng)絡(luò)文件系統(tǒng)
飛客數(shù)據(jù)恢復(fù)中心提供(NFS) 最早由Sun微系統(tǒng)公司作為TCP/IP網(wǎng)上的文件共享系統(tǒng)開發(fā)。Sun公司估計(jì)大約有超過310萬個(gè)系統(tǒng)在運(yùn)行NFS,大到大型計(jì)算機(jī)、小至PC機(jī),其中至少有80%的系統(tǒng)是非Sun平臺(tái)。
Andrew系統(tǒng)(AFS)
結(jié)構(gòu)與NFS相似,由卡內(nèi)基·梅隆大學(xué)信息技術(shù)中心(ITC)開發(fā)、現(xiàn)由前ITC職員組成的Transarc公司負(fù)責(zé)開發(fā)和銷售。AFS較NFS有所增強(qiáng)。
KASS系統(tǒng)
KASS File System(簡(jiǎn)稱KFS)是開始軟件自主研發(fā)基于JAVA的純分布式文件系統(tǒng),功能類似于DFS、GFS、Hadoop,通過HTTP WEB為企業(yè)的各種信息系統(tǒng)提供底層文件存儲(chǔ)及訪問服務(wù),搭建企業(yè)私有云存儲(chǔ)服務(wù)平臺(tái)。
DFS系統(tǒng)(DFS)
是AFS的一個(gè)版本,作為開放軟件基金會(huì)(OSF)的分布式計(jì)算環(huán)境中的文件系統(tǒng)部分。
如果文件的訪問僅限于一個(gè)用戶,那么分布式文件系統(tǒng)就很容易實(shí)現(xiàn)。可惜的是,在許多網(wǎng)絡(luò)環(huán)境中這種限制是不現(xiàn)實(shí)的,必須采取并發(fā)控制來實(shí)現(xiàn)文件的多用戶訪問,表現(xiàn)為如下幾個(gè)形式:
只讀共享 任何客戶機(jī)只能訪問文件,而不能修改它,這實(shí)現(xiàn)起來很簡(jiǎn)單。
受控寫操作 采用這種方法,可有多個(gè)用戶打開一個(gè)文件,但只有一個(gè)用戶進(jìn)行寫修改。而該用戶所作的修改并不一定出現(xiàn)在其它已打開此文件的用戶的屏幕上。
并發(fā)寫操作 這種方法允許多個(gè)用戶同時(shí)讀寫一個(gè)文件。但這需要操作系統(tǒng)作大量的監(jiān)控工作以防止文件重寫,并保證用戶能夠看到最新信息。這種方法即使實(shí)現(xiàn)得很好,許多環(huán)境中的處理要求和網(wǎng)絡(luò)通信量也可能使它變得不可接受。
NFS和AFS的區(qū)別
NFS和AFS的區(qū)別在于對(duì)并發(fā)寫操作的處理方法上。當(dāng)一個(gè)客戶機(jī)向服務(wù)器請(qǐng)求一個(gè)文件(或數(shù)據(jù)庫記錄),文件被放在客戶工作站的高速緩存中,若另一個(gè)用戶也請(qǐng)求同一文件,則它也會(huì)被放入那個(gè)客戶工作站的高速緩存中。當(dāng)兩個(gè)客戶都對(duì)文件進(jìn)行修改時(shí),從技術(shù)上而言就存在著該文件的三個(gè)版本(每個(gè)客戶機(jī)一個(gè),再加上服務(wù)器上的一個(gè))。有兩種方法可以在這些版本之間保持同步:
無狀態(tài)系統(tǒng) 在這個(gè)系統(tǒng)中,服務(wù)器并不保存其客戶機(jī)正在緩存的文件的信息。因此,客戶機(jī)必須協(xié)同服務(wù)器定期檢查是否有其他客戶改變了自己正在緩存的文件。這種方法在大的環(huán)境中會(huì)產(chǎn)生額外的LAN通信開銷,但對(duì)小型LAN來說,這是一種令人滿意的方法。NFS就是個(gè)無狀態(tài)系統(tǒng)。
回呼(Callback)系統(tǒng) 在這種方法中,服務(wù)器記錄它的那些客戶機(jī)的所作所為,并保留它們正在緩存的文件信息。服務(wù)器在一個(gè)客戶機(jī)改變了一個(gè)文件時(shí)使用一種叫回叫應(yīng)答(callbackpromise)的技術(shù)通知其它客戶機(jī)。這種方法減少了大量網(wǎng)絡(luò)通信。AFS(及OSFDCE的DFS)就是回叫系統(tǒng)??蛻魴C(jī)改變文件時(shí),持有這些文件拷貝的其它客戶機(jī)就被回叫并通知這些改變。
無狀態(tài)操作在運(yùn)行性能上有其長(zhǎng)處,但AFS通過保證不會(huì)被回叫應(yīng)答充斥也達(dá)到了這一點(diǎn)。方法是在一定時(shí)間后取消回叫??蛻魴C(jī)檢查回叫應(yīng)答中的時(shí)間期限以保證回叫應(yīng)答是當(dāng)前有效的。回叫應(yīng)答的另一個(gè)有趣的特征是向用戶保證了文件的當(dāng)前有效性。換句話說,若一個(gè)被緩存的文件有一個(gè)回叫應(yīng)答,則客戶機(jī)就認(rèn)為文件是當(dāng)前有效的,除非服務(wù)器呼叫指出服務(wù)器上的該文件已改變了。