分布式數(shù)據(jù)庫在應(yīng)急測繪專題分析中的應(yīng)用研究
作者:檢測狗 發(fā)表時(shí)間:2020-05-12 20:50:15 瀏覽次數(shù):606
-
碩博初稿查重系統(tǒng) 498.00元/篇? 語種:中文,英文,小語種? 適用:雜志社投稿,職稱論文? 簡介:碩博初稿檢測(一般習(xí)慣叫做碩博預(yù)審版),論文查重檢測上千萬篇中文文獻(xiàn),超百萬篇各類獨(dú)家文獻(xiàn),超百萬港澳臺地區(qū)學(xué)術(shù)文獻(xiàn)過千...開始檢測
-
維普查重(大學(xué)生版) 4.00元/千字? 語種:中文,英文? 適用:雜志社投稿,職稱論文? 簡介:學(xué)位論文查重,維普大學(xué)生版論文查重系統(tǒng):高校,雜志社指定系統(tǒng),可檢測期刊發(fā)表,大學(xué)生,碩博等論文。檢測報(bào)告支持PDF、網(wǎng)...開始檢測
-
本科高校內(nèi)部版系統(tǒng) 288.00元/篇? 語種:中文,英文,小語種? 適用:雜志社投稿,職稱論文? 簡介:比定稿版少大學(xué)生聯(lián)合比對庫,其他數(shù)據(jù)庫一致。出結(jié)果快,價(jià)格相對低廉,不支持驗(yàn)證,適合在修改中期使用,定稿推薦PMLC?!?..開始檢測
-
萬方論文查重系統(tǒng) 4.00元/千字? 語種:中文? 適用:雜志社投稿,職稱論文? 簡介:畢業(yè)論文查重,萬方查重系統(tǒng),涵蓋期刊、學(xué)位論文、學(xué)術(shù)成果、學(xué)術(shù)會議論文的大型網(wǎng)絡(luò)數(shù)據(jù)庫;比肩中國知網(wǎng)的學(xué)術(shù)數(shù)據(jù)庫。最多支...開始檢測
摘要:突發(fā)事件發(fā)生后,如何及時(shí)高效地掌握周邊地理情況,支持各級應(yīng)急部門搶險(xiǎn)救災(zāi)工作,是應(yīng)急測繪的重點(diǎn)工作之一?;诜植际綌?shù)據(jù)庫建設(shè)的應(yīng)急測繪專題分析系統(tǒng)能夠?qū)?yīng)急現(xiàn)場周邊地物及人口、法人等專題數(shù)據(jù)進(jìn)行快速查詢及統(tǒng)計(jì),實(shí)現(xiàn)不同尺度、不同用戶需求的測繪應(yīng)急專題數(shù)據(jù)資源服務(wù),支撐災(zāi)情分析與應(yīng)急處置。試驗(yàn)證明,與傳統(tǒng)Oracle數(shù)據(jù)庫相比,采用分布式數(shù)據(jù)庫開展應(yīng)急專題分析,效率可提升10倍左右。
關(guān)鍵詞:分布式數(shù)據(jù)庫;應(yīng)急測繪;專題分析
0引言
近年來,國內(nèi)外學(xué)者競相開展大數(shù)據(jù)技術(shù)研究,大多采用Hadoop技術(shù)解決訂單、交易等傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)分析問題,同樣,采用Hadoop技術(shù)解決地理空間大數(shù)據(jù)存儲、分析問題的也不在少數(shù)
河南大學(xué)李運(yùn)興、馬駿,基于Hadoop提出了HadoopSpatial分布式空間數(shù)據(jù)庫的建設(shè)思路,其思路主要是對Hive進(jìn)行擴(kuò)展,使Hadoop支持空間數(shù)據(jù)的分布式存儲、管理與訪問。并且,通過對比試驗(yàn)表明,HadoopSpatial性能不遜于傳統(tǒng)空間數(shù)據(jù)庫,更適合大規(guī)模密集型空間運(yùn)算。
中國林業(yè)科學(xué)研究院資源信息研究所吳琰、唐小明提出了基于HBase的分布式空間數(shù)據(jù)庫技術(shù),并采用基于GeoHash的方式構(gòu)建分布式空間索引,實(shí)現(xiàn)了矢量與柵格空間數(shù)據(jù)的分布式存儲與快速查詢。
Esri公司及超圖公司在新一代GIS軟件產(chǎn)品中,均提出以分布式數(shù)據(jù)庫HBase方式存儲矢量空間,并采用Spark內(nèi)存計(jì)算框架實(shí)現(xiàn)大規(guī)模空間分析。雖然實(shí)現(xiàn)了矢量空間數(shù)據(jù)的分布式存儲與分析,但采用HBase+Spark的方式存在以下問題:
1)數(shù)據(jù)存儲形式區(qū)別于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,不利于成果數(shù)據(jù)的版本管理與瀏覽,入庫成本高。
2)采用該方式存儲的空間數(shù)據(jù)不能與傳統(tǒng)制圖、應(yīng)急或其他應(yīng)用系統(tǒng)快速集成,遷移開發(fā)工作量大。
3)產(chǎn)品價(jià)格昂貴,且體系過于龐大,不利于大規(guī)模推廣應(yīng)用。
1分布式數(shù)據(jù)庫技術(shù)
1.1分布式數(shù)據(jù)庫
應(yīng)急測繪專題分布式數(shù)據(jù)庫采用BiGeo大數(shù)據(jù)平臺作為空間數(shù)據(jù)引擎,建立分布式空間數(shù)據(jù)庫。數(shù)據(jù)庫的存儲模式如圖1所示。
區(qū)別于傳統(tǒng)單節(jié)點(diǎn)數(shù)據(jù)庫,BiGeo分布式數(shù)據(jù)庫主要由管理節(jié)點(diǎn)(Master)、存儲運(yùn)算節(jié)點(diǎn)(Segment)、網(wǎng)絡(luò)總線(Interconnect)三大部分組成。BiGeo管理節(jié)點(diǎn)是BiGeo分布式數(shù)據(jù)庫的入口,僅接收客戶端連接及提交的SQL語句,而后將SQL運(yùn)算分發(fā)給存儲運(yùn)算節(jié)點(diǎn)(Segment實(shí)例),由存儲運(yùn)算節(jié)點(diǎn)真正存儲和處理數(shù)據(jù),并匯交到管理節(jié)點(diǎn)。BiGeo網(wǎng)絡(luò)總線負(fù)責(zé)管理節(jié)點(diǎn)與存儲運(yùn)算節(jié)點(diǎn)及存儲運(yùn)算節(jié)點(diǎn)之間的網(wǎng)絡(luò)通信。BiGeo存儲運(yùn)算節(jié)點(diǎn)是獨(dú)立的數(shù)據(jù)庫實(shí)例,每個(gè)存儲運(yùn)算節(jié)點(diǎn)存儲與計(jì)算一部分?jǐn)?shù)據(jù)。
1.2分布式應(yīng)急測繪專題數(shù)據(jù)庫
針對應(yīng)急測繪工作需求,應(yīng)急測繪專題數(shù)據(jù)來源于天地圖、地理國情、地理信息共享交換庫等項(xiàng)目,數(shù)據(jù)內(nèi)容見表1。
根據(jù)應(yīng)急專題數(shù)據(jù)及服務(wù)器實(shí)際情況,并為保證數(shù)據(jù)的高可用性,每個(gè)存儲運(yùn)算節(jié)點(diǎn)創(chuàng)建相應(yīng)的鏡像備份節(jié)點(diǎn)。實(shí)際部署情況如圖2所示。
如圖2所示,本次研究采用兩臺Dellx86服務(wù)器作為存儲運(yùn)算節(jié)點(diǎn)服務(wù)器,部署分布式數(shù)據(jù)庫主節(jié)點(diǎn)及鏡像節(jié)點(diǎn),兩臺服務(wù)器數(shù)據(jù)庫節(jié)點(diǎn)互為備份,每個(gè)數(shù)據(jù)庫節(jié)點(diǎn)存儲部分空間數(shù)據(jù),根據(jù)服務(wù)器CPU及內(nèi)存配置,每臺服務(wù)器按照16個(gè)存儲運(yùn)算節(jié)點(diǎn)部署,共部署32個(gè)存儲運(yùn)算節(jié)點(diǎn)。
由于硬件環(huán)境限制,從其中一臺Dellx86服務(wù)器中虛擬出一個(gè)Linux服務(wù)器作為數(shù)據(jù)庫管理節(jié)點(diǎn)運(yùn)行環(huán)境。在實(shí)際生產(chǎn)環(huán)境中,可根據(jù)硬件環(huán)境情況,作為獨(dú)立服務(wù)器部署。
按照分布式數(shù)據(jù)庫建設(shè)思路,應(yīng)急測繪專題數(shù)據(jù)是分布在不同的存儲運(yùn)算節(jié)點(diǎn)之上。如圖3所示,本次研究采用Hash分布方式,根據(jù)數(shù)據(jù)主鍵(oid)創(chuàng)建Hash值均勻分布存儲數(shù)據(jù)。
2基于分布式數(shù)據(jù)庫的應(yīng)急測繪專題分析系統(tǒng)
2.1系統(tǒng)設(shè)計(jì)
應(yīng)急測繪專題分析系統(tǒng)采用BiGeo大數(shù)據(jù)平臺作為應(yīng)急測繪專題數(shù)據(jù)存儲及分析基礎(chǔ)框架,未采用其他任何第三方商業(yè)GIS地理信息軟件,實(shí)現(xiàn)應(yīng)急測繪專題數(shù)據(jù)快速存儲、分析、提取等功能。
系統(tǒng)采用C/S開發(fā)架構(gòu),數(shù)據(jù)庫與系統(tǒng)分離部署運(yùn)行,總體架構(gòu)如圖4所示。BiGeo空間信息大數(shù)據(jù)平臺提供空間數(shù)據(jù)分布式存儲、分析二次開發(fā)接口,本系統(tǒng)采用.NETC#API開發(fā)應(yīng)急專題分析系統(tǒng)業(yè)務(wù)功能。選用開源地圖桌面框架SharpMap作為應(yīng)急測繪專題分析系統(tǒng)研發(fā)框架。應(yīng)急測繪專題分析系統(tǒng)功能架構(gòu)如圖5所示。
2.2應(yīng)急測繪專題分析
專題分析是系統(tǒng)的核心功能,設(shè)置災(zāi)害名稱、災(zāi)害范圍,選擇分析對象后即可開始專題分析,快速統(tǒng)計(jì)災(zāi)害范圍內(nèi)空間要素的數(shù)量、長度、面積等指標(biāo),為應(yīng)急測繪處置工作提供數(shù)據(jù)支撐。
針對專題分析結(jié)果,可再次根據(jù)查詢對象字段進(jìn)行統(tǒng)計(jì),并可基于字段分組,如針對建筑物數(shù)據(jù),可根據(jù)行政區(qū)統(tǒng)計(jì)建筑物面積,從而提供更加專業(yè)、深層次的分析。
3結(jié)論
相比傳統(tǒng)基于ArcGISSDE+Oracle空間數(shù)據(jù)庫建庫方式,采用分布式數(shù)據(jù)的方式進(jìn)行應(yīng)急測繪專題分析的效率明顯提升。以4000萬條地理國情地表覆蓋數(shù)據(jù)(物理大小:20GB)測試裁剪操作(空間相交分析)為例,Oracle一體機(jī)測試結(jié)果見表2,本文分布式數(shù)據(jù)庫方式見表3。
從以上兩表測試結(jié)果可以看出,本文采用的分布式數(shù)據(jù)庫方式進(jìn)行空間分析比Oracle一體機(jī)方式快10倍左右,并且隨著分布式節(jié)點(diǎn)的增加,分析效率明顯增加。
4結(jié)束語
本文采用分布式數(shù)據(jù)庫的方式進(jìn)行應(yīng)急測繪專題分析,在分析效率上明顯提升,可快速掌握突發(fā)事件后應(yīng)急現(xiàn)場周邊道路、房屋、河流等地表特征,快速分發(fā)地理空間要素,對應(yīng)急測繪保障工作具有重大意義。基于本文研究,采用分布式數(shù)據(jù)建設(shè)地理空間數(shù)據(jù)的方式可推廣應(yīng)用于時(shí)空大數(shù)據(jù)庫、地理國情統(tǒng)計(jì)分析、自然資源地理空間數(shù)據(jù)庫等項(xiàng)目。
知網(wǎng)論文查重:http://本站聲明:網(wǎng)站內(nèi)容來源于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系我們,我們將及時(shí)刪除處理。