五月天在线电影中文字幕,亚洲最大先锋资源网

大數(shù)據(jù)之Hive應用場景

2020-12-08 09:25

加米谷學院

加米谷

在大數(shù)據(jù)的發(fā)展當中，大數(shù)據(jù)技術(shù)生態(tài)的組件，也在不斷地拓展開來，而其中的Hive組件，作為Hadoop的數(shù)據(jù)倉庫工具，可以實現(xiàn)對Hadoop集群當中的大規(guī)模數(shù)據(jù)進行相應的數(shù)據(jù)處理。

關(guān)于Hive，首先需要明確的一點就是，Hive并非數(shù)據(jù)庫，Hive所提供的數(shù)據(jù)存儲、查詢和分析功能，本質(zhì)上來說，并非傳統(tǒng)數(shù)據(jù)庫所提供的存儲、查詢、分析功能。

Hive數(shù)據(jù)倉庫工具將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表，并提供SQL查詢功能，能將SQL語句轉(zhuǎn)變成MapReduce任務來執(zhí)行。通過類SQL語句實現(xiàn)快速MapReduce統(tǒng)計，使MapReduce編程變得更加簡單易行。

Hive應用場景

總的來說，Hive是十分適合數(shù)據(jù)倉庫的統(tǒng)計分析和Windows注冊表文件。

Hive在Hadoop中扮演數(shù)據(jù)倉庫的角色。Hive添加數(shù)據(jù)的結(jié)構(gòu)在HDFS（Hive superimposes structure on data in HDFS），并允許使用類似于SQL語法進行數(shù)據(jù)查詢。

Hive更適合于數(shù)據(jù)倉庫的任務，主要用于靜態(tài)的結(jié)構(gòu)以及需要經(jīng)常分析的工作。Hive與SQL相似促使其成為Hadoop與其他BI工具結(jié)合的理想交集。

Hive使用

Hive在Hadoop之上，使用Hive的前提是先要安裝Hadoop。

Hive要分析的數(shù)據(jù)存儲在HDFS，Hive為數(shù)據(jù)創(chuàng)建的表結(jié)構(gòu)（schema），存儲在RDMS（relevant database manage system關(guān)系型數(shù)據(jù)庫管理系統(tǒng)，比如mysql）。

Hive構(gòu)建在基于靜態(tài)批處理的Hadoop之上，Hadoop通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時候需要大量的開銷。因此，Hive并不能夠在大規(guī)模數(shù)據(jù)集上實現(xiàn)低延遲快速的查詢，例如，Hive在幾百MB的數(shù)據(jù)集上執(zhí)行查詢一般有分鐘級的時間延遲。

Hive查詢操作過程嚴格遵守Hadoop MapReduce的作業(yè)執(zhí)行模型，Hive將用戶的HiveQL語句通過解釋器轉(zhuǎn)換為MapReduce作業(yè)提交到Hadoop集群上，Hadoop監(jiān)控作業(yè)執(zhí)行過程，然后返回作業(yè)執(zhí)行結(jié)果給用戶。Hive的最佳使用場合是大數(shù)據(jù)集的批處理作業(yè)，例如，網(wǎng)絡(luò)日志分析。

Hive優(yōu)缺點

優(yōu)點：

操作接口采用類SQL語法，提供快速開發(fā)的能力（簡單、容易上手）。

Hive的執(zhí)行延遲比較高，因此Hive常用于數(shù)據(jù)分析，對實時性要求不高的場合。

Hive優(yōu)勢在于處理大數(shù)據(jù)，對于處理小數(shù)據(jù)沒有優(yōu)勢，因為Hive的執(zhí)行延遲比較高。

Hive支持用戶自定義函數(shù)，用戶可以根據(jù)自己的需求來實現(xiàn)自己的函數(shù)。

缺點：

1．Hive的HQL表達能力有限

（1）迭代式算法無法表達遞歸算法

（2）數(shù)據(jù)挖掘方面不擅長（數(shù)據(jù)挖掘和算法機器學習）

2．Hive的效率比較低

（1）Hive自動生成的MapReduce作業(yè)，通常情況下不夠智能化

（2）Hive調(diào)優(yōu)比較困難，粒度較粗（快）

關(guān)于大數(shù)據(jù)培訓，Hive應用場景，以上就為大家做了大致的介紹了。在大數(shù)據(jù)應用場景下，Hive更多是作為Hadoop的一個數(shù)據(jù)倉庫工具，并不直接存儲數(shù)據(jù)，但是卻不可或缺。

THEEND

免責聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。若有來源標注錯誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

云計算的江湖，風云再起

10月8日
揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預告!

10月8日
防勒索病毒攻擊關(guān)鍵措施

10月8日
匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會即將啟幕!

10月8日
網(wǎng)博會革新升級：“區(qū)域頻道”精準選型引領(lǐng)，引領(lǐng)智能制造新風潮

10月8日
萬億賽道!AI算力趨勢發(fā)展深度分析 2024

10月9日

精選文章

熱點資訊

2020年中國云安全行業(yè)市場現(xiàn)狀與發(fā)展趨勢分析云安全投融資熱度大

大數(shù)據(jù)之Hive應用場景

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

大數(shù)據(jù)之Hive應用場景

最新評論（評論僅代表用戶觀點）

大數(shù)據(jù)“聚數(shù)賦能” 織密基層數(shù)字治理“網(wǎng)”

山東出臺“18條措施”加快數(shù)字經(jīng)濟發(fā)展

今年前三季度中國GDP同比增長5.2％

用多方共管思維，推動數(shù)據(jù)規(guī)模化安全流通

本月熱門

云計算的江湖，風云再起

揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會即將啟幕!

網(wǎng)博會革新升級：“區(qū)域頻道”精準選型引領(lǐng)，引領(lǐng)智能制造新風潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

數(shù)字驅(qū)動未來引領(lǐng)智慧浪潮- 智慧視通榮獲2023數(shù)字化轉(zhuǎn)型突出貢獻企業(yè)和數(shù)字化創(chuàng)新突破技術(shù)獎

夢創(chuàng)雙楊許振鍇：信創(chuàng)打造新一代數(shù)字政務

華為云助力新模式新突破! 廣西首個跨省遠程異地評標主場項目在欽州順利完成

“數(shù)據(jù)賦能共建共享”2022中國數(shù)字服務大會線上成功召開

企業(yè)接入物聯(lián)網(wǎng)開發(fā)平臺時最容易踩的幾個雷點!快來看看你中招了沒？

2020第五屆中國網(wǎng)絡(luò)信息安全云上峰會圓滿召開

熱點資訊

政策寶閃耀2024數(shù)智融合應用論壇，榮獲“數(shù)智融合標桿案例”

共筑數(shù)字未來|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務的新浪潮

政策寶|構(gòu)筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

政策智能匹配與業(yè)務線索：企業(yè)騰飛的雙重動力引擎!

2020年中國云安全行業(yè)市場現(xiàn)狀與發(fā)展趨勢分析云安全投融資熱度大

勒索軟件攻擊導致溫哥華公交系統(tǒng)癱瘓

大數(shù)據(jù)之Hive應用場景

最新評論（評論僅代表用戶觀點）

欄目推薦

大數(shù)據(jù)“聚數(shù)賦能” 織密基層數(shù)字治理“網(wǎng)”

山東出臺“18條措施”加快數(shù)字經(jīng)濟發(fā)展

今年前三季度中國GDP同比增長5.2％

用多方共管思維，推動數(shù)據(jù)規(guī)模化安全流通

本月熱門

精選文章

熱點資訊

2020年中國云安全行業(yè)市場現(xiàn)狀與發(fā)展趨勢分析 云安全投融資熱度大

勒索軟件攻擊導致溫哥華公交系統(tǒng)癱瘓

用多方共管思維，推動數(shù)據(jù)規(guī)模化安全流通

2020年中國云安全行業(yè)市場現(xiàn)狀與發(fā)展趨勢分析云安全投融資熱度大