国产精品福利自产拍在线观看,国产原创中文无码精品视频,岛国av无码精品一区二区三区,人人妻妻人人

MapReduce開(kāi)發(fā)運(yùn)行的精簡(jiǎn)原理(mapreduce開(kāi)發(fā)流程)

作者:黑馬程序員
鏈接:https://zhuanlan.zhihu.com/p/81237437
來(lái)源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。

簡(jiǎn)單介紹

相信關(guān)于Hadoop中MapReduce的相關(guān)文章會(huì)很多,這里只簡(jiǎn)單介紹一下MapReduce的相關(guān)知識(shí)。

Hadoop的MapReduce來(lái)源于Google公司的三篇論文中的MapReduce,其核心思想是“分而治之”

Map負(fù)責(zé)“分”,即把復(fù)雜的任務(wù)分解為若干個(gè)“簡(jiǎn)單的任務(wù)”來(lái)并行處理??梢赃M(jìn)行拆分的前提是這些小任務(wù)可以并行計(jì)算,彼此間幾乎沒(méi)有依賴關(guān)系。

Reduce負(fù)責(zé)“合”,即對(duì)map階段的結(jié)果進(jìn)行全局匯總。

現(xiàn)階段MapReduce一般運(yùn)行在Hadoop2.x版本的yarn資源平臺(tái)上,具體運(yùn)行過(guò)程后面會(huì)有詳細(xì)說(shuō)明。

MapReduce編程規(guī)范

MapReduce 的開(kāi)發(fā)一共有八個(gè)步驟, 其中 Map 階段分為 2 個(gè)步驟,Shuffle 階段 4 個(gè)步驟,Reduce 階段分為 2 個(gè)步驟

Map 階段 2 個(gè)步驟

1)設(shè)置 InputFormat 類, 將數(shù)據(jù)切分為 Key-Value(K1和V1) 對(duì), 輸入到第二步

2)自定義 Map 邏輯, 將第一步的結(jié)果轉(zhuǎn)換成另外的 Key-Value(K2和V2) 對(duì), 輸出結(jié)果

Shuffle 階段 4 個(gè)步驟

3)對(duì)輸出的 Key-Value 對(duì)進(jìn)行分區(qū)

4)對(duì)不同分區(qū)的數(shù)據(jù)按照相同的 Key 排序

5)(可選) 對(duì)分組過(guò)的數(shù)據(jù)初步規(guī)約, 降低數(shù)據(jù)的網(wǎng)絡(luò)拷貝

6)對(duì)數(shù)據(jù)進(jìn)行分組, 相同 Key 的 Value 放入一個(gè)集合中

Reduce 階段 2 個(gè)步驟

7)對(duì)多個(gè) Map 任務(wù)的結(jié)果進(jìn)行排序以及合并, 編寫 Reduce 函數(shù)實(shí)現(xiàn)自己的邏輯, 對(duì)輸入的 Key-Value 進(jìn)行處理, 轉(zhuǎn)為新的 Key-Value(K3和V3)輸出

8)設(shè)置 OutputFormat 處理并保存 Reduce 輸出的 Key-Value 數(shù)據(jù)

MapReduce開(kāi)發(fā)運(yùn)行的精簡(jiǎn)原理(mapreduce開(kāi)發(fā)流程)

MapReduce的步驟圖

yarn資源調(diào)度

yarn是hadoop集群當(dāng)中的資源管理系統(tǒng)模塊,從hadoop2.0開(kāi)始引入yarn模塊,yarn可為各類計(jì)算框架提供資源的管理和調(diào)度,主要用于管理集群當(dāng)中的資源(主要是服務(wù)器的各種硬件資源,包括CPU,內(nèi)存,磁盤,網(wǎng)絡(luò)IO等)以及調(diào)度運(yùn)行在yarn上面的各種任務(wù)。

相比于hadoop1.x版本,yarn核心出發(fā)點(diǎn)是為了分離資源管理與作業(yè)監(jiān)控,實(shí)現(xiàn)分離的做法是擁有一個(gè)全局的資源管理ResourceManager(RM),以及每個(gè)應(yīng)用程序?qū)?yīng)一個(gè)的應(yīng)用管理器ApplicationMaster(AM)。

總結(jié)一句話就是說(shuō):yarn主要就是為了調(diào)度資源,管理任務(wù)。

YARN總體上是Master/Slave結(jié)構(gòu),主要由ResourceManager、NodeManager、 ApplicationMaster和Container等幾個(gè)組件構(gòu)成。

ResourceManager(RM) 負(fù)責(zé)處理客戶端請(qǐng)求,對(duì)各NM上的資源進(jìn)行統(tǒng)一管理和調(diào)度。給ApplicationMaster分配空閑的Container 運(yùn)行并監(jiān)控其運(yùn)行狀態(tài)。主要由兩個(gè)組件構(gòu)成:調(diào)度器和應(yīng)用程序管理器:

調(diào)度器(Scheduler):調(diào)度器根據(jù)容量、隊(duì)列等限制條件,將系統(tǒng)中的資源分配給各個(gè)正在運(yùn)行的應(yīng)用程序。調(diào)度器僅根據(jù)各個(gè)應(yīng)用程序的資源需求進(jìn)行資源分配,而資源分配單位是Container。Shceduler不負(fù)責(zé)監(jiān)控或者跟蹤應(yīng)用程序的狀態(tài)??傊?,調(diào)度器根據(jù)應(yīng)用程序的資源要求,以及集群機(jī)器的資源情況,為應(yīng)用程序分配封裝在Container中的資源。

應(yīng)用程序管理器(Applications Manager):應(yīng)用程序管理器負(fù)責(zé)管理整個(gè)系統(tǒng)中所有應(yīng)用程序,包括應(yīng)用程序提交、與調(diào)度器協(xié)商資源以啟動(dòng)ApplicationMaster 、監(jiān)控ApplicationMaster運(yùn)行狀態(tài)并在失敗時(shí)重新啟動(dòng)等,跟蹤分給的Container的進(jìn)度、狀態(tài)也是其職責(zé)。

NodeManager (NM) NodeManager 是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。它會(huì)定時(shí)地向ResourceManager匯報(bào)本節(jié)點(diǎn)上的資源使用情況和各個(gè)Container的運(yùn)行狀態(tài);同時(shí)會(huì)接收并處理來(lái)自ApplicationMaster 的Container 啟動(dòng)/停止等請(qǐng)求。

ApplicationMaster (AM): 用戶提交的應(yīng)用程序均包含一個(gè)ApplicationMaster ,負(fù)責(zé)應(yīng)用的監(jiān)控,跟蹤應(yīng)用執(zhí)行狀態(tài),重啟失敗任務(wù)等。ApplicationMaster是應(yīng)用框架,它負(fù)責(zé)向ResourceManager協(xié)調(diào)資源,并且與NodeManager協(xié)同工作完成Task的執(zhí)行和監(jiān)控。

Container: Container是YARN中的資源抽象,它封裝了某個(gè)節(jié)點(diǎn)上的多維度資源,如內(nèi)存、CPU、磁盤、網(wǎng)絡(luò)等,當(dāng)ApplicationMaster向ResourceManager申請(qǐng)資源時(shí),ResourceManager為ApplicationMaster 返回的資源便是用Container 表示的。

yarn的架構(gòu)和工作流程

MapReduce開(kāi)發(fā)運(yùn)行的精簡(jiǎn)原理(mapreduce開(kāi)發(fā)流程)

步驟分析:

  1. 客戶端通過(guò)命令(hadoop jar xxx.jar)提交上傳任務(wù)到主節(jié)點(diǎn)ResourceManager(RM)中的ApplicationManager進(jìn)程
  2. 主節(jié)點(diǎn)RM判斷集群狀態(tài),選擇一臺(tái)NodeManager(NM),開(kāi)啟一塊資源Container,用來(lái)開(kāi)啟AppMaster進(jìn)程
  3. AppMaster進(jìn)程獲取RM接收的任務(wù)請(qǐng)求,進(jìn)行任務(wù)分配
  4. AppMaster根據(jù)任務(wù)情況向RM中的ResourceScheduler索要資源分配方案
  5. AppMaster根據(jù)資源分配方案找到到各個(gè)NodeManager從節(jié)點(diǎn)
  6. 在從節(jié)點(diǎn)上開(kāi)啟資源Container,并運(yùn)行任務(wù)Task
  7. AppMaster獲取各個(gè)Task上傳的任務(wù)執(zhí)行進(jìn)度和結(jié)果
  8. AppMaster將任務(wù)執(zhí)行的結(jié)果返回給ApplicationManager

版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。

(0)
上一篇 2023年5月14日 上午10:28
下一篇 2023年5月14日 上午10:44

相關(guān)推薦

  • 課題如何查詢?(課題如何查詢真?zhèn)危?

    課題主辦單位跟知網(wǎng)有合作,課題即可上知網(wǎng)(跟期刊同理,雜志社跟知網(wǎng)有合作,作者的文章即可上知網(wǎng)),包括申報(bào)中的課題、已經(jīng)立項(xiàng)的課題和已經(jīng)結(jié)項(xiàng)的課題都可以查詢到相應(yīng)的資料。 知網(wǎng)查不…

    科研百科 2024年4月9日
    231
  • 航天三江總部

    航天三江總部 航天三江總部位于中國(guó)北京市海淀區(qū),是中國(guó)航天工業(yè)的基礎(chǔ)力量。作為中國(guó)航天工業(yè)的核心機(jī)構(gòu),航天三江總部承擔(dān)著為中國(guó)航天事業(yè)提供技術(shù)支持和保障的重要任務(wù)。 在航天三江總部…

    科研百科 2024年10月29日
    3
  • 關(guān)于申報(bào)2022年度山西省人民檢察院檢察理論研究課題的公告(山西省檢察院工作報(bào)告2021)

    為全面貫徹習(xí)近平法治思想,把省委關(guān)于全面依法治省重大決策部署落到實(shí)處,圍繞服務(wù)山西經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展大局,聚焦事關(guān)檢察事業(yè)長(zhǎng)遠(yuǎn)發(fā)展的重大理論和檢察工作中的重點(diǎn)、難點(diǎn)、熱點(diǎn)問(wèn)題深入開(kāi)…

    科研百科 2024年4月14日
    76
  • 十款crm軟件分析(crm信息管理軟件)

    CRM信息管理軟件概述 CRM(Customer Relationship Management)是指一種用于管理客戶關(guān)系的軟件系統(tǒng),旨在提高企業(yè)的營(yíng)銷效率和客戶滿意度。隨著數(shù)字化…

    科研百科 2024年8月27日
    0
  • 結(jié)項(xiàng)成果簡(jiǎn)介怎么寫

    結(jié)項(xiàng)成果簡(jiǎn)介怎么寫 隨著科技的不斷發(fā)展,越來(lái)越多的研究工作得到了良好的成果。在這些成果中,結(jié)項(xiàng)成果簡(jiǎn)介是一個(gè)重要的組成部分,用于向外界展示研究成果的價(jià)值和貢獻(xiàn)。一篇好的結(jié)項(xiàng)成果簡(jiǎn)介…

    科研百科 2024年12月8日
    0
  • 探索性問(wèn)題主要涉及的領(lǐng)域有哪些

    探索性問(wèn)題主要涉及的領(lǐng)域有哪些 性問(wèn)題是一個(gè)廣泛而且多樣化的主題,涉及到許多不同的領(lǐng)域。從哲學(xué)到生物學(xué),從心理學(xué)到計(jì)算機(jī)科學(xué),性問(wèn)題在不同領(lǐng)域中都有廣泛的應(yīng)用。本文將探討一些主要的…

    科研百科 2024年12月6日
    0
  • 會(huì)議管理規(guī)定

    會(huì)議管理規(guī)定 為了規(guī)范會(huì)議管理,提高會(huì)議質(zhì)量,保障參會(huì)人員的權(quán)益,我們公司制定了以下會(huì)議管理規(guī)定。 一、會(huì)議時(shí)間和地點(diǎn) 所有會(huì)議必須在公司會(huì)議室舉行,時(shí)間不得少于兩個(gè)小時(shí)。每次會(huì)議…

    科研百科 13小時(shí)前
    0
  • 工程項(xiàng)目管理軟件app

    工程項(xiàng)目管理軟件app:助力工程項(xiàng)目高效管理 隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,工程項(xiàng)目管理也在不斷地變革。傳統(tǒng)的項(xiàng)目管理軟件已經(jīng)無(wú)法滿足現(xiàn)代項(xiàng)目管理的需求,因此,一款全新的工程項(xiàng)目管理…

    科研百科 2024年8月19日
    1
  • 國(guó)有企業(yè)13種重要廉潔風(fēng)險(xiǎn)點(diǎn)及防范措施(十一)(十二)(十三)

    (十一)關(guān)于職工福利待遇管理廉政風(fēng)險(xiǎn)防控 1、廉政風(fēng)險(xiǎn)點(diǎn)表現(xiàn)形式 (1)違反上級(jí)和公司相關(guān)管理規(guī)定,巧立名目變相提高職工福利待遇。 (2)違反規(guī)定超發(fā)年休假補(bǔ)貼、暖氣費(fèi)補(bǔ)貼、通訊費(fèi)…

    科研百科 2023年9月22日
    403
  • 英國(guó)數(shù)學(xué)學(xué)院排名(數(shù)學(xué)科研項(xiàng)目英國(guó)排名第一)

    數(shù)學(xué)科研項(xiàng)目英國(guó)排名第一 近年來(lái),英國(guó)在數(shù)學(xué)領(lǐng)域的研究取得了巨大的成就。特別是在一些前沿的科研項(xiàng)目上,英國(guó)一直保持著領(lǐng)先地位。近日,根據(jù)英國(guó)科學(xué)基金會(huì)發(fā)布的數(shù)據(jù),在最新的數(shù)學(xué)科研項(xiàng)…

    科研百科 2024年8月5日
    0