在Hadoop生態(tài)系統(tǒng)中,規(guī)模最大、知名度最高的公司則是Cloudera。2018年與世界大數(shù)據(jù)巨頭Hortonworks合并,2019年被Cloud Report中評為大數(shù)據(jù)和Spark的領跑者。這么厲害的廠商,它里面都有些什么軟件呢?我們一起來看看吧!
首先我們需要了解今天介紹的軟件主要分為Cloudera的兩條產(chǎn)品線:CDP和CDF。CDP是Cloudera Data Platform的簡稱,下面又分了很多產(chǎn)品,今天主要介紹CDP Data Center、CDP Data Hub、Cloudera Enterprise Data Hub、Cloudera Machine Learning和Cloudera Data Warehouse五款產(chǎn)品;而CDF就是Cloudera Data Flow的簡稱了。
CDP Data Center
Cloudera Data Platform (CDP) Data Center是用于從Edge到AI的集成分析的最全面的本地平臺,涵蓋了攝取,處理,分析,實驗和部署。它結(jié)合了Cloudera Enterprise Data Hub和HDP Enterprise Plus的優(yōu)點,融合了最新和最出色的開源數(shù)據(jù)管理和分析技術(shù),可以集成在一起工作,并針對數(shù)據(jù)中心內(nèi)的部署進行了優(yōu)化。
查看詳情
產(chǎn)品優(yōu)勢
-
結(jié)合HDP和EDH優(yōu)點
結(jié)合了HDP和EDH優(yōu)點,以及堆棧中的新功能。該統(tǒng)一分發(fā)是可擴展和可定制的平臺,您可以在其中安全地運行多種類型的工作負載。
-
靈活部署
計算任務與數(shù)據(jù)存儲分開,可從遠程集群訪問數(shù)據(jù)。這種混合方法通過管理存儲,表架構(gòu),身份驗證,授權(quán)和治理為容器化應用程序提供了基礎。
-
實時流處理
CDP數(shù)據(jù)中心在使用Apache Kafka處理和轉(zhuǎn)換流數(shù)據(jù)時具有極大的可伸縮性,并具有強大的流管理功能。
-
可定制專屬服務
由Apache HDFS和Apache Hive 3以及許多其他用于特殊工作負載的組件組合而成。您可以選擇這些服務的任意組合來創(chuàng)建滿足您的業(yè)務需求和工作負載的集群。
CDP Data Hub
Cloudera Data Hub是Cloudera Data Platform(CDP)上的一項功能強大的云服務,通過企業(yè)安全性,治理,擴展和控制,可以更輕松,安全,更快地構(gòu)建現(xiàn)代的,關鍵任務,數(shù)據(jù)驅(qū)動的應用程序。原生云服務由一套集成的開源技術(shù)提供支持,該技術(shù)可提供最廣泛的分析工作。
查看詳情
產(chǎn)品優(yōu)勢
-
加快方案部署速度
Data Hub提供類似于PaaS的體驗,可在數(shù)周的時間就內(nèi)部署新解決方案。用戶可以通過企業(yè)安全性,治理,規(guī)模和控制,更快捷,更安全地構(gòu)建可生成收入的多功能數(shù)據(jù)應用程序。
-
減輕風險
Data Hub減輕與技術(shù)發(fā)展,供應商法規(guī)遵從性等相關的風險。它消除了昂貴數(shù)據(jù)中心硬件上的CAPEX需求,并為每個數(shù)據(jù)中心環(huán)境提供端到端的安全性和治理,并為任務關鍵型項目提供優(yōu)化的SLA 。
-
企業(yè)級安全性
數(shù)據(jù)中心可提供企業(yè)級安全性,包括內(nèi)置的聯(lián)合身份管理;支持加密的云存儲服務和附加卷;安全,無密鑰地訪問云提供商的存儲和計算以及所有控制流量和數(shù)據(jù)路徑的自動有線加密等。
-
使用更靈活
Data Hub支持云原生架構(gòu),其中數(shù)據(jù)與計算基礎架構(gòu)分離,數(shù)據(jù)交付層從原始數(shù)據(jù)中提取。這種分離的體系結(jié)構(gòu)顯著提高了靈活性,敏捷性,數(shù)據(jù)保護和規(guī)模。
Cloudera Enterprise Data Hub
Cloudera Enterprise Data Hub是一款用于數(shù)據(jù)驅(qū)動的云優(yōu)先型企業(yè)的平臺。適用于任何云上的多功能分析,并且具有可應用于任何地方的一致性安全和治理。您可以訪問當前隱藏在數(shù)據(jù)中的無限未開發(fā)的機會。也將從靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)中獲得無與倫比的價值,讓您在更大和更深入的環(huán)境中探索您的數(shù)據(jù)。
查看詳情

產(chǎn)品優(yōu)勢
-
隨時隨地構(gòu)建AI解決方案
幫助客戶從技術(shù)和實踐的角度進行轉(zhuǎn)變,縮短企業(yè)M取得成果的時間。借助現(xiàn)代化的開放平臺和企業(yè)工具,使客戶能夠在任何地方大規(guī)模,高效,安全地構(gòu)建和部署AI解決方案。
-
優(yōu)化的數(shù)據(jù)倉庫
為應對現(xiàn)代數(shù)據(jù)挑戰(zhàn),并為您所需的各種高價值BI和分析用例提供機會,補充了不再能經(jīng)濟高效地滿足這些新需求的傳統(tǒng)數(shù)據(jù)倉庫。
-
廣泛的分析引擎套件
Cloudera提供了一套集成的分析引擎套件,范圍從流和批處理數(shù)據(jù)到數(shù)據(jù)倉庫,運營數(shù)據(jù)庫和機器學習。Cloudera SDX應用一致的安全性和治理,使用戶可以共享和發(fā)現(xiàn)數(shù)據(jù)以供跨工作負載使用。在開源創(chuàng)新的推動下,Cloudera的數(shù)據(jù)平臺提供了最大的靈活性,因此您可以專注于數(shù)據(jù),應用程序和業(yè)務。
Cloudera Machine Learning
Cloudera Machine Learning使團隊可以立即部署機器學習工作空間,這些工作空間可以自動擴展以適應他們的需求,并可以通過使用kubernetes自動掛起以節(jié)省成本。 所有這些都打包成可移植的體驗,多個團隊成員可以輕松訪問這些體驗,以在整個組織中提供一致的體驗。
查看詳情
產(chǎn)品優(yōu)勢
-
自助式數(shù)據(jù)訪問
借助Cloudera Machine Learning,管理員可以輕松地在混合和多云環(huán)境中復制受控數(shù)據(jù)集,以使數(shù)據(jù)科學團隊可以自助訪問他們所需的業(yè)務數(shù)據(jù),同時保持企業(yè)數(shù)據(jù)安全性和治理控制。
-
全面,凝聚的用戶體驗
商業(yè)ML需要數(shù)據(jù)工程,模型培訓和實驗跟蹤,以及在生產(chǎn)中部署和管理模型。Cloudera機器學習為團隊提供一個在一個緊密結(jié)合的環(huán)境中完成所有工作的工具,而無需切換或縫合。
-
便捷的ML工作區(qū)
Cloudera Machine Learning使管理員只需單擊幾下即可為團隊部署新的機器學習工作區(qū),使數(shù)據(jù)科學團隊無需等待即可訪問端對端ML所需的項目環(huán)境和資源。
Cloudera Data Warehouse
Cloudera Data Warehouse是一種自動擴展,高度并發(fā)且具有成本效益的分析服務,可從結(jié)構(gòu)化,非結(jié)構(gòu)化和邊緣源隨時隨地提取大規(guī)模數(shù)據(jù)。它通過在內(nèi)部部署和任何云之間無縫移動工作負載以支持報表和儀表板,即席和高級分析(包括AI),并具有一致的安全性和治理,從而支持混合和多云基礎架構(gòu)模型。
查看詳情
產(chǎn)品優(yōu)勢
-
優(yōu)化工作負載
數(shù)據(jù)倉庫和數(shù)據(jù)集市已針對您的工作負載進行了自動優(yōu)化。這包括預配置軟件和創(chuàng)建不同的緩存層,這意味著您無需參與復雜的容量規(guī)劃或調(diào)整。
-
自動擴展
通過自動擴展,可以擴展和縮減虛擬倉庫實例,以便它們可以滿足您不斷變化的工作負載需求,并在不需要時節(jié)省云資源成本。
-
自動配置和隔離
自動配置每個數(shù)據(jù)倉庫和數(shù)據(jù)集市,可以調(diào)整一些設置來滿足您的需求。使用之后,您可以輕松地將嘈雜的鄰居工作負載卸載到它的Virtual Warehouse實例中,以便其他租戶可以訪問足夠的計算資源以使其工作負載完成并滿足其SLA。
-
混合云和多云
利用從本地到任何云的任一位置組合任一數(shù)據(jù),從而幫助一起管理所有類型的工作負載。混合和多云部署模型可確保所有分析工作負載快速,大規(guī)模地執(zhí)行,而不管工作負載和用戶數(shù)量如何。
Cloudera DataFlow
Cloudera DataFlow(CDF),以前稱為Hortonworks DataFlow(HDF),是一個可擴展的實時流分析平臺,它可以攝取、組織和分析數(shù)據(jù),以獲取關鍵洞察和即時的可操作情報。
查看詳情
產(chǎn)品優(yōu)勢
-
減少數(shù)據(jù)集成開發(fā)時間
CDF提供了一個簡單的可視化UI,用于構(gòu)建復雜的數(shù)據(jù)流,以完成各種數(shù)據(jù)源的主要數(shù)據(jù)提取,轉(zhuǎn)換和充實。CDF 在Apache NiFi的支持下,快速提取數(shù)據(jù),從而生成實時流數(shù)據(jù)。
-
快速獲取實時見解
使用流媒體平臺Apache Kafka,CDF每秒可處理數(shù)百萬筆交易,識別關鍵模式,與機器學習模型進行比較,并提供預測性/規(guī)范性分析,幫助業(yè)務領導者做出關鍵決策并抓住機遇。
-
安全無縫傳輸數(shù)據(jù)
使用帶有Minifi的NiFi輕松地從邊緣傳輸數(shù)據(jù),從而建立廣泛分布的IoT部署模型以進行區(qū)域數(shù)據(jù)收集。與Apache Ranger的緊密集使CDF提供跨移動數(shù)據(jù)和靜態(tài)數(shù)據(jù)的無縫安全性。
-
開箱即用的合規(guī)性
CDF是業(yè)內(nèi)唯一提供開箱即用的數(shù)據(jù)出處和從邊緣到企業(yè)的數(shù)據(jù)治理的產(chǎn)品。CDF中的NiFi無需任何額外的配置或設置即可提供數(shù)據(jù)來源跟蹤。通過與Apache Atlas的緊密集成,您可以完全控制從邊緣到企業(yè)的數(shù)據(jù)。
Cloudera案例推薦:
某大型券商機構(gòu)智能大數(shù)據(jù)營銷平臺
某大型股份制商業(yè)銀行智能大數(shù)據(jù)營銷平臺
Cloudera助力中國大地保險實現(xiàn)大數(shù)據(jù)應用平臺
大數(shù)據(jù)助力航旅企業(yè)信息化建設,為客戶創(chuàng)造完美出行體驗
慧都大數(shù)據(jù)專業(yè)團隊為企業(yè)提供Cloudera大數(shù)據(jù)平臺搭建,免費業(yè)務咨詢,定制開發(fā)等完整服務,快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
歡迎撥打慧都熱線023-68661681,我們將幫您轉(zhuǎn)接大數(shù)據(jù)專業(yè)團隊,并發(fā)送相關資料給您!
標簽:
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務必注明出處、不得修改原文相關鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn