Greenplum是(shi)全球優秀的大數(shu)據分析引擎,專(zhuan)為分析、機(ji)器學習和AI而打造。
Greenplum創建和部署復(fu)雜(za)模(mo)型(xing),大量數百節點集群為(wei)全(quan)球優(you)秀企業生產系統提供(gong)服務,被廣泛應用于網絡安全(quan),預(yu)測性維護,風險管理,欺詐(zha)檢測等(deng)領域。
Greenplum大數據平臺基于MPP(大規模并行處理)架構,具有強大(da)的內核技術,包括數據水平分布、并行查詢執行、優化器、線性擴(kuo)展(zhan)能力(li)、多態存儲、資源(yuan)管(guan)理(li)、高可用、高速數據加載(zai)等(deng)。
Greenplum支(zhi)持(chi)(chi)多(duo)種數(shu)據(ju)源和(he)數(shu)據(ju)格(ge)式(shi),支(zhi)持(chi)(chi)各(ge)種數(shu)據(ju)源,包(bao)括Hadoop、HIVE、HBase、S3、Gemfire、各(ge)種數(shu)據(ju)庫和(he)文(wen)件等,不需要移動數(shu)據(ju),避免了數(shu)據(ju)加(jia)載的(de)(de)復雜性,和(he)其帶來的(de)(de)數(shu)據(ju)不一致的(de)(de)問題。不管是結構化、半(ban)結構化(XML、JSON、KV)還是非結構化,譬(pi)如文(wen)本數(shu)據(ju)、GIS數(shu)據(ju)、圖數(shu)據(ju)等。
Greenplum的存(cun)(cun)(cun)儲支持堆表(biao)(biao),以及面向行存(cun)(cun)(cun)或列(lie)存(cun)(cun)(cun)的追加表(biao)(biao)。用戶(hu)可以創(chuang)建基于任意存(cun)(cun)(cun)儲類型的分(fen)區表(biao)(biao),同時可以靈(ling)活配置表(biao)(biao)和分(fen)區的壓縮(suo)類型、壓縮(suo)級別和存(cun)(cun)(cun)儲塊(kuai)大小等(deng)參數。