Greenplum是(shi)全球優秀(xiu)的大數據(ju)分析引擎,專為分析、機器(qi)學習和AI而打(da)造。
Greenplum創建(jian)和部署(shu)復雜模(mo)型,大量數百節點集群為(wei)全球優(you)秀(xiu)企業生產系統(tong)提供服務,被廣泛應用(yong)于網絡安全,預(yu)測性維護,風險管理,欺詐(zha)檢測等領域。
Greenplum大數據平臺基于MPP(大規模并行處理)架(jia)構,具有強大的內核(he)技術,包括數據(ju)水平分布、并行查(cha)詢(xun)執行、優化器、線性擴(kuo)展能(neng)力、多態(tai)存(cun)儲、資源管理、高(gao)(gao)可(ke)用、高(gao)(gao)速數據(ju)加(jia)載等(deng)。
Greenplum支持多(duo)種(zhong)數(shu)(shu)據(ju)(ju)源和(he)數(shu)(shu)據(ju)(ju)格式,支持各(ge)種(zhong)數(shu)(shu)據(ju)(ju)源,包括Hadoop、HIVE、HBase、S3、Gemfire、各(ge)種(zhong)數(shu)(shu)據(ju)(ju)庫和(he)文(wen)件等,不(bu)需要移動數(shu)(shu)據(ju)(ju),避免了數(shu)(shu)據(ju)(ju)加載的(de)(de)復雜性,和(he)其(qi)帶來(lai)的(de)(de)數(shu)(shu)據(ju)(ju)不(bu)一(yi)致的(de)(de)問題。不(bu)管是結(jie)構(gou)(gou)化(hua)(hua)、半結(jie)構(gou)(gou)化(hua)(hua)(XML、JSON、KV)還是非結(jie)構(gou)(gou)化(hua)(hua),譬如文(wen)本(ben)數(shu)(shu)據(ju)(ju)、GIS數(shu)(shu)據(ju)(ju)、圖數(shu)(shu)據(ju)(ju)等。
Greenplum的存(cun)儲(chu)支(zhi)持堆(dui)表,以(yi)(yi)及面向行存(cun)或列存(cun)的追加表。用(yong)戶可(ke)以(yi)(yi)創建基于任意存(cun)儲(chu)類(lei)型的分(fen)區表,同時可(ke)以(yi)(yi)靈活配(pei)置表和(he)分(fen)區的壓縮類(lei)型、壓縮級別和(he)存(cun)儲(chu)塊大小等參數。