Greenplum是全球優秀(xiu)的大數據分析引(yin)擎,專為分析、機器學習和AI而打造。
Greenplum創建和部署復雜模型,大量(liang)數百節(jie)點集(ji)群為全(quan)球優秀企業生產系(xi)統提供服務,被廣(guang)泛(fan)應用于網絡安全(quan),預測性維護,風險管理,欺(qi)詐檢測等(deng)領域(yu)。
Greenplum大數據平臺基于MPP(大規模并行處理)架構(gou),具有強大的(de)內核技術(shu),包括數據水平分布、并行(xing)查詢執行(xing)、優化器、線(xian)性擴展能力、多態存儲、資源管理、高(gao)(gao)可用、高(gao)(gao)速數據加載(zai)等。
Greenplum支持(chi)多(duo)種數(shu)(shu)(shu)據(ju)源和數(shu)(shu)(shu)據(ju)格式,支持(chi)各(ge)種數(shu)(shu)(shu)據(ju)源,包括(kuo)Hadoop、HIVE、HBase、S3、Gemfire、各(ge)種數(shu)(shu)(shu)據(ju)庫(ku)和文件(jian)等(deng),不(bu)需要移動數(shu)(shu)(shu)據(ju),避免了數(shu)(shu)(shu)據(ju)加載的復雜性,和其帶來的數(shu)(shu)(shu)據(ju)不(bu)一致的問題(ti)。不(bu)管是結構(gou)化(hua)、半結構(gou)化(hua)(XML、JSON、KV)還是非結構(gou)化(hua),譬如文本數(shu)(shu)(shu)據(ju)、GIS數(shu)(shu)(shu)據(ju)、圖(tu)數(shu)(shu)(shu)據(ju)等(deng)。
Greenplum的存(cun)(cun)儲支持堆表,以(yi)(yi)及面向行存(cun)(cun)或列存(cun)(cun)的追加表。用戶(hu)可(ke)以(yi)(yi)創建基(ji)于任意存(cun)(cun)儲類型的分(fen)(fen)區表,同時可(ke)以(yi)(yi)靈(ling)活配置表和(he)分(fen)(fen)區的壓縮類型、壓縮級別和(he)存(cun)(cun)儲塊大小(xiao)等參數。