Greenplum是全球優秀的(de)大數據分(fen)析(xi)引(yin)擎,專(zhuan)為分(fen)析(xi)、機器學習和(he)AI而打造。
Greenplum創建和(he)部署復雜模型,大量數百節(jie)點集群(qun)為全球優秀(xiu)企業生產系統提供服務,被廣泛(fan)應(ying)用于(yu)網絡安全,預(yu)測(ce)性(xing)維護,風險(xian)管理,欺詐檢測(ce)等領域。
Greenplum大數據平臺基于MPP(大規模并行處理)架構,具有強(qiang)大的內核技術,包(bao)括數據水(shui)平分布、并行查詢執(zhi)行、優化器、線(xian)性擴展能力、多態存儲、資源(yuan)管理、高可用、高速(su)數據加(jia)載等。
Greenplum支持(chi)多(duo)種數(shu)(shu)(shu)(shu)據(ju)源(yuan)和(he)數(shu)(shu)(shu)(shu)據(ju)格式,支持(chi)各種數(shu)(shu)(shu)(shu)據(ju)源(yuan),包括Hadoop、HIVE、HBase、S3、Gemfire、各種數(shu)(shu)(shu)(shu)據(ju)庫(ku)和(he)文件等(deng),不(bu)需要移動(dong)數(shu)(shu)(shu)(shu)據(ju),避免了(le)數(shu)(shu)(shu)(shu)據(ju)加(jia)載的(de)復雜性,和(he)其(qi)帶來的(de)數(shu)(shu)(shu)(shu)據(ju)不(bu)一致的(de)問題。不(bu)管是(shi)結(jie)(jie)構化、半結(jie)(jie)構化(XML、JSON、KV)還是(shi)非結(jie)(jie)構化,譬(pi)如文本數(shu)(shu)(shu)(shu)據(ju)、GIS數(shu)(shu)(shu)(shu)據(ju)、圖數(shu)(shu)(shu)(shu)據(ju)等(deng)。
Greenplum的(de)(de)存儲支持堆表,以(yi)及(ji)面向行存或列存的(de)(de)追加(jia)表。用戶(hu)可以(yi)創建基(ji)于任(ren)意存儲類型的(de)(de)分區表,同(tong)時可以(yi)靈活配(pei)置(zhi)表和分區的(de)(de)壓(ya)(ya)縮類型、壓(ya)(ya)縮級別和存儲塊(kuai)大小等參數。