隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日頭條是(shi)北京字節(jie)跳動科技(ji)有限公(gong)司開發的一(yi)(yi)款(kuan)基于數據挖掘的引擎(qing)產(chan)品,為用戶信息(xi),提供連接人與信息(xi)的服務的產(chan)品。由張一(yi)(yi)鳴于2012年3月創(chuang)建,2012年8月發布版本。
基(ji)于個(ge)性化(hua)引擎技術(shu),根據每個(ge)用戶的興趣、位置等多個(ge)維度進行(xing)個(ge)性化(hua),內容不僅包(bao)括狹義上的新聞,還包(bao)括音樂(le)、電影、游(you)戲(xi)、購物等資訊。
根(gen)據(ju)其社交(jiao)行(xing)為、閱讀(du)行(xing)為、地理位置、職業、年齡等(deng)挖掘出興(xing)趣。通過社交(jiao)行(xing)為分析,5秒鐘計算出用戶興(xing)趣;通過用戶行(xing)為分析,用戶每次動作后,10秒內(nei)更新(xin)用戶模型。
對每條信(xin)(xin)息(xi)提取幾(ji)(ji)十個(ge)到(dao)幾(ji)(ji)百個(ge)高(gao)維特征,并進行(xing)降維、相似計算(suan)、聚類等(deng)計算(suan)去除重復信(xin)(xin)息(xi);對信(xin)(xin)息(xi)進行(xing)機器分類、摘要(yao)抽取,LDA主題分析、信(xin)(xin)息(xi)質(zhi)量(liang)識別(bie)等(deng)處理。
根據(ju)人的特(te)征(zheng)(zheng)、環境特(te)征(zheng)(zheng)、文章特(te)征(zheng)(zheng)三(san)者的匹配程(cheng)度(du)進行。0.1秒內計算結果,3秒完成文章提(ti)取(qu)、挖掘、消重、分(fen)類,5秒計算出(chu)新用戶(hu)興(xing)趣(qu)分(fen)配,10秒內更新用戶(hu)模型。