隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日(ri)頭(tou)條(tiao)是北京(jing)字(zi)節跳動科技有限公(gong)司開發(fa)的(de)(de)一(yi)款基(ji)于(yu)數據挖掘的(de)(de)引擎產(chan)品,為(wei)用戶信(xin)(xin)息,提供連接人(ren)與信(xin)(xin)息的(de)(de)服務的(de)(de)產(chan)品。由張一(yi)鳴于(yu)2012年(nian)3月(yue)創建,2012年(nian)8月(yue)發(fa)布版本。
基于個(ge)(ge)性(xing)化引(yin)擎技(ji)術,根據(ju)每(mei)個(ge)(ge)用戶的興(xing)趣、位置等(deng)多(duo)個(ge)(ge)維度進(jin)行個(ge)(ge)性(xing)化,內(nei)容不僅(jin)包(bao)括(kuo)狹義上(shang)的新聞,還(huan)包(bao)括(kuo)音樂(le)、電影、游戲(xi)、購物(wu)等(deng)資訊。
根據其社交行為(wei)、閱讀行為(wei)、地理(li)位置、職(zhi)業、年齡等挖(wa)掘出興(xing)趣。通過社交行為(wei)分析,5秒(miao)鐘計(ji)算(suan)出用戶(hu)興(xing)趣;通過用戶(hu)行為(wei)分析,用戶(hu)每(mei)次(ci)動作后,10秒(miao)內(nei)更新用戶(hu)模(mo)型。
對(dui)每條信息(xi)提取(qu)幾十個到幾百個高維特征,并進行降維、相似(si)計算(suan)、聚(ju)類等計算(suan)去除重復信息(xi);對(dui)信息(xi)進行機器分(fen)類、摘要抽取(qu),LDA主題分(fen)析、信息(xi)質量識別等處理。
根(gen)據人的特征、環境特征、文章特征三者(zhe)的匹配(pei)程度進行。0.1秒(miao)內計算結果,3秒(miao)完(wan)成文章提取、挖(wa)掘、消重、分類,5秒(miao)計算出(chu)新(xin)用戶(hu)興趣分配(pei),10秒(miao)內更新(xin)用戶(hu)模型。