隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日頭條是北京字節跳動科技有限公(gong)司開發的一款基于(yu)數(shu)據挖掘的引擎產品,為用戶信(xin)(xin)息,提供連(lian)接(jie)人(ren)與信(xin)(xin)息的服務的產品。由張一鳴于(yu)2012年3月(yue)創建,2012年8月(yue)發布(bu)版本(ben)。
基于個(ge)性(xing)(xing)化(hua)引擎(qing)技術,根(gen)據每(mei)個(ge)用(yong)戶的興趣、位置等多個(ge)維度進行個(ge)性(xing)(xing)化(hua),內容不(bu)僅包括狹義上(shang)的新(xin)聞,還包括音樂、電影、游(you)戲(xi)、購物(wu)等資訊。
根據其社交行為(wei)、閱(yue)讀行為(wei)、地(di)理位置、職業、年(nian)齡等(deng)挖掘出興(xing)趣(qu)。通過社交行為(wei)分析(xi),5秒鐘計(ji)算(suan)出用戶(hu)(hu)(hu)興(xing)趣(qu);通過用戶(hu)(hu)(hu)行為(wei)分析(xi),用戶(hu)(hu)(hu)每(mei)次動作后,10秒內(nei)更新(xin)用戶(hu)(hu)(hu)模型。
對每(mei)條信息(xi)(xi)提取幾十個到幾百(bai)個高維特(te)征,并(bing)進行(xing)降維、相似計(ji)算(suan)、聚類等計(ji)算(suan)去除重(zhong)復信息(xi)(xi);對信息(xi)(xi)進行(xing)機器分類、摘要(yao)抽(chou)取,LDA主題(ti)分析、信息(xi)(xi)質量識別等處理。
根(gen)據人(ren)的特征(zheng)、環境(jing)特征(zheng)、文章特征(zheng)三(san)者(zhe)的匹配程度進行(xing)。0.1秒(miao)(miao)內(nei)(nei)計算結果,3秒(miao)(miao)完成(cheng)文章提取(qu)、挖(wa)掘、消重(zhong)、分(fen)類,5秒(miao)(miao)計算出新用戶興(xing)趣(qu)分(fen)配,10秒(miao)(miao)內(nei)(nei)更新用戶模(mo)型。