隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日頭條(tiao)是北京(jing)字節(jie)跳動科技(ji)有(you)限公(gong)司(si)開(kai)發的(de)一款基于數(shu)據挖掘的(de)引擎產(chan)(chan)品,為用戶信(xin)息,提供連(lian)接人與信(xin)息的(de)服務(wu)的(de)產(chan)(chan)品。由(you)張(zhang)一鳴于2012年3月(yue)創(chuang)建(jian),2012年8月(yue)發布版(ban)本。
基于個(ge)性化引擎技術(shu),根據每個(ge)用(yong)戶的興趣(qu)、位置(zhi)等(deng)多個(ge)維度進行個(ge)性化,內容(rong)不僅包括狹義上的新聞,還(huan)包括音樂(le)、電(dian)影、游戲、購物等(deng)資訊。
根據其社交行(xing)(xing)為、閱讀行(xing)(xing)為、地(di)理(li)位(wei)置(zhi)、職業、年齡等(deng)挖掘出(chu)興趣。通(tong)過社交行(xing)(xing)為分析(xi),5秒(miao)鐘計算(suan)出(chu)用戶(hu)興趣;通(tong)過用戶(hu)行(xing)(xing)為分析(xi),用戶(hu)每次動作(zuo)后,10秒(miao)內(nei)更新用戶(hu)模型。
對每條信息(xi)提取幾十個到幾百個高(gao)維特征,并(bing)進行降維、相似計(ji)(ji)算(suan)、聚(ju)類等(deng)計(ji)(ji)算(suan)去除重復信息(xi);對信息(xi)進行機(ji)器(qi)分(fen)類、摘要(yao)抽取,LDA主題分(fen)析、信息(xi)質量識別等(deng)處理。
根據人的特征、環境特征、文章特征三(san)者的匹配(pei)程(cheng)度進行(xing)。0.1秒(miao)內計算(suan)結果,3秒(miao)完(wan)成文章提取、挖(wa)掘、消重、分類,5秒(miao)計算(suan)出(chu)新用戶興趣分配(pei),10秒(miao)內更新用戶模(mo)型。