華為

蘋果

海爾

美的

小米

大疆

科大訊飛

聯想

飛利浦

三星

處理器的大腦讀懂CPU指令集

本文章由注冊用戶擼白人森上傳提供評論發布反饋 0

摘要：CPU知識入門-特點-分類篇:文章對CPU指令集做了詳細的介紹說明。在支持SSE4指令集的處理器上，只需要采用4 SAD運算指令便完全代替了繁復的指令串，大幅提升動態預測及差分編碼的運算速度。

處理器的(de)大腦讀懂(dong)CPU指令集

在我(wo)們(men)對(dui)一(yi)款(kuan)CPU進(jin)行全面的了解的時候，我(wo)們(men)看(kan)看(kan)大(da)多(duo)數人都遺漏了什(shen)么。很多(duo)人一(yi)般先(xian)從處理器的架(jia)構開始，看(kan)看(kan)該處理器采用(yong)了什(shen)么架(jia)構，相比上(shang)一(yi)代或者競爭對(dui)手的CPU在架(jia)構上(shang)都有什(shen)么改進(jin)或者優勢。

其次，再(zai)看這款CPU與同檔(dang)次的(de)(de)(de)處(chu)理器的(de)(de)(de)主頻孰高(gao)(gao)孰低，默認高(gao)(gao)主頻的(de)(de)(de)處(chu)理器一(yi)般(ban)是采(cai)用較(jiao)好(hao)的(de)(de)(de)晶圓來制造的(de)(de)(de)，穩(wen)定(ding)性更好(hao)，再(zai)次是看該處(chu)理器的(de)(de)(de)緩存(cun)容量(liang)有多少（尤其是Intel的(de)(de)(de)處(chu)理器非常(chang)依賴緩存(cun)），緩存(cun)充當(dang)處(chu)理器與緩存(cun)之(zhi)間的(de)(de)(de)橋梁，起(qi)到一(yi)定(ding)的(de)(de)(de)數(shu)據緩沖(chong)作用。

全面了解處理器

最后(hou)我們(men)要(yao)看該處理器采(cai)用的制(zhi)程，一般制(zhi)程越(yue)(yue)先進，發熱量越(yue)(yue)低，而相對越(yue)(yue)好超(chao)，而比較關注節能性能的網友(you)，還會著重看該處理器的功耗為(wei)多少(shao)。那么(me)我們(men)看完這(zhe)些(xie)參數是不(bu)是漏了(le)些(xie)什么(me)呢？

其實仔細想想，我們會恍然大(da)悟，還有該處(chu)理器(qi)支(zhi)持的指令(ling)(ling)集。處(chu)理器(qi)單靠里面的硬件電路是不會計(ji)算(suan)的，必須(xu)依靠指令(ling)(ling)來計(ji)算(suan)和控制(zhi)系統。

● CPU指令集至關重要

每款(kuan)CPU設計的(de)時候就(jiu)制定了(le)一(yi)套與內部電路配合的(de)指(zhi)令系統，從具體運用看(kan)，我們可以(yi)在(zai)很多CPU身上看(kan)到的(de)就(jiu)有MMX（Multi Media Extended）、SSE（Streaming SIMD Extensions）、SSE2、SSE3、SSSE3、SSE4（分為SSE4.1與SSE4.2兩代，AMD的(de)SSE4A包含在(zai)SSE4里面，這(zhe)個(ge)后面會提到），另外還有AMD的(de)3D NOW！系列。

這些(xie)指(zhi)令集(ji)可謂大大增強了CPU的多媒體(ti)、圖(tu)形圖(tu)象和Internet等的處理能力(li)，下面就讓我們逐個了解下。

● MMX增強多媒體表現

MMX（Multi Media eXtension，多媒體擴(kuo)展(zhan)指(zhi)令(ling)(ling)集(ji)）指(zhi)令(ling)(ling)集(ji)是(shi)英特爾于1996年(nian)推(tui)出，主要用于多媒體指(zhi)令(ling)(ling)增強。

MMX指令(ling)集(ji)中包括(kuo)有57條多(duo)媒體指令(ling)，通(tong)過(guo)這些指令(ling)可(ke)以(yi)一次處(chu)理(li)多(duo)個(ge)數據，在(zai)處(chu)理(li)結(jie)果超過(guo)實際(ji)處(chu)理(li)能(neng)力的時候也能(neng)進行正(zheng)常處(chu)理(li)。MMX的益處(chu)在(zai)于，當時存(cun)在(zai)的操作(zuo)系(xi)統不必為此而做(zuo)出任(ren)何修改便(bian)可(ke)以(yi)輕(qing)松地(di)執(zhi)行MMX程序。

支(zhi)(zhi)持MMX的(de)處(chu)理(li)器(qi)擁有8個MMX寄(ji)存(cun)器(qi)，每(mei)個有64-bit（8byte）的(de)容量(liang)。MMX僅支(zhi)(zhi)持整數操作，支(zhi)(zhi)持1/2/4/8-bytes數據(ju)。那(nei)即是說，一個MMX寄(ji)存(cun)器(qi)能夠儲存(cun)8/4/2/1個操作。這(zhe)造(zao)成了MMX指令集與x87浮點運算指令不(bu)能夠同時執行，必須做密(mi)集式的(de)交錯(cuo)切(qie)換才(cai)可以(yi)正常執行，這(zhe)種情況就勢必造(zao)成整個系統(tong)運行質量(liang)的(de)下(xia)降。目前AMD和和英特爾處(chu)理(li)器(qi)都支(zhi)(zhi)持這(zhe)一指令集。

● 3D NOW!加速三維渲染

3DNow!指令(ling)集是(shi)由AMD提出(chu)的，廣泛應用于其(qi)K6-2 、K6-3以及Athlon（K7）處理(li)器上。3DNow!跟(gen)后面提到(dao)的SSE非(fei)(fei)(fei)常類似(si)，但也有一些(xie)不(bu)同。它擁有 8個(ge)新的寄存(cun)器，卻是(shi)64-bit的，并非(fei)(fei)(fei)128-bit。這樣，它只能存(cun)儲兩個(ge)浮點數(shu)據，而非(fei)(fei)(fei)四個(ge)。

K6處理器開始具有3D NOW!指令集

3DNow！可以執(zhi)行操作：相加/相乘 /相除運算，精確或者(zhe)近似平(ping)分根。3DNow!指(zhi)令集技術其實就是21條機器碼(ma)的(de)擴展指(zhi)令集。3DNow!指(zhi)令集主要針對(dui)三維(wei)建模、坐(zuo)標變換和(he)效(xiao)果渲染等(deng)三維(wei)應(ying)用場合(he)，在(zai)軟(ruan)件的(de)配合(he)下，可以大幅(fu)度提高3D處理性能。后來在(zai)Athlon上開(kai)發了Enhanced 3DNow!。

● SSE加快處理多媒體應用

SSE全(quan)拼是Streaming SIMD Extension，中(zhong)文名(ming)稱(cheng)為SIMD擴展流。SIMD英文全(quan)稱(cheng)為 Single Istruction Multiple Data（單指令多(duo)數據），即(ji)一條(tiao)指令可以完成多(duo)個(ge)操作。SSE是為提供處理器浮(fu)點性(xing)能(neng)而(er)開發的(de)擴展指令集(ji)。

SSE指(zhi)令(ling)集包(bao)括了70條指(zhi)令(ling)，其中包(bao)含單指(zhi)令(ling)多數據浮點計算、以(yi)及(ji)額外的(de)(de)SIMD整(zheng)數和高(gao)(gao)速緩存控制指(zhi)令(ling)。其優勢包(bao)括：更(geng)高(gao)(gao)分辨率的(de)(de)圖像瀏覽和處理(li)、高(gao)(gao)質(zhi)量音頻、MPEG2視頻、同(tong)時MPEG2加解密；語音識別占用更(geng)少CPU資源；更(geng)高(gao)(gao)精度和更(geng)快響應速度。

SSE指(zhi)令(ling)與3DNow!指(zhi)令(ling)彼(bi)此互不(bu)兼(jian)容(rong)，但SSE包含了3DNow!技術的絕大部(bu)分(fen)功能，只是實現的方法不(bu)同。SSE兼(jian)容(rong)MMX指(zhi)令(ling)，它(ta)可(ke)以通過SIMD和單時鐘周期并行處理多個浮點數據來有效地提高浮點運算速度。

SSE(Streaming SIMD Extensions)是(shi)(shi)(shi)英特爾在(zai)(zai)AMD的(de)(de)(de)3D Now!發布(bu)一年之后(hou)，在(zai)(zai)其計(ji)算機芯(xin)片Pentium III中(zhong)引(yin)入的(de)(de)(de)指令(ling)集，是(shi)(shi)(shi)MMX的(de)(de)(de)超(chao)集。AMD后(hou)來在(zai)(zai)Athlon XP中(zhong)加(jia)入了對這(zhe)個(ge)指令(ling)集的(de)(de)(de)支持。這(zhe)個(ge)指令(ling)集增加(jia)了對8個(ge)128位寄存(cun)(cun)器(qi)XMM0-XMM7的(de)(de)(de)支持，每個(ge)寄存(cun)(cun)器(qi)可(ke)以存(cun)(cun)儲4個(ge)單精度浮(fu)點數(shu)(shu)(shu)。使(shi)用這(zhe)些寄存(cun)(cun)器(qi)的(de)(de)(de)程(cheng)序必須使(shi)用FXSAVE和FXRSTR指令(ling)來保持和恢復狀態。但(dan)是(shi)(shi)(shi)在(zai)(zai)Pentium III對SSE的(de)(de)(de)實現中(zhong)，浮(fu)點數(shu)(shu)(shu)寄存(cun)(cun)器(qi)又一次被新的(de)(de)(de)指令(ling)集占用了，但(dan)是(shi)(shi)(shi)這(zhe)一次切(qie)換運算模式不是(shi)(shi)(shi)必要的(de)(de)(de)了，只是(shi)(shi)(shi)SSE和浮(fu)點數(shu)(shu)(shu)指令(ling)不能同時進(jin)入CPU的(de)(de)(de)處(chu)理線而已。

● SSE2 更精確處理浮點數

SSE2是英特(te)爾為(wei)了應(ying)對AMD的(de)3Dnow!+指(zhi)令集，在(zai)SSE的(de)基礎上開發了SSE2，增加了一些指(zhi)令，使得(de)其處理器性能有(you)大幅度提高。

最(zui)早在Pentium 4處(chu)理器(qi)的最(zui)初版本(ben)中引入(ru)，AMD后來在Opteron 和Athlon 64處(chu)理器(qi)中也加入(ru)了(le)SSE2的支持。到P4設(she)計結(jie)束為止，Intel增加了(le)一(yi)套包括144條新建(jian)指(zhi)令的SSE2指(zhi)令集。SSE2涉及了(le)多(duo)重的數(shu)(shu)據目標上(shang)立刻(ke)執行一(yi)單(dan)個的指(zhi)令（即(ji)SIMD）。最(zui)重要的是SSE2能處(chu)理128位和兩倍精密浮點數(shu)(shu)學(xue)運算。

處(chu)理(li)更精確浮點數的能力使SSE2成為加(jia)速多媒體程(cheng)序、3D處(chu)理(li)工(gong)程(cheng)以及工(gong)作站類型任務(wu)的基礎配置。

SSE2指(zhi)令集添(tian)加(jia)(jia)了對(dui)64位(wei)雙(shuang)精度浮點數的(de)支(zhi)持(chi)(chi)，以及對(dui)整型數據的(de)支(zhi)持(chi)(chi)，也(ye)就是(shi)說這(zhe)個(ge)指(zhi)令集中(zhong)所有(you)的(de)MMX指(zhi)令都是(shi)多余(yu)的(de)了，同(tong)時(shi)也(ye)避免了占用浮點數寄存器(qi)。這(zhe)個(ge)指(zhi)令集還增加(jia)(jia)了對(dui)CPU快取的(de)控(kong)制指(zhi)令。AMD對(dui)它的(de)擴展增加(jia)(jia)了8個(ge)XMM寄存器(qi)，但是(shi)需要(yao)切(qie)換(huan)到64位(wei)模式（AMD64）才可(ke)以使用這(zhe)些寄存器(qi)。Intel后(hou)來在其(qi)EM64T架構中(zhong)也(ye)增加(jia)(jia)了對(dui)AMD64的(de)支(zhi)持(chi)(chi)。

● SSE3促進五個應用

SSE3指令(ling)(ling)集是規(gui)模最小(xiao)的指令(ling)(ling)集，此前MMX包含(han)(han)有57條命(ming)令(ling)(ling)，SSE包含(han)(han)有50條命(ming)令(ling)(ling)，SSE2包含(han)(han)有144條命(ming)令(ling)(ling)，SSE3包含(han)(han)有13條命(ming)令(ling)(ling)。此外Intel害針(zhen)對SSE3指令(ling)(ling)集作了一(yi)次額(e)外擴充，那就是SSSE3是，最早內建于Core 2 Duo處理器(qi)中。

SSE3指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)集共分為5個應用(yong)層(ceng)：第一(yi)層(ceng)是(shi)(shi)(shi)“數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)傳輸”，只有(you)(you)(you)一(yi)條(tiao)(tiao)指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)：FISTTP，它(ta)有(you)(you)(you)利于x87浮點轉(zhuan)換成(cheng)整數(shu)(shu)(shu)，并可以(yi)(yi)大(da)大(da)提高優(you)(you)化(hua)的(de)效率。第二層(ceng)是(shi)(shi)(shi)“數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)處(chu)(chu)理(li)”，指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)共有(you)(you)(you)五條(tiao)(tiao)，分別(bie)是(shi)(shi)(shi)ADDSUBPS，ADDSUBPD，MOVSHDUP，MOVSLDUP，MOVDDUP。這些指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)可以(yi)(yi)簡化(hua)復雜(za)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)處(chu)(chu)理(li)過程(cheng)(cheng)，由(you)于未(wei)來(lai)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)處(chu)(chu)理(li)流(liu)量將會越(yue)來(lai)越(yue)大(da)，因此(ci)Intel在這里應用(yong)的(de)指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)集最多、達到了(le)五條(tiao)(tiao)。第三(san)層(ceng)是(shi)(shi)(shi)“特殊處(chu)(chu)理(li)”，也只有(you)(you)(you)一(yi)條(tiao)(tiao)：LDDQU。在這條(tiao)(tiao)指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)主要針對(dui)視頻解碼，用(yong)來(lai)提高處(chu)(chu)理(li)器對(dui)處(chu)(chu)理(li)媒體數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)結果的(de)精(jing)確性。第四層(ceng)是(shi)(shi)(shi)“優(you)(you)化(hua)”，共有(you)(you)(you)四條(tiao)(tiao)指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)，分別(bie)是(shi)(shi)(shi)HADDPS，HSUBPS，HADDPD，HSUBPD，它(ta)們可以(yi)(yi)對(dui)程(cheng)(cheng)序(xu)起(qi)到自(zi)動優(you)(you)化(hua)的(de)作(zuo)用(yong)，對(dui)處(chu)(chu)理(li)3D圖形(xing)相當有(you)(you)(you)用(yong)。第五層(ceng)是(shi)(shi)(shi)“超線程(cheng)(cheng)性能增強(qiang)”，共有(you)(you)(you)兩條(tiao)(tiao)針對(dui)線程(cheng)(cheng)處(chu)(chu)理(li)的(de)指(zhi)(zhi)(zhi)(zhi)令(ling)(ling)：MONITOR， MWAIT，這有(you)(you)(you)助于增加Intel超線程(cheng)(cheng)的(de)處(chu)(chu)理(li)能力、大(da)大(da)簡化(hua)了(le)超線程(cheng)(cheng)的(de)數(shu)(shu)(shu)據(ju)(ju)(ju)(ju)處(chu)(chu)理(li)過程(cheng)(cheng)。

● SSE4.1改進視頻處理

SSE4.1是(shi)Intel在(zai)Penryn核心的(de)(de)Core 2 Duo與Core 2 Solo處理器時，新(xin)增(zeng)的(de)(de)47條新(xin)多(duo)媒體指令(ling)集，用(yong)(yong)(yong)來加強視(shi)頻(pin)編輯等方面的(de)(de)應(ying)用(yong)(yong)(yong)。另外，AMD也開發了屬于自己的(de)(de)SSE4a多(duo)媒體指令(ling)集，并(bing)內(nei)建在(zai)Phenom與Opteron等K10架構處理器中(zhong)，不過相關應(ying)用(yong)(yong)(yong)都(dou)差不多(duo)，并(bing)且無法與Intel的(de)(de)SSE4系列指令(ling)集相容。

據(ju)了解(jie)，在(zai)進(jin)行視(shi)頻編碼時需要進(jin)行動態預測(Motion Estimation)及差(cha)分編碼方式去除相鄰2張影像之相關性(xing)，這是(shi)一(yi)個(ge)非常復雜(za)的運算動作(zuo)。在(zai)沒有SSE4指令(ling)集時，完成一(yi)個(ge)步驟需要以(yi)下指令(ling)語句：

for (int moveblock=0;moveblock<16;moveblock++)

for(int line=0; line<16; line++) // Does the 16 pixels large in 4 iteration

{

int i=0;

sum0+=abs( pBlock1[j]-pBlock2)+abs(pBlock1[j+1]-pBlock2[i+1])+abs(pBlock1[j+2]-pBlock2[i+2])+abs(pBlock1[j+3]-pBlock2[i+3]); // Compare with 0 pixel offset

sum1+=abs(pBlock1[j+1]-pBlock2)+abs(pBlock1[j+2]-pBlock2[i+1])+abs(pBlock1[j+3]-pBlock2[i+2])+abs(pBlock1[j+4]-pBlock2[i+3]); // Compare with 1 pixel offset

sum2+=abs(pBlock1[j+2]-pBlock2)+abs(pBlock1[j+3]-pBlock2[i+1])+abs(pBlock1[j+4]-pBlock2[i+2])+abs(pBlock1[j+5]-pBlock2[i+3]); // Compare with 2 pixel offset

sum3+=abs(pBlock1[j+3]-pBlock2)+abs(pBlock1[j+4]-pBlock2[i+1])+abs(pBlock1[j+5]-pBlock2[i+2])+abs(pBlock1[j+6]-pBlock2[i+3]); // Compare with 3 pixel offset

sum4+=abs(pBlock1[j+4]-pBlock2)+abs(pBlock1[j+5]-pBlock2[i+1])+abs(pBlock1[j+6]-pBlock2[i+2])+abs(pBlock1[j+7]-pBlock2[i+3]); // Compare with 4 pixel offset

sum5+=abs(pBlock1[j+5]-pBlock2)+abs(pBlock1[j+6]-pBlock2[i+1])+abs(pBlock1[j+7]-pBlock2[i+2])+abs(pBlock1[j+8]-pBlock2[i+3]); // Compare with 5 pixel offset

sum6+=abs(pBlock1[j+6]-pBlock2)+abs(pBlock1[j+7]-pBlock2[i+1])+abs(pBlock1[j+8]-pBlock2[i+2])+abs(pBlock1[j+9]-pBlock2[i+3]); // Compare with 6 pixel offset

sum7+=abs(pBlock1[j+7]-pBlock2)+abs(pBlock1[j+8]-pBlock2[i+1])+abs(pBlock1[j+9]-pBlock2[i+2])+abs(pBlock1[j+10]-pBlock2[i+3]); // Compare with 7 pixel offset

i=4;

j=moveblock+4;

…

… }

}

一大串的(de)指(zhi)(zhi)令(ling)極(ji)度浪(lang)費處理器資源，而在支持SSE4指(zhi)(zhi)令(ling)集的(de)處理器上(shang)，只需(xu)要采用4 SAD運算指(zhi)(zhi)令(ling)：MPSADBW xmm0,xmm1,0便完全代(dai)替了以上(shang)繁復的(de)指(zhi)(zhi)令(ling)串，大幅提升動(dong)態預(yu)測(Motion Estimation)及差分編碼(ma)的(de)運算速度。

標簽： 電腦/硬件科技/廚電 ☆

關聯文章推薦

1驍龍處理器排名高通驍龍最新處理器排行驍龍處理器哪個好

網站提醒和聲明

本站(zhan)為注冊(ce)用戶提(ti)供信(xin)息存儲空間服務，非“MAIGOO編輯上傳(chuan)(chuan)提(ti)供”的文章/文字均是注冊(ce)用戶自(zi)主(zhu)發布上傳(chuan)(chuan)，不代表本站(zhan)觀點，版(ban)權歸原作者所有，如有侵權、虛假信(xin)息、錯誤(wu)信(xin)息或任何問題，請及時(shi)聯系我(wo)們(men)，我(wo)們(men)將在(zai)第一時(shi)間刪除或更正。申請刪除>> 糾錯>> 投訴侵權>> 網頁(ye)上相關信(xin)息(xi)的知識產權(quan)歸網站方所(suo)有(you)(包括但不(bu)限于文字(zi)、圖片、圖表、著作權(quan)、商(shang)標(biao)權(quan)、為用戶(hu)提供(gong)的商(shang)業信(xin)息(xi)等)，非經許可不(bu)得抄襲或使用。

提(ti)交(jiao)說明：快速提交發布>> 查看提交幫助>> 注冊登錄>>

贊

踩

發表評論

您還未登錄，依《網絡安全法》相關要求，請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊，可，感謝您的理解及支持！

芒果视频下载

處理器的大腦 讀懂CPU指令集

處理器的大腦讀懂CPU指令集