高階計算機體系結構總結

2021-09-23 00:02:55 字數 4915 閱讀 9286

1.摩爾定律內容及其對現代計算機的影響?

答:摩爾定律是由英特爾名譽董事長戈登摩爾經過長期觀察指出的。主要內容是積體電路晶元上所整合的電晶體數將每隔18個月翻一番,微處理器的效能將提高一倍,**下降一半。

影響:(1)歸納了資訊科技進步的速度,比如半導體晶元的發展;(2)帶動了晶元產業自熱化得競爭,是公司發展的驅動力;(3)指導著高科技產業中設計者們的工作,讓生產找到了提高產品效能的途徑。摩爾定律實際上是關於人類信念的定律,當人們相信某件事情一定能做到時就會努力去實現它。

2.pipling指令集流水線段各是什麼?

答:一條指令流水線由五段組成:(1)取指令(if):

傳送程式計數器pc到記憶體,取出當前指令,更新pc;(2)指令解碼(id):判斷指令型別,從暫存器取運算元(3)計算有效位址或者執行(ex):計算記憶體運算元的有效位址,分支跳轉的有效位址,執行(4)訪訪問數(mem):

用有效位址去訪訪問數或存數,用分支跳轉有效位址更新pc(5)寫回(結果寫回暫存器wb)

3.什麼原因導致流水線停止,怎樣解決?

答:要使流水線具有良好的效能,必須使流水線暢通流動,不發生斷流,但由於流水過程中發生以下三種相關衝突而停止:結構相關,資料相關,控制相關。

結構相關:當資料和指令放在同乙個儲存器且只有乙個訪問口時,便發生兩條指令爭用儲存器資源的相關衝突,解決辦法:一是指令停頓一排再啟動,插入乙個氣泡,二是增設乙個儲存器,將指令和資料分別放在兩個儲存器中。

資料相關:在乙個程式中,如果必須等前一條指令執行完畢後,才能執行後一條指令,那麼這兩條指令就是資料相關的,解決辦法:一是插入氣泡,二是流水cpu的運算器中特意設定若干運算結果緩衝暫存器,暫時保留運算結果,以便於後繼指令直接使用;三是推遲後繼指令的執行,直到前面的指令的結果產生為止,這樣大大影響流水線的吞吐率。

控制相關:是由轉移指令引起的,當執行轉移指令時,依據轉移條件產生的結果,可能為順序取下一條指令,也可能轉移到新的目標位址取指令,從而使流水線發生斷流,為減少轉移指令對流水線效能的影響,可採用延遲轉移法和轉移**法。

4. 5段流水線,可把cpu效能提高5倍,實際卻做不到,什麼原因,解決方法?

答:不能提高倍數的原因可能是由於:(1)流水線各段的所需時間不相等,受到慢的流水線段影響,(2)流水線的充滿和排空需要時間(3)輸入的任務不是連續的,程式本身存在相關的衝突,有氣泡。

解決辦法:當流水線中各段的執行時間不完全相等時,流水線中就存在有「瓶頸」。解決流水線「瓶頸」問題的方法主要有兩種。

一種方法是將流水線的「瓶頸」部分再細分。這樣,每乙個功能段及子功能段的延遲時間均為t。如果由於結構等方面的原因,瓶頸功能段不能再細分時,可以採用,通過重複設定瓶頸功能段,讓多個瓶頸功能段並行工作。

5.指令集的用途?risc和cisc指令集不一樣,計算機分為精簡指令系統和複雜指令系統計算機,這導致的優缺點?

答:用途:cpu依靠指令來自計算和控制系統,每款cpu在設計時就規定了一系列與其硬體電路相配合的指令系統。

指令的強弱也是cpu的重要指標,指令集是提高微處理器效率的最有效工具之一。從現階段的主流體系結構講,指令集可分為複雜指令集和精簡指令集兩部分。

cisc優點:cics指令系統的功能比較強大,能取代一些用軟體實現的功能。缺點:

指令系統比較龐大,指令數目200-300條,執行速度慢,帶來了體系結構複雜,成本高,使得計算機的研製週期變長,難以保證正確性,不容易除錯維護,而且由於採用了大量使用頻率較低的複雜指令而造成硬體資源浪費。定址方式多,指令格式多,指令字長格式不固定,可訪儲存器不受限制,各指令使用頻率相差大,大多數採用微程式控制器,功能不均衡,不易於用流水線提高效能。

risc優點:指令長度固定,指令格式種類少,定址方式種類少,只有取/存數指令訪問儲存器,其餘的指令的操作都在暫存器間進行。大部分指令在乙個機器週期內完成。

繼承了cisc指令系統的成功技術,並在克服了cisc機器缺點的基礎上發展起來的,使得處理器的結構更加合理,更簡單,具有更高的效能和執行效率,並降低處理器的開發成本。一般高階語言程式設計,特別重視編譯優化工作,並利用指令流水線排程以減少程式執行時間。缺點:

cpu中通用暫存器的數量相當多,以硬佈線控制為主,不用或者少用微指令控制,強調對指令流水線的優化,risc使得它的編譯程式變得複雜,軟體系統開發時間比cisc機器長。

6. 典型指令集結構mips和arm指令集的特點。

arm(1)指令長度固定32位,(2)定址方式簡單,執行效率高,(3)大量使用暫存器,執行速度快(4)大多數資料操作在暫存器中完成,支援大端,小端,每條指令前4段均為nzcv。

mips有三種指令格式(1)r型別,從暫存器堆中讀取兩個源運算元,結果返回給暫存器堆(2)i型別,使用乙個16位的立即數作為乙個源運算元(3)j型別,使用乙個26位的立即數作為跳轉目標位址。

arm指令特點:所有指令都是帶條件的,具有靈活的第2運算元,既可以是立即數,也可以是邏輯運算子,有協處理器的作用,arm核心可以提供協處理器指令介面,通過擴充套件協議處理器完成複雜功能。arm有兩種指令集,16位thumb和32位的arm指令集。

具有risc指令特點。由於指令長度為32位,無法在1條指令中存放32位的立即數,一般立即數為5—12位。

7. 為什麼要設定記憶體的層次結構?記憶體層次行的原理:時間區域性性和空間區域性性各是什麼?

答:(1)處理器與主存之間的速度差異很大,對儲存器的要求是容量大速度快成本低,為了解決這方面的矛盾,採用儲存器層次結構。(2)程式訪問的區域性性原理:

程式經常會重複使用它最近使用過的指令和資料,經驗指出程式有90%的執行時間執行的是其10%的**。區域性性原理意味著我們可以用最近使用過的指令和資料,在一定誤差範圍內合理的**將要使用到的指令資料。

時間區域性性說明最近使用過的指令或資料很有可能即將被使用。空間區域性性是說位址相鄰的指令或資料可能在一定時間內被連續使用。

8. 主存與cache的位址對映方式?各種方式的優缺點?

答:cache的對映策略指的是記憶體與cache之間如何建立相互對映關係。可分為:

直接對映方式:每個記憶體塊只能被唯一的對映到一條cache 中;

優點:硬體實現很簡單,不需要採用相聯訪問的儲存器,訪問速度也比較快。實際上採用直接相聯方式的cache不需要進行位址變換,因為主存位址的低位部分就是cache的位址。

缺點:塊的衝突率比較高。當主存中的兩個或兩個以上的塊都映像到cache的同一塊中,而這些塊又都是當前的常用塊時,cache的命中率會很低。

這時,即使cache中還有很多空閒的塊,也幫不上忙。

k-路組相聯對映方式:cache被分解為若干個組,每個組由k個block組成;組直接對映,組內對映到任意block

優點:與直接映像方式相比,最明顯的優點是塊的衝突率大大降低。

缺點:由於組相聯映像方式在組內部需要進行相聯比較,因此,實現的難度和造價要比直接映像方式高。

全相聯對映方式:記憶體塊可以被對映到cache中的任意乙個block。

優點:塊的衝突率最小,cache的利用率也最高。缺點:

但是,需要乙個相聯訪問速度很快、容量為c的相聯儲存器,其代價很高。而且,相聯比較所花費的時間將影響cache的訪問速度。

complement:(選擇性看)

當cpu在cache中找到藥訪問的資料項,被稱為cache命中;當cpu找不到,就叫cache缺失。cpu與cache之間的資料交換是以字為單位,而cache與主存之間的資料交換是以塊為單位。乙個程式需要的所有資料並不是都駐留在記憶體中,如果系統中包含虛擬儲存器,那麼一些資料可以存放在磁碟中,位址空間通常分為一些固定大小的塊,稱為「頁」,在任意時刻,會有某個頁儲存在主儲存器或者磁碟中,當cpu要訪問的資料不在cache中,又不在主儲存器中,則發生「頁缺失」,需要從磁碟中取出該頁並放到主儲存器中。

9. 什麼是並行?互聯**性?

答:並行性包括同時性和併發性兩個含義:(1)同時性指兩個或者兩個以上事件在同一時刻發生;(2)併發性指兩個或兩個以上事件在同一時間間隔發生。

多處理器互聯方式包括靜態網際網路絡和動態網際網路絡:(1)靜態網際網路絡:處理單元間有著固定連續的一類網路,在程式執行期間,這種點到點連線保持不變。

典型的靜態網路有一維線性陣列,二維網孔,樹連線,超立方網路,立方環,洗牌交換網,蝶形網路等(2)動態網際網路絡:用交換開關構成的,可按應用程式的要求動態地改變連線組態典型的動態網路包括匯流排,交叉開關,多級網際網路絡等。

10. 最早多核cpu二級cache是分開的,後來是共享的,為什麼?

答:(1)共享二級cache使得更有效的使用了最後一級cache,當其中乙個核心不工作的時候,另外乙個核心就可以使用整個二級cache,提高了資源的利用率。(2)程式設計師程式設計更靈活,當共享二級cache時,在這個基礎上,可以使得分別執行在兩個核心上的執行緒能有更多的機會去共享資料。

其中乙個核心可以為另乙個核心提前或者之後處理相關的資料。並且在兩個核心之間有選擇性的交流機制。(3)減少cache的不一致性,由於共享了二級cache,所以減少了錯誤的共享。

相對於獨自占有二級cache的體系結構而言,使得維持cache一致性的負擔大大減少。(4)減少冗餘,乙份資料只需要儲存乙份即可。(5)減少前端匯流排的分擔。

在多核之間高效的資料共享,可以使得資料共享在共享的二級cache中得到解決,而不是在整個系統儲存器之間進行訪問。

速度,**靈活性

用硬體的指令來實現,速度高,**低,靈活性差。用軟體的子程式來實現,速度低,**便宜,靈活性好。

設計指令系統時,在功能方面的基本要求是:指令的完整性,規範性,高相容性。

完整性是指:通用計算機應該具備的基本指令是:1 資料傳輸類2 運算類 3 程式控制類 4 輸入輸出指令 5 處理機控制和除錯指令

目前,指令系統的優化設計有兩種截然相反的方向,乙個是增強指令的功能,設定一些功能複雜的指令,把一些原來由軟體實現的常用功能改用硬體的指令系統來實現-----複雜指令系統計算機。

另一種是80年代發展起來的,盡量簡化指令功能,只保留那些功能能在乙個節拍內執行完的指令及使用頻率相當高的指令,較複雜的用子程式來實現----精簡指令系統。

11.p76這兩個圖的不同點,為什麼要進行改造?

答:及早判斷轉移是否發生,盡早生成目標位址,,可使轉移指令造成的流水線停頓由3個時鐘減少到1個時鐘,,加上add加法器是為了計算轉移目標位址,而且避免了與alu發生資源相關,但由於增加了硬體資源,提高了成本。

計算機體系結構

平行計算 之我見指導老師 陳麗萍 學院 資訊科學與工程學院 班級 計科0908班 姓名 原海南 學號 0909083125 完成日期 2012年5月21日 目錄1.平行計算簡介 1.1什麼是平行計算 1.2為什麼需要平行計算 1.3平行計算的歷史 1.4平行計算的現狀 2.平行計算與網際網路 2.1...

計算機體系結構複習

模擬試題一 課程名稱計算機系統結構適用班級 考試時間 120 分鐘班級學號姓名 一 單項選擇題 本大題共10小題,每小題2分,共20分。在每小題的四個備選答案中選出乙個符合題意的,並將其前面的序號填在題後的括號內。1.按flynn分類法,處理機illiac iv屬於 sisd simd misd m...

計算機體系結構報告

計算機組織與體系結構 實驗報告 實驗名稱 姓名班級 學號實驗一基本運算器實驗 一 實驗目的 1 了解運算器的組成結構。2 掌握運算器的工作原理。二 實驗裝置 pc 機一台,td cma 實驗系統一套。三 實驗原理 本實驗的原理如圖 1 1 1 所示。運算器內部含有三個獨立運算部件,分別為算術 邏輯和...