完整後設資料紀錄
DC 欄位 | 值 | 語言 |
---|---|---|
dc.contributor.author | 羅世融 | en_US |
dc.contributor.author | Luo, Shih-Rong | en_US |
dc.contributor.author | 游逸平 | en_US |
dc.contributor.author | You,Yi-Ping | en_US |
dc.date.accessioned | 2014-12-12T01:45:45Z | - |
dc.date.available | 2014-12-12T01:45:45Z | - |
dc.date.issued | 2012 | en_US |
dc.identifier.uri | http://140.113.39.130/cdrfb3/record/nctu/#GT079790502 | en_US |
dc.identifier.uri | http://hdl.handle.net/11536/46587 | - |
dc.description.abstract | 由於GPU (Graphics Processing Unit)核心數量與傳輸性能的大幅提升, 使得GPU不單單只以圖形運算的方式應用於電腦或是多媒體設備中, 更可做為CPU的加速器也就是以一般目的計算的GPU (GPGPU,General-purpose computing on GPU)應用於大量數值與科學運算上。 然而以 SIMT (Single Instruction Multiple Threads)架構為設計考量 的GPU,常會因 branch divergence(分支分歧)的問題而降低程式在GPU上的執行效能,使得程式撰寫者需要在程式設計上,額外針對branch divergence的問題做程式設計上的修改,甚至可能需要重新改寫程式以確保程式不會被 branch divergence 的問題降低太多效能。 我們設計branch divergence reduction的最佳化方法,實作在NVIDIA的 CUDA (Compute Unified Device Architecture,統一計算架構)編譯器中,減輕程式撰寫者對 branch divergence 的問題花費心力。我們藉由已知應用於code size reduction的最佳化方法中的code factoring演算法,來解決branch divergence的問題。並以Par4all的轉換程式將多個C程式轉成CUDA程式,藉此我們可以產生更多未針對branch divergence做最佳化的程式,目的是產生一組可供測試的benchmark;我們的benchmark除了前述的之外也包含CUDA的SDK與Rodinia的CUDA程式等。我們也藉由gpuocelot去評估benchmark中branch divergence 的比例與執行時間上的關係。benchmark在經過我們的branch divergence reduction最佳化方法後,可測量出程式的執行時間平均可以降低3.5%,最大可以降低8.5%的執行時間。 | zh_TW |
dc.language.iso | zh_TW | en_US |
dc.subject | 分支分歧 | zh_TW |
dc.subject | 圖形晶片 | zh_TW |
dc.subject | CUDA | en_US |
dc.subject | GPU | en_US |
dc.subject | branch divergence | en_US |
dc.title | 減少 CUDA 程式分支分歧之編譯器技術 | zh_TW |
dc.title | Compiler Techniques for Reducing Branch Divergence in CUDA Programs | en_US |
dc.type | Thesis | en_US |
dc.contributor.department | 資訊學院資訊科技(IT)產業研發碩士專班 | zh_TW |
顯示於類別: | 畢業論文 |