99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

申威眾核處理器上的三對(duì)角并行求解器

作者:劉侃; 王欣亮; 許平; 薛巍 清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系; 北京100086; 國(guó)家超級(jí)計(jì)算無(wú)錫中心; 江蘇無(wú)錫214100

摘要:三對(duì)角方程求解器是一種在很多科學(xué)與工程領(lǐng)域廣泛應(yīng)用的數(shù)值計(jì)算核心。目前,CPU、GPU等主流硬件平臺(tái)上都提出了高度優(yōu)化的并行算法,但是對(duì)于中國(guó)自主研發(fā)的申威26010眾核處理器,還沒有一種算法能有效地利用其獨(dú)特的硬件特性來達(dá)到最大化的性能。提出了一種分布式CR算法swDCR,來求解大量的、規(guī)模不大的三對(duì)角方程。該算法對(duì)每個(gè)三對(duì)角方程使用多個(gè)從核并行求解,通過聯(lián)合多個(gè)從核的緩存使得運(yùn)算過程中所有中間變量都能存儲(chǔ)在緩存中,同時(shí)利用寄存器通信完成核間數(shù)據(jù)的高速傳輸。通過設(shè)計(jì)線程級(jí)數(shù)據(jù)劃分機(jī)制,使得向量化的優(yōu)化效果最大化。swDCR的吞吐率相比主核上的追趕法達(dá)到了單精度43.9倍和雙精度36.7倍的加速,相比從核上的追趕法達(dá)到了單精度和雙精度均2.07倍的加速。該算法在申威26010處理器單個(gè)核組上可以獲得24GB/s的有效帶寬。

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

計(jì)算機(jī)科學(xué)與探索

北大期刊 下單

國(guó)際刊號(hào):1673-9418

國(guó)內(nèi)刊號(hào):11-5602/TP

雜志詳情
相關(guān)熱門期刊

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因?yàn)閷W⑺詫I(yè)。

保障正刊 雙刊號(hào)

推薦期刊保障正刊,評(píng)職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠(chéng)信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。