题名指令标签辅助的链式数据预取技术研究
作者刘天义
答辩日期2017-05-25
文献子类硕士
授予单位中国科学院大学
授予地点北京
导师沈海华
关键词指针追逐 指令标签 硬件提示 增强型内存控制器
学位专业其它专业
英文摘要计算单元与存储单元分离的冯诺依曼架构,使数据必须经过搬运才能被 CPU 处 理。传统的顺序预取和 Stride 预取技术起到了将处理器随后要用到的数据提前取到片 上Cache的作用。但是,对于基于指针操作的应用,由于处理器很难对指针的内容进 行准确预测,因此传统预取方法不能满足链表、图等指针追逐特点比较明显的应用程 序的数据预取需求。 为了对处理器中指针追逐的访存模式进行优化,本文提出了 ILAMP(Instruction Label Assisted Memory Prefetching)技术,一种基于指令标签提示的预取机制。该机 制是在指令集架构中添加新的访存指令(LD_PCHS) ,该指令在处理器译码阶段产生 加载指针的访存标签(PCHS_FLAG) ,在Cache缺失的情况下,一直传递到内存控制 器。当加载的指针返回到内存控制器时,内存控制器中的预取器逻辑可以根据标签提 示,提取该指针、进行虚实地址转换后发出预取请求。当依赖于指针访存的新请求进 入内存控制器时,就可以直接命中,从而省去了访问DRAM存储器的延迟开销。 本文主要贡献有三点: 1) 提出并实现了可产生标签的访存指令,对访存内容进行区分; 2) 设计并实现了集成了虚实地址转换部件的内存控制器,从而支持内存侧虚拟 地址预取。 3) 专门的预取缓冲器,用于暂存指针预取结果,避免了对 Cache 的污染;并进 行了优化设计。 实验结果表明,本文提出的 ILAMP 技术与激进的Stride预取方案相比,ILAMP预 取技术降低 LLC 读请求的平均访问延迟在 9 个测试程序中的平均值为 15%,最高到 19%;Olden 测试集的预取准确性的平均值高于 77%,图计算应用程序的预取准确度达 到 96%以上。对于设计的开销,ILAMP 技术消耗存储器带宽在 6%到 10%之间,硬件的 存储开销约为1KB。
语种中文
学科主题计算机系统设计
公开日期2017-07-05
内容类型学位论文
源URL[http://ictir.ict.ac.cn/handle/311040/2739]  
专题中国科学院计算技术研究所学位论文_2017硕士
推荐引用方式
GB/T 7714
刘天义. 指令标签辅助的链式数据预取技术研究[D]. 北京. 中国科学院大学. 2017.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace