题名 | 指令标签辅助的链式数据预取技术研究 |
作者 | 刘天义 |
答辩日期 | 2017-05-25 |
文献子类 | 硕士 |
授予单位 | 中国科学院大学 |
授予地点 | 北京 |
导师 | 沈海华 |
关键词 | 指针追逐 指令标签 硬件提示 增强型内存控制器 |
学位专业 | 其它专业 |
英文摘要 | 计算单元与存储单元分离的冯诺依曼架构,使数据必须经过搬运才能被 CPU 处 理。传统的顺序预取和 Stride 预取技术起到了将处理器随后要用到的数据提前取到片 上Cache的作用。但是,对于基于指针操作的应用,由于处理器很难对指针的内容进 行准确预测,因此传统预取方法不能满足链表、图等指针追逐特点比较明显的应用程 序的数据预取需求。 为了对处理器中指针追逐的访存模式进行优化,本文提出了 ILAMP(Instruction Label Assisted Memory Prefetching)技术,一种基于指令标签提示的预取机制。该机 制是在指令集架构中添加新的访存指令(LD_PCHS) ,该指令在处理器译码阶段产生 加载指针的访存标签(PCHS_FLAG) ,在Cache缺失的情况下,一直传递到内存控制 器。当加载的指针返回到内存控制器时,内存控制器中的预取器逻辑可以根据标签提 示,提取该指针、进行虚实地址转换后发出预取请求。当依赖于指针访存的新请求进 入内存控制器时,就可以直接命中,从而省去了访问DRAM存储器的延迟开销。 本文主要贡献有三点: 1) 提出并实现了可产生标签的访存指令,对访存内容进行区分; 2) 设计并实现了集成了虚实地址转换部件的内存控制器,从而支持内存侧虚拟 地址预取。 3) 专门的预取缓冲器,用于暂存指针预取结果,避免了对 Cache 的污染;并进 行了优化设计。 实验结果表明,本文提出的 ILAMP 技术与激进的Stride预取方案相比,ILAMP预 取技术降低 LLC 读请求的平均访问延迟在 9 个测试程序中的平均值为 15%,最高到 19%;Olden 测试集的预取准确性的平均值高于 77%,图计算应用程序的预取准确度达 到 96%以上。对于设计的开销,ILAMP 技术消耗存储器带宽在 6%到 10%之间,硬件的 存储开销约为1KB。 |
语种 | 中文 |
学科主题 | 计算机系统设计 |
公开日期 | 2017-07-05 |
内容类型 | 学位论文 |
源URL | [http://ictir.ict.ac.cn/handle/311040/2739] |
专题 | 中国科学院计算技术研究所学位论文_2017硕士 |
推荐引用方式 GB/T 7714 | 刘天义. 指令标签辅助的链式数据预取技术研究[D]. 北京. 中国科学院大学. 2017. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论