GPU 体系结构与 CUDA 编程模式
一、 CUDA 构成
CUDA 构成
CUDA 体系结构
Host: CPU(任务发送、组织、预处理、管道并行)
Device: GPU(并行计算)
1. Memory
CUDA中的可以使用的内存种类及体系结构:
最大功能执行单元硬件体系图
- 一个 SM 中包[……]
Host: CPU(任务发送、组织、预处理、管道并行)
Device: GPU(并行计算)
CUDA中的可以使用的内存种类及体系结构:
文献:Agrawal N, Prabhakaran V, Wobber T, et al. Design Tradeoffs for SSD Performance.[C], Usenix Technical Conference. 2009. https://www.usenix.org/lega[……]
Three interleaving strategies:
1.Device bus interleaving
原文链接:https://flashdba.com/2014/11/24/understanding-flash-the-write-cliff/
系统行为的可预测性是非常重要的。如果知道一个系统任何时间的行为,我们就可以计划对应的操作。
当flash设备即将占满时,包含有用数据的[……]
Dirty Page 产生于数据更改的过程中。当我们对数据进行更改时,更改操作不会立即作用到物理存储空间,而需要经历如下过程:
1.更改缓冲区页面数据,即逻辑写 (Logical write);
2.将逻辑缓冲页中的数据写入到物理 table/disk 中,并记录到 transa[……]
原文链接:https://flashdba.com/2014/10/15/understanding-flash-garbage-collection-matters/
首先我们来考虑一下没有垃圾回收机制的flash系统会发生什么。[……]
原文链接:https://flashdba.com/2014/09/17/understanding-flash-the-flash-translation-layer/
背景:Flash的数据修改机制采用的策略是,将修改后的数据写到新的page中,而把原本的page标记为invalid,后续对其[……]
原文链接:https://flashdba.com/2014/06/20/understanding-flash-blocks-pages-and-program-erases/