课程介绍:
计算机软件界较大的变迁是从串行编程转向了并行编程。其中,CUDA起到了重要的作用。究其本质,图形处理单元(Graphics Processor Unit,GPU)是为高速图形处理而设计的,它具有天然的并行性。CUDA采用了一种简单的数据并行模型,再结合编程模型,从而无需操纵复杂的图形基元。我们也可以轻而易举的发现各种各样的开源计算机库,例如OpenCV,Caffe,TensorFlow等等,都提供了对应于GPU的使用接口,使得GPU的使用越来越主流而高效。
适用人群:
对并行计算,GPU编程刚兴趣的同学,熟悉C/C++编程语言。需要有带NVIDIA显卡的计算机,如果没有的同学可能需要额外购买AWS的GPU服务器,费用约是0.4美元/小时。
课程目录:
一. GPU与CUDA背景基础介绍
- 第1课 CUDA硬件环境,体系结构,软件环境介绍,包括平台、架构、开发工具和热点技术
- 第2课 并行编程介绍,CUDA核心概念,包括网格、线程块,不同类型内存的工作机制
二. CUDA编程基础
- 第3课 CUDA设备内存、常量内存、共享内存和纹理内存,CUDA流和事件
- 第4课 CUDA执行模式、线程调度、内核执行和CUDA存储器的使用
- 第5课 CUDA流处理器簇、多GPU编程、纹理操作
三. CUDA性能优化与设计
- 第6课 CPU/GPU协同编程,串行/并行程序中提高并行度的常用策略
- 第7课 流式负载以及使用GPU做应用程序性能优化常用策略
- 第8课 在集群中使用CUDA
四. 实战项目经验
- 第9课 应用CUDA做高维数据处理
- 第10课 CUDA+OpenGL做图形渲染
- 第11课 CPGPU实现视频流实时光流跟踪
- 第12课 深度学习框架中的GPU应用
〖课程目录〗:
- | └──75.GPU并行计算与CUDA编程
- | | ├──第八课
- | | | ├──课程代码
- | | | ├──视频
- | | | ├──资料
- | | | └──第八课.pptx 2.45M
- | | ├──第二课
- | | | ├──课程代码
- | | | ├──视频
- | | | └──第二课.pptx 732.69kb
- | | ├──第九课
- | | | ├──课程代码
- | | | ├──视频
- | | | └──第九课.pptx 1.18M
- | | ├──第六课
- | | | ├──视频
- | | | ├──第六课.pptx 1.42M
- | | | └──纹理内存与纹理操作.pdf 531.23kb
- | | ├──第七课
- | | | ├──课程代码
- | | | ├──视频
- | | | └──第七课.pptx 2.21M
- | | ├──第三课
- | | | ├──代码
- | | | ├──视频
- | | | └──第三课.pptx 2.55M
- | | ├──第十二课
- | | | ├──CUDA_LEC12.mkv 115.97M
- | | | └──第十二课.pptx 441.39kb
- | | ├──第十课
- | | | ├──参考资料
- | | | ├──代码
- | | | ├──视频
- | | | └──第十课.pptx 670.58kb
- | | ├──第十一课
- | | | ├──代码
- | | | ├──视频
- | | | ├──资料
- | | | └──第十一课.pptx 697.29kb
- | | ├──第四课
- | | | ├──课程代码
- | | | ├──视频
- | | | └──第四课.pptx 2.36M
- | | ├──第五课
- | | | ├──课程代码
- | | | ├──视频
- | | | ├──作业素材
- | | | └──第五课.pptx 717.88kb
- | | ├──第一课
- | | | ├──软件包
- | | | ├──视频
- | | | ├──资料
- | | | └──第一课.pptx 2.61M
- | | ├──Screenshot_2017-10-01-19-17-51-984_com.tencent.mt.png 292.32kb
- | | ├──Screenshot_2017-10-01-19-18-01-613_com.tencent.mt.png 247.31kb
- | | ├──_欢迎加入炼数成金课程交流QQ群:628513286.txt 0.10kb
- | | └──作业.doc 75.00kb