GPUPuzzlers

Puzzlers

vector_flops:flops and memory bandwith of vector ops and gemms
d2h sync: device to host synchronization and its pitfalls
launch queue: cuda launch queue
memory: impact of using pinned and pageable memory, cuda caching allocator
tensor cores: achieving higher TFLOPS using tensor cores
streams: concurrent kernel execution (data transfer and computation using cuda streams)
kernel fusion: horizontal and vertical kernel fusion
communication: nccl, impact of using nvswitch, pcie

Repo Layout

├── CNAME               // custom domain name
├── Gemfile             // jekyll packages
├── Gemfile.lock        // jekyll packages with pinned dependencies (auto generated)
├── LICENSE             // license file
├── README.domain       // this file
├── _config.yml         // main config file for the website
├── favicon.ico         // browser icon
├── index.html          // homepage template
├── tags.html           // tag generation file
├── _includes           // jekyll include files
├── _layouts            // jekyll layout files
├── _posts              // all posts (rendered by date, most recent first)
├── _sass               // jekyll scss files
├── assets              // more scss files
├── collectives         // puzzler 8
├── d2h_sync            // puzzler 2
├── fusion              // puzzler 7
├── images              // folder containing images for all pages (not posts)
├── launch_queue        // puzzler 3
├── memory              // puzzler 5
├── pages               // folder containing dedicated pages
├── streams             // streams puzzler 6
├── tensor_cores        // puzzler 4
└── vector_flops        // puzzler 1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GPUPuzzlers

Puzzlers

Repo Layout

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
_includes		_includes
_layouts		_layouts
_posts		_posts
_sass		_sass
assets		assets
collectives		collectives
d2h_sync		d2h_sync
fusion		fusion
images		images
launch_queue		launch_queue
memory		memory
pages		pages
streams		streams
tensor_cores		tensor_cores
vector_flops		vector_flops
.gitignore		.gitignore
CNAME		CNAME
Gemfile		Gemfile
LICENSE		LICENSE
README.md		README.md
_config.yml		_config.yml
favicon.ico		favicon.ico
index.html		index.html
tags.html		tags.html

License

anupambhatnagar/GPUPuzzlers

Folders and files

Latest commit

History

Repository files navigation

GPUPuzzlers

Puzzlers

Repo Layout

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages