Vietnamen’s Weblog

Time, Chances, Diligence, Intelligence: which is the most important?

Phần 7: Cấp phát bộ nhớ

leave a comment »

Sau đây ta sẽ bàn về vấn đề cấp phát bộ nhớ sao cho tối ưu. Trước hết, ta giới thiệu 2 khái niệm về chế độ cấp phát bộ nhớ là PAGED và NON-PAGED (hay PINNED) mode.

Sau đây là một số so sánh

  1. Non page locked memory:
  • CPU to GPU: 1.6 GB/sec
  • GPU to CPU: 1.4 GB/sec
  1. Page locked memory (subtracted from the OS by allocating with cudaMallocHost:
  • CPU to GPU: 3.1 GB/sec
  • GPU to CPU: 3.0 GB/sec

Cơ chế PAGED là kĩ thuật nhằm tăng tốc khả năng truy xuất bộ nhớ của DRAM. Theo cơ chế này, bộ nhớ được phân chia làm các trang (PAGE) bằng các chip DRAM đặc biệt. Việc truy xuất bộ nhớ trong cùng 1 page giảm thời gian khoảng 2 lần. Với CUDA, cudaMallocHost cấp phát

cudaError_t cudaMallocHost ( void ** ptr, size_t size )
The CPU to GPU connectivity is
provided by a x16 PCI-E bus with a maximum theoretical bandwidth
of 4 Gbps. Transfer rates are tricky to measure as they depend on
the way the data is moved. One empirical measurement with CUDA
gives the following:

The CPU to GPU connectivity isprovided by a x16 PCI-E bus with a maximum theoretical bandwidthof 4 Gbps. Transfer rates are tricky to measure as they depend onthe way the data is moved. One empirical measurement with CUDAgives the following:

References:

  1. http://grok.lsu.edu/Article.aspx?articleId=3231

Written by vietnamen

Tháng Mười Một 6, 2009 lúc 8:50 chiều

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: