2009/12/11 01:40
크리에이티브 커먼즈 라이선스
Creative Commons License
여러가지 자료를 살펴보다 보니 왜 CUDA 를 많이 쓰는지 잘 알것 같다.

기본적으로 for loop 로 돌던 것들의 index 를 병렬적으로 배치해주는 것이 그 핵심인데,

해당 과정만 거치고 나면, 거의 모든 종류의 계산 알고리즘을 병렬화 해줄 수 있다.

Block 당 512개의 Threads 제한은 조금은 충격.

연구실의 후배가 문제를 발견해서, 해당 문제점에 대해 생각해보니 어라? 이건 좀 이상하네 라는 생각이 들었다.

그리드당 블럭의 개수는 512x512x32 였던가

그런데 레퍼런스 자체에 표현이 좀 혼동되게 되어있는 것이 Block 과 Grid 에 대한 것이다.

레퍼런스 상의 Block 은 Thread 와 같고, Grid 는 Kernel 과 같은데, 위의 그리드당 블럭 개수는 진짜 그리드당 블럭 개수로 해석해야 한다.

이거원...

조금은 더 명확히 정리해야할 필요가 있는 것 같다.
저작자 표시 비영리 동일 조건 변경 허락
Posted by SHHyun