premature optimization is the root of all evil(早すぎる最適化は諸悪の根源)
こういう低レベルな言語でコードを書いていると、すぐにダークサイドに落ちそうになる。iとjが共に0〜10の範囲で、かつi == jの時は除外、なんてのを11 * 11のfor文で書いてif(i == j) continueとかするよりも、11 * 10のループにして_j = j + (i <= j)とかした方が速いんじゃないか、とかそういうことをついついやりそうになってしまう。
ダークサイドに落ちないようにマントラを唱え続けないといけない。「premature optimization is the root of all evil(早すぎる最適化は諸悪の根源)」と。
でもまぁ、僕の使っているGeForce9800GTはストリームプロセッサが112個だから、11 * 11だと微妙にあふれて11 * 10だとあふれないというきわどいところなので後で試してみる必要はあるだろう。
CUDAの続き書くつもりだったけど、もう眠いのでタイトルを「CUDA日記」じゃなくした。昼に起きて21〜24の間も寝ていたのに、活動時間が短いなぁ。
-
-
-
- -
-
-
3% ~ 5%程度早くなるようではある。あまり重要ではないな。