他のプロジェクトとの比較

さて、ここまで伏せてきたが賢明な方は薄々気がついていたと思う。
今回N-queens問題を例題として使ったのは

という記事をうっすらと覚えていたからである。
この記事で紹介されていたサイトはリニューアルされてunreachableになっているのだが、その結果は68ノードのPentium4 Xeon 2.8GHzで以下のようになった。比較のため私のコードの結果も加えた。

この結果と比較すると、ざっと1/20の速度ということになる。
CellBEは3.2GHzなので、クロック数を揃えると、1CPUあたり3倍の計算速度ということになる。
1スレッドからの概算では、私の手元にあるCore Duo 2GHz MacBookで、最高の並列化を行ったとしてもCellBE 1CPUはCore Duo 2GHz 1CPUの3倍弱の速度を出せそうである。
そうなると最新のクアッドコアにほぼ匹敵する速度程度にまで達すると言えるのではないだろうか。
1年以上前に出荷されたCPUと同スペックであることを考えればまずまず健闘していると言ってもよいと思う。CellBEには8つSPUが搭載されており、全て利用可能であれば更に効率が上がる事を考えれば、可能性としては高い評価を与えられると思う。

結論としては、ロジックの実装でも工夫次第で、最新CPUを遥かにしのぐほど、というところまではいかないものの、それに負けない程度の効率を得る事ができるということが分かった。
この結果に勇気を得て、できれば更に複雑なロジックに挑戦してみたい。