なぜそこまで、意固地になるのか解りませんが、私は今回出した物を使ってくれとも、検証してくれとも言って
いませんよ、OpenMP入門用見本としてソースファイルとOpenMP入門サイトを見て、OpenMPを使ってみてくれる
人が増えたらいいなくらいのものです。
動くかどうかは、コンパイルして試せばすぐに結果が解って面白いですよって、気軽く試してみてはということです。
JWM-1269 OpenMP Custom
Re: JWM-1269 OpenMP Custom
せっかくなので、古いPCに入れてみましたよ。
環境は
tahrpup - 6.0.2
AMD Athlon 64 X2 Dual Core 4400+
NVIDIA Quadro FX 580
今度はちゃんと表示でました。
でも、効果を確認するのが難しいです。
うまい具合の負荷が見つからなくて…
私では、ちょっとギブです
うまく行ったら、投稿してくださいね。
環境は
tahrpup - 6.0.2
AMD Athlon 64 X2 Dual Core 4400+
NVIDIA Quadro FX 580
今度はちゃんと表示でました。
でも、効果を確認するのが難しいです。
うまい具合の負荷が見つからなくて…
私では、ちょっとギブです
うまく行ったら、投稿してくださいね。
neo実験君こと次期メインマシン
Intel Core i5-8400 2.80GHz
xenialpup64 7.5+lang_pack_ja-xenial64e
Intel Core i5-8400 2.80GHz
xenialpup64 7.5+lang_pack_ja-xenial64e
Re: JWM-1269 OpenMP Custom
タロ兵衛さんの今回試されたPCは高クロックなので、CPUクロック変更ツールでクロックを30%に制限してみると
違いが解るかもです。
私のPCは、AMD アスロン5350 2.05GHz 4coreで熱対策で50%にCPUクロックを制限して、違いがはっきりと
出ています。
あとは、ライブラリに関係するソフトを使ってみるとか、別に JWM と lib は組み合わせを替えてみるとか。
そのまま使わなくても、OpenMP入門学習用としていろいろいじってみても面白いと思います。
高クロックCPUでは、小さいループはOpenMPを使うと、かえって並列処理のCPUコア毎の振り分けで時間を取られて
効果が出ない事が有るそうです。
arch linuxでは、最新Gccでコンパイルオプションに自動並列化と最適化O4でも速度が変わらない事が有るそうです。
なので、小さいループのOpenMP文をコメントアウトして再度コンパイルしてみるとか、違いが出ないなら使わないとか。
インテル ターボブースト搭載CPUで4GHz越えてるPCは、下手な並列処理プログラムより早いとか、この場合は今回の
プログラムは邪魔で無意味かもしれません。
違いが解るかもです。
私のPCは、AMD アスロン5350 2.05GHz 4coreで熱対策で50%にCPUクロックを制限して、違いがはっきりと
出ています。
あとは、ライブラリに関係するソフトを使ってみるとか、別に JWM と lib は組み合わせを替えてみるとか。
そのまま使わなくても、OpenMP入門学習用としていろいろいじってみても面白いと思います。
高クロックCPUでは、小さいループはOpenMPを使うと、かえって並列処理のCPUコア毎の振り分けで時間を取られて
効果が出ない事が有るそうです。
arch linuxでは、最新Gccでコンパイルオプションに自動並列化と最適化O4でも速度が変わらない事が有るそうです。
なので、小さいループのOpenMP文をコメントアウトして再度コンパイルしてみるとか、違いが出ないなら使わないとか。
インテル ターボブースト搭載CPUで4GHz越えてるPCは、下手な並列処理プログラムより早いとか、この場合は今回の
プログラムは邪魔で無意味かもしれません。