いよいよ最後のチェックポイントの説明です
とりあ、先に使うコマンドの説明でもしときます
# ps ax
チェックポイントを取るのにプロセスIDが必要なんです
ただ、このコマンドだけやと
全てのプロセスが出てきて見にくいから
# ps ax | grep bmt
みたいに実行ファイル名を指定した方が見やすいと思います
# lamcheckpoint -ssi cr blcr -pid $1
見てなんとなく分かると思うけどもチェックポイント用のコマンドです
後ろの$1には止めるプログラムのプロセスIDを入れます
# lamrestart -ssi cr blcr -ssi cr_blcr_context_file $1
これもなんとなく見て分かると思うけどリスタート用のコマンドです
後ろの$1には『context.mpirun.プロセスID』を入れます
さて、コマンドの解説もほどほどにして実際にやっていこうと思います
まず、前段階として
puttyを2つ起動させて同じVMに入ります
1台目→プログラムの実行
2台目→止める作業
1台目は特に何も考えずに動かす
2台目で色々で小細工をする
一応、チェックポイントを取るっていっても
1台目のを止めるんじゃなくて
途中経過のポイントを取るから
1台目の計算は最後まで止まることなく動いてます
で、今の問題なのが2台目でリスタートするんはいいんけども
見てもらって分かる通り実行結果が違う・・・
この原因はもうハッキリしてて
だいたいの時間を計測するプログラムは
スタートする時→スタート時の現在時刻を保存
ゴール時→ゴール時の現在時刻を保存
で、計算したり、表示する時に
ゴール時の時間ースタート時の時間=かかった時間
って感じに計算するから
スタート時→午前8時
チェックポイント取って
2時間後にリスタートして
ゴール時→午前10時
やと、計算にかかった時間が2時間になっちゃうんですよね
これが少しめんどくさいねなぁ…
これを解決するにはプログラムの中身をいじるか
パソコン側の設定をどうにかするしかないんけども
いつ止めるか分からんものをどうするか今考え中
最終的に時間が関係ないようなプログラムを使って評価を取る予定・・・
これでだいたい使い方は分かってもらえたかな??
卒論も書かなアカンしで
少し飛ばしてまとめたから分かりにくいかも・・・
でも、いつか、誰かの役に立てばと思います
.
.
.
.
.
.
.
.
.
.