Gnu-Parallel
GNU 並行 ssh 作業:如果伺服器死了,不完整的作業會發生什麼?
假設我們想要使用 GNU 並行將作業分派到一組伺服器。如果其中一台伺服器在忙於執行作業時當機(電源故障、熱關機……)會發生什麼?GNU parallel 會只是將相同的作業分派給另一台伺服器,還是會永遠失去該作業?
除非您使用它,否則它將永遠失去,
--retries
在這種情況下它將在另一台伺服器上重試。還可以查看--filter-hosts
刪除已關閉的主機。
看來我應該更仔細地閱讀手冊頁。我們可以通過保存作業日誌文件並從那裡恢復來恢復失敗的作業,如下所示:
parallel --resume-failed --joblog logfile
如果該文章被認為對任何人沒有什麼價值,我將刪除該文章。