新聞公告

高性能計算平臺推出“低效作業主動告警增值服務”
更新日期:2020年04月02日 17:17
為提高運行效率🧑🏼🦳、避免機時浪費🧑🏼🍳,高性能計算平臺面向用戶推出“低效作業主動告警增值服務”,以郵件告警形式告知低效作業操作♟🍰,提醒用戶修改作業腳本,節省資源👩🏼🎨。
低效作業是指在高性能計算平臺運行過程中🧌,作業指定計算資源與實際運行需求不匹配🤛🏽,從而導致運行狀態異常造成機時浪費的一類作業✮。申請節點過多並行效率遇到瓶頸、單節點作業申請了多節點資源、單線程作業申請了整個節點資源,是低效作業的常見原因🆚。
超算平臺根據估算的每個作業CPU核心、內存使用需求與用戶申請數量對比,若發現設置不合理,則會發送“告警”郵件並給出調整建議,用戶可根據建議修改👩🦼➡️:
👆收到此類建議的作業👩🏼💻,建議減少作業所用的計算節點數💶。
👆收到此類建議的作業,請重新提交到CPU隊列使用單節點運行👩👧👦。
👆收到此類建議的作業,請重新提交到small隊列使用單核心運行。
如有疑問,請發送郵件至hpc@sjtu.edu.cn咨詢👶🏻。
上一條:交大食堂就餐指數上線
下一條🦍:交大“校級用印”申請流程上線