散片機0算力故障問題

故障原因:

由於某張或者某幾張卡算力為0 ,導致整機算力為0。

故障判斷:

在主機詳情-遠程命令-miner日誌中,找到GPU算力為0 的顯卡編號。

預處理方案:

在主機詳情-信息中,對該卡進行禁用操作,重啟miner即可生效,這樣操作後可保證其他卡正常工作。

解決方案:優先使用系統層解決方案,系統層無法解決轉入硬件層解決方案。

系統層解決方案:

針對相同類型、相同顆粒的顯卡,設置多個模板,在超頻參數處設置檔位差:

第一類超頻參數:保持其他參數不便,在電壓處設置多檔。

第二類超頻參數:降低顯存頻率提高電壓,設置多檔。

優先使用第一類超頻參數,如果問題依然存在,轉入第二類超頻參數。當主機穩定工作時,再根據當前的超頻參數進行微調,來達到當前顯卡的最佳性能。

硬件層解決方案:

軟件層無法解決的問題,就可以判斷出問題出在硬件層,由於當前礦場都是散片機,受環境因素影響線路老化和金手指氧化速度較快。

解決方案為清理顯卡金手指,而後更換轉接線、轉接卡槽。

已驗證的解決方案:

經過調試,系統層無法解決的問題在經過硬件處理(更換轉接線)後,已經得到了解決,並且算力已經恢復穩定工作24小時以上。

遇到此類問題,請參照此方法進行處理。

Last updated