你好,
我有一台 Qnap TVS 1288x,規格如下:
- QuTS hero h5.2.9.3492
- 80GB 記憶體
- 主要儲存池使用兩顆 NVMe 硬碟,大多應用程式都在這上面
我遇到的問題是:
- 系統會在運行一兩天後突然變慢。
- 這段期間,大多數應用開始凍結或完全無法載入。
- 當出現上述問題時,虛擬化工作站(Virtualization Station)也無法載入。
我嘗試了一些排除方法。
- 我試著把應用程式移到其他儲存池,不管用
- 重新開機後會暫時恢復,但幾天後又會再次發生,不是永久解決方法
請問有人遇到相同問題,或知道我可以從哪裡開始排查嗎?
剩下的磁碟配置如下:
- Pool 2 - 4 顆 4TB HDD - Raid 5
- Pool 3 - 4 顆 10TB HDD - Raid 5
- Pool 4 - 4 顆 512 SSD - Raid 10 - 用於 VM
- ARC RAM 使用量設為 60%
ARC 會導致這個問題嗎?
有可能是主檔案系統損毀嗎?
我不太確定該怎麼排查來排除這個問題。
我會先清除快取再嘗試一次。
我們原本以為 QuTS 在快取方面很安全,但現在系統變慢(還有 RAID 重建)的問題還是出現了。
我會試試看。
我最近在一天前設定了快取。以前沒有設定快取的時候,我也有遇到同樣的問題。
請問我要怎麼開啟系統除錯模式(debug mode),這樣當下次再發生的時候,我可以取得一些日誌紀錄?
我認為沒有針對效能下降的紀錄檔。
dmesg 和 top 會是檢查錯誤訊息以及記憶體/CPU 使用率(透過命令列)的候選工具。
quts hero 的快取功能似乎壞掉了。我也有過類似的經驗,最後就乾脆完全不用它了。
這個情況有兩個問題,我本來是想分開處理。不過我也可以放在這裡。
我已經清除快取了,但問題還是存在,尤其是在虛擬化工作站(virtualization station)這個應用程式上。
我也不確定還能怎麼做。
不過它們看起來確實是有關聯的(當存儲變慢時,你的 VMStation 也無法載入)。
我只是想確保我們沒有把資源分散到不同的解決方案上。
我不太確定,但在跑了一些效能測試之後,我覺得我的兩個 SSD 可能有問題。
那顆 M.2 我很快就會更換。不過,這兩個 SSD 的速度都不正常。請看截圖,這可能就是問題原因。
呃,你有一顆 SSD 顯示警告。是什麼警告?這會不會是導致你其他問題的原因?當快閃記憶體逐漸磨損時,抹除和寫入的循環時間會變長。
那個(m.2)是給主要作業系統用的。我很快就會把它換掉。不過當我把虛擬機(VMs)搬到另一個儲存池時,一切都運作正常。我標記的那兩個,我已經申請RMA(換貨),現在正在等更換。
看起來這就是硬碟的問題。
作業系統在所有磁碟上(跨 RAID1 分割),除非你指的是系統儲存池。系統池應該始終具備冗餘,因為如果你更換或損壞那顆硬碟,所有應用程式都會遺失。