我的 QuTS hero h6.0 Beta 測試總結——系統當機根本原因已找到 — Qsirch

在我的 QuTS hero h6.0 Beta 測試期間,我遇到了一次嚴重的系統停滯,看起來像是 ZFS 崩潰:

  • 負載平均值飆升到數百
  • SSH 指令凍結(psfindgetcfg
  • 程序卡在 D‑state
  • 系統部分無回應
  • ZFS 儲存池間歇性掛起
  • 核心日誌顯示 [DISK SLOW] 警告和 ZFS 斷言

起初,看起來像是硬碟故障或 ZFS 錯誤。經過全面調查,根本原因其實更簡單:

移除 Qsirch 立即消除了問題。

發生了什麼事

Qsirch 在重啟後開始全面索引。在 QuTS hero(ZFS)上,Qsirch 的索引引擎會產生極為龐大的中繼資料 I/O:

  • 深度目錄遍歷
  • 小型隨機讀取
  • SQLite/MariaDB 寫入
  • 縮圖提取
  • 內容掃描

這種負載壓垮了我的其中一個儲存池,導致:

  • 硬碟延遲達數秒
  • ZFS 交易延遲
  • 核心 I/O 等待堆積
  • 程序卡在 D‑state
  • 全系統停滯

一旦移除 Qsirch,系統立刻恢復穩定:

  • ZFS 儲存池延遲恢復正常
  • 不再有 [DISK SLOW] 警告
  • 不再有核心停滯
  • 不再有凍結指令
  • 負載平均值恢復正常

不需其他變更。

重點結論

在 QuTS hero h6.0 Beta 上,Qsirch 可能壓垮 ZFS 儲存池,尤其是大型或繁忙的儲存池。如果你遇到:

  • 無法解釋的系統停滯
  • 程序凍結
  • 高負載但 CPU 使用率低
  • ZFS 延遲警告

請優先嘗試停用或移除 Qsirch。

對我的系統來說,移除 Qsirch 完全解決了問題

1個讚

我剛才忘了提到:其中一顆2.5吋SSD在事件發生後立刻故障。這可能與底層問題有關,但我還在確認中。補充這點以求完整。

QSirch 在初始階段會極度佔用 CPU,因為它會索引 NAS 上的每一個檔案。這不是問題,而是其本質特性。在首次設定 NAS 時,最好先讓所有設定完成並穩定下來,再啟用 QSirch。此外,你也可以設定要排除在 QSirch 索引之外的資料夾。例如,通常沒必要將 Container Station 的資料或虛擬機器磁碟納入 QSirch 索引。

一旦 QSirch 完成索引後,所需的 CPU 和資源就非常少。但它在 NAS 上搜尋資料時卻非常強大。

1個讚

這個問題是在升級到 6.0 版本後才開始出現的嗎?之前的版本一切都正常嗎?謝謝!

我之前使用 QTS 沒有任何問題

感謝你的說明——非常感謝你分享 QSirch 在初次索引時的行為細節。老實說,我真希望我早點知道這些。

就我而言,我的 NAS 最後有大約五天處於無法連線的狀態,最終 SSD 因為壞軌而損壞。在那之前,我也遇過類似情況,系統有三天無法連線,直到我重置並重新設定一切。

我剛剛再次啟用 Qsirch,結果 NAS 立刻變得無法連線。這和我之前看到的情況一樣——長時間無回應,上次甚至因為連續幾天不間斷的負載,導致 SSD 出現壞區而損壞。

正如我所說,如果你剛完成了某些重大操作,比如這樣的大型作業系統更新,即使你覺得沒什麼,其實底層可能有很多事情正在進行。Qsirch 只會讓這一切更加繁忙,直到 NAS 穩定下來。

如果你想查看實際的使用情況,並找出是什麼拖慢了系統,可以開啟 SSH 連線並執行 “top” 指令。它會顯示你的 CPU 負載,以及所有進程的 CPU 使用情況。CPU 負載是關鍵數字,它應該小於或等於你的 CPU 核心/執行緒數量。如果超過這個數值,系統就會開始變得遲鈍。

您好,我們已在內部嘗試重現此問題,但尚未觀察到相同的結果。

為了說明,Qsirch 在 QuTS hero 6.0.0 beta 上已針對效能進行最佳化,因此 CPU 使用率可能會比先前版本稍高。不過,我們尚未遇到您所描述的具體情況。

為了協助我們進一步調查,能否請您提供一些有關您資料的細節?

  • 您的檔案總大小是多少?

  • 您有多少影片和照片?

  • 目前總共使用了多少儲存容量?

謝謝!

嗨,

感謝您的跟進。我很感謝您針對 QuTS hero 6.0.0 beta 中 Qsirch 優化的說明。

為了協助您的調查,以下是您所要求的詳細資訊:

  • 透過 Multimedia Console 被 Qsirch 索引的檔案總大小:約 23.13 TB,分布於兩個儲存池。

  • 照片:893,365

  • 影片:11,917

  • 音樂:0(目前已索引)

請注意:這僅反映已加入 Multimedia Console 的檔案子集。我的完整資料集實際上幾乎是這個大小的兩倍,其中包含尚未被索引的大量音樂資料庫。

  • 目前已使用的總容量

    • 儲存池 1:已使用 12.52 TB / 總容量 21.81 TB

    • 儲存池 2:已使用 10.61 TB / 總容量 14.13 TB

如果您需要系統規格、CPU 使用率圖表或日誌,以協助更準確地重現負載狀況,請告訴我。我很樂意進一步協助。

此致
敬禮
Victor Lam

此外,我的 QNAP AI Core 正在積極執行多項辨識工作。AI Core 已啟用,且我正在使用 QAI‑U100 加速卡,目前已被偵測並處於 Ready 狀態。如您所知,這些背景辨識程序可能會影響整體系統效能,因此我將目前的進度提供如下以供參考:

  • 人臉辨識:執行中 — 52%(470,880 / 893,637)最後更新:2025/12/31 09:59:20

  • 物件辨識:執行中 — 55%(496,770 / 893,637)最後更新:2025/12/31 09:59:45

  • 相似照片辨識:執行中 — 54%(483,804 / 893,637)最後更新:2025/12/31 09:58:42

本系統支援的 AI 加速設備類型包括 Coral Edge TPU、Hailo‑8、Hailo‑8L、QAI‑M100、QAI‑U100、內建 GPU 及 NPU。

若您在索引或辨識期間需要日誌、效能追蹤或其他額外指標,我也可以提供。

關於此問題的另一個更新:

即使未安裝 Qsirch,我的 NAS 再次變得無法回應。發生故障時,唯一的活動程序是 Multimedia Console 正在索引照片和影片。系統最終完全無法回應,我不得不重置 NAS 並實體移除所有硬碟以恢復系統。

重建後,我現在只允許索引照片。在這種較低的負載下,NAS 已經穩定運行了大約兩天。

嗨,感謝您提供資訊!我們希望能在我們這邊嘗試重現這個問題。

請問您的照片和影片是哪些檔案格式(例如 .jpg、.heic、.mp4)?另外,每張照片的平均檔案大小大約是多少?

我注意到您提到了 AI Core——請問目前有啟用任何 AI 功能嗎?謝謝!