QNAP 快照首次複製耗時超久

大家好,

我在用兩台 QNAP TS435XeU 複製快照時遇到困難;僅僅 5TB 資料同步已經跑了一天還沒結束。

環境的基本資訊如下:

  • 兩台機器之間使用全新的 1 公尺長 cat.6 網線直連通訊,兩台皆顯示 2.5Gb 鏈路(更換成用 2.5G 交換器連接,狀況一樣)
  • 原始端有 4 顆 4TB 硬碟組成 RAID5
  • 目標端是單顆 8TB 硬碟(要複製的資料量 5TB,可放得下)
  • 全部硬碟都是 WD NAS 系列
  • 兩台設備皆為最新韌體
  • 同步過程沒有設速度限制、不加密、不壓縮

以數學計算,5TB 通過 2.5Gbps 傳輸理應 5 小時內搞定,就算加點額外耗損、誤差、各種妖魔鬼怪亂入,10 小時應該差不多。但現在一天過去了進度卻只有 26.92%(系統顯示 27 小時傳了 4TB,這還不到 25%…)

看起來這是常見的問題…

我在設定流程時,有沒有明顯疏漏的地方?

在處理過程中 CPU 的使用率是多少?這些機型的效能一向不高。使用的是哪一款硬碟?

CPU大多數時間處於閒置狀態;當我登入檢查狀態時會出現短暫高峰,但幾秒後源端裝置恢復到10%-20%,目標NAS更低於10%。

所有硬碟都是WD Red:

  • 4x WD40EFPX-68C6CN0
  • 1x WD80EFPX-68C4ZN0

讓我覺得非常奇怪的問題是,網路上的資料傳輸並不穩定:會有500/700 Mbps的高峰持續半小時,然後又完全停止一段時間,之後再恢復傳輸。

我無法理解其中有沒有什麼規律,無論是時間、速度還是已傳輸的資料量。

看起來大部分時間兩台設備都閒置,我完全不明白為什麼。

順帶一提,昨天我發帖時,剛好是重新啟動快照複製作業(在目標NAS上刪除磁區,重新啟動兩台設備,再重新啟動任務),過了20小時目前狀態是17.56%。就在此時,網路上的資料傳輸速度(直連2.5Gbps、無防火牆、無交換器)只有33 Kbps。

真是瘋狂。

每日更新:經過將近 48 小時,進度仍然低於 50%

根據我個人的經驗,第一個快照副本(Snapshot Replica)確實通常會花比較久的時間,但之後的快照應該會快很多。不過,你提到的速度確實有點不尋常,所以我會請我們內部團隊進行分析並檢查是否有任何問題。感謝你的反饋!

謝謝你。

請注意,我已經有一個支援團隊的服務單,並且已經將這個討論串連結給他們了。

CPU 使用率其實沒有什麼意義。你真正需要關注的是 TOP 裡面的 CPU 負載(Load)數值。要查看這個數值,請用 SSH 連線登入你的 NAS,然後執行「top」指令。你會看到類似下面這個畫面:

你要看的其實就是「Load average」這個數值。它大致代表過去 1、5、15 分鐘內,CPU 正在同時處理的 thread(緒)數量。你的 NAS 裡有 4 核心 CPU,這代表如果這個負載數字大於 4(比如說到 8 或 10),那你的系統就出現了瓶頸,速度會開始變慢。這些 process(處理程序)可能每個本身 CPU 用量不高,但只要同時執行,還是會拖慢效能。每顆 CPU 核心一次只能處理一件事情,當有太多其他程序在排隊等候時,整台機器就會變慢。

執行初始化快照的時候,尤其是 NAS 上面同時還有其他東西在跑,通常會占用相當多的資源。

我在升級作業系統之前沒有檢查,不幸的是;我已經從 QNAP 官方網站下載了新版本進行更新(在 QTS 裡沒有發現更新),到目前為止系統負載都在 4 以下。

有一些負載尖峰,我發現那是連接到網頁介面時引起的:只要我開啟 QTS,負載就會上升,但我覺得這是正常現象。

如果之前有任何問題,最新的作業系統版本應該都已經解決了;現在同步作業運行非常穩定,不再發生速度從 150MB/s 掉到零然後卡住的情況了。