スクラブで不規則なブロックが発生する原因を調査

私は、4台の(私が知る限り)WD Red+ 6TBドライブを搭載した古いTS-469を使用しています。スクラブを実行するたびに「不整合ブロック」が多数報告されます。スクラブ間で追加または変更されたファイルはごくわずかしかないのにです。先週のレポートでは1万5千以上の不整合ブロックがあり、修復されたと表示されました。

つまり…問題は、問題が見つからないことです!すべてのディスクは正常と報告されており、不良セクタなどもありません。これを突き止める方法について、何かアドバイスはありますか?

NASのメモリを増設しましたか?メモリテストは試しましたか?

試してみます。可能性は低そうですが、ディスクドライブに問題がないのに不具合が起きている理由の説明にはなりますね。ありがとうございます。

さて(自分に返信)、思ったよりも難しいようです。標準のメモリテストはなく、ダウンロードして追加できるものも見つかりません。なので、ブート可能なUSBメモリを作成して、USBハブを用意し、ドライブなしで全体を動かせるか試してみるしかなさそうです。思っていたよりずっと厄介ですね。

これをご覧になりましたか?

https://www.qnap.com/en/how-to/faq/article/how-do-i-perform-a-memory-test-on-qnap-nas

この古いデバイスではRAMを増設してもあまり効果はありません。最大3GBまでしか対応していません。データシートをご参照ください。

よろしくお願いいたします

QTSを使用している場合のみです。

他のディストリビューションに切り替えれば、4GBまでインストールして使用できます。どうして知っているかは聞いてください。:wink:

私はこの古いものをアップグレードしようとしているわけではなく、ただ正常に動作するように戻したいだけです。1週間の間に5~6個の小さなファイルだけを変更したのに、15,000件以上のエラーが発生しました。今のところ、「壊れたブロック」がどこにあるのかすら分かりません。つまり、それらがすべて1つのドライブにあるのか、それとも散らばっているのかも分からないのです。ログには、スクラブで発見され修復されたとしか書かれていません。しかし、次のスクラブではさらに多くのエラーが出てきます。

どのHDDにも問題があるという兆候は見つかりません。それで、メモリエラーの可能性があると勧められました。今は、予備のモニターとキーボードを探して、ブート可能なUSBドライブを作成し、MEMTEST(メムテスト)のコピーを見つけるのにどれだけ手間がかかるかを考えています。

エンジニアとして、少なくともエラーの原因を見つけるのがこんなに難しいとは思えません。

エラーメッセージのスクリーンショットをご提供いただけますか?そうしていただくことで、より効果的に問題の診断が可能になります。

また、ハードドライブはどのくらいの期間ご使用されていますか?

問題が特定される前に、重要なデータのバックアップも必ず行ってください。万が一のリスクを軽減するためです。

もちろん、実際にはスクリーンショットではありません。NASなので。ですが、ログから関連する行は以下の通りです。

ドライブはすべて比較的新しいものです。一番古いもので約1年ほどだと思いますし、NAS自体も非常に軽くしか使っていません。交換したドライブのひとつが怪しいと思い、入れ替えてみましたが改善しませんでした。また、厄介なことに、ドライブにはまったく問題が表示されません。SMARTやテストでも何も出ません。ロード時間やリトライなどもすべて良好です。温度も30℃前半です。正直、原因がわかりません。しかし、今のままではこのユニットを信頼して使うことはできません。

正直に言うと、私もTS-669で同様の問題を経験しました。NAS自体はエラーを出しませんが、何らかの負荷をかけるとボリュームが(理由もなく)リードオンリーに設定されてしまうようです。全く異なるディスクでセットアップを行ったところ、これは成功しましたが、コピー作業を開始すると数分後に再びボリュームがリードオンリーになり、この現象は再現性があります。

現在、私の疑いとしては、何らかのコンポーネント(どれかは分かりません)が寿命を迎えており、奇妙な挙動を引き起こしているのではないかということです。

もしかしたら、あなたのNASも同じかもしれません。

もし私があなたの立場なら、完全に新しいセットアップを行い、その後NASが違う挙動をするかどうか確認すると思います。

よろしくお願いします。

{あまり励みにならない}情報をありがとうございます。{:>)

このビルドは残念ながらそれほど古くありません。ディスクを入れて約5か月前に新しく始めました。1か月ほど前まではすべて順調でした。それ以外は、かなり信頼性がありました。

セットアップ時にがやってしまった問題の一つは、ストレージ全体をシックボリュームとして単純に使うように設定したことです。最近の問題で「リードオンリー」になり、リカバリーを試みるまではそれで問題ありませんでした。リカバリーにはボリューム外に32GB以上の空き容量が必要なようですが、それがないためリカバリーに失敗します。残念ながら、QNAP QTSではボリュームの拡張はできますが、縮小はできません。そのため、NASに約7TBの空き容量が残っていても、唯一の解決策はすべて消去してやり直すことです。[もしくはエラーが発生しないようにすることです。]

情報ありがとうございました。数日後にメモリを交換してみるつもりです。

シックボリューム(thick volumes)は、常に割り当てたスペースを占有します。そのため、シックボリュームがドライブのほとんどの空き容量を使っている状態で、スナップショットやその他の類似操作を行うと、シックボリューム内に十分な空きスペースがあっても、簡単にドライブが読み取り専用モードになる可能性があります。NAS(ネットワークアタッチトストレージ)から見れば、そのスペースはすでに使用中、つまり割り当て済みなので、追加の空きスペースが十分にない場合は何もできなくなり、問題が発生します。

私も厚型ボリュームのみを使用していますが、TS-x69ではスナップショットを使用できません。

これはcat2 NASですが、ここではスナップショット機能は利用できません。

よろしくお願いします

関連情報については、以下のFAQをご参照ください:
RAIDスクラビング中に「mismatched blocks detected and fixed」というログが表示されるのはどういう意味ですか? | QNAP