音量がなくなった

私はTS-453D(QTS 5.2.8.3359)を使用しており、MacからFirefoxブラウザでシステムにアクセスしています。
システムにはSeagate IronWolf Pro 4TBディスクが4台あり、RAID5とホットスペアで構成されています。
ホットスペアに問題が発生し、システムから消えてしまったため、新しいものに交換しました。
新しいドライブは他のものよりもパフォーマンスが良かったので、データドライブとして使用することにしました。
ドライブの1台を取り外すと、システムは同期を開始しました。
同期中に、別のドライブでR/Wエラーが発生しました。
以前に取り外したドライブを再挿入しましたが、現在はフリードライブとして認識されています。
不良ブロックのスキャンを2回実行しましたが、故障したドライブのヘルスステータスは依然として「エラー」と表示されています。
ボリュームは読み取り専用になっています。
取り外したドライブをRAIDグループに再導入して同期を再開する方法はありますか?
ご助言いただけると幸いです。

ええと、ここでいくつか指摘したいことがあります。

1.) まず最初に、「ホットスペアがある」とはどういう意味ですか?未使用のディスクが1台あるということですか?それなら5台のディスクでRAID5を構成すべきです。定義上、RAID5には冗長性があります。今までディスク1台が何もせずに待機していたことになりますが、本来ならアレイの一部としてより多くのストレージを提供できたはずです。

2.) RAIDのパフォーマンスは、グループ内の「最も性能が低い」ドライブによって決まります。つまり、性能の良いドライブをRAIDに追加しても、パフォーマンス向上にはなりません。

3.) 2回目にドライブを交換した時、RAIDはリビルド中でした。これは実質的にもう1台のドライブが故障したのと同じ状況です。バックアップがあることを祈ります。リビルド中にアレイからドライブを取り外すことは絶対にしてはいけません。

4.) 最初に取り外したドライブを再挿入しても意味はありません。アレイはそのドライブをすでに消失したものと認識しており、ストレージスペースのリビルドを進めていました。

5.) R/Wエラーが発生したドライブを再挿入してみることはできますが、それがうまくいくかは分かりません。

他の方がより良いアドバイスをくれるかもしれませんが、バックアップがあることを願っています。

そうですね…バックアップがない場合、唯一の方法はデータ復旧の専門業者に連絡することですが…かなり高額になるでしょう。

ご返信ありがとうございます

3番については、ホットスペアが引き継ぐためにドライブを1台だけ取り外しました。

同期中に、別のドライブで読み書きエラーが発生しました

5番を試してみます

あなたから回復のアイデアを期待していましたが、今日は奇跡はないようですね。

ありがとう、dolbyman

理解しました。しかしRAIDは再構築中でした。再構築中に別のドライブが故障したと考えてください。しかし本当に故障したのか、それとも単にエラーが出始めただけなのか?いずれにせよ、そのドライブを取り外すことで、事実上もう一つの障害を追加したことになります。そのドライブはRAIDが完全に同期し終わるまで待った方が良かったでしょう。しかしこれがRAID5の問題です。失えるドライブは1台だけです。もし1台失い、再構築中にさらに2台目が故障すると(再構築には数日かかる場合があります)、すべてを失うことになります。

このデータのバックアップがあることを願っています。

そして念のため:今後「ホットスタンバイ」ドライブを持ったままにしないでください。それはハードドライブの無駄遣いです。RAID5(すでに「ホットスペア」機能があります)としてストレージスペースとして利用するか、より高い冗長性を持つRAID6にするべきです。そのホットスタンバイドライブのストレージスペースを使わないのであれば、RAID6構成で活用してください。

私は他のドライブを取り外したことはありません。それ以上明確なことはないですよね?

エラーが出始めて、不良セクターチェックを促されました。ドライブはまだ元の場所にあります。

さて、RAID 5でホットスペアが組み込まれているという話がどこから出てきたのか分かりません。おそらく、RAID 5グループが単一のエラーに耐えられるという意味でしょう。それがRAID 5の特徴です。ホットスペアは、1台のドライブを失った場合に他のドライブとデータを同期させるために使われます。これにより、2回目のエラーへのリスクが時間的に最小限に抑えられるのがホットスペアの有用性です。

「ホット」スペアを用意するのは一般的にあまり効果的ではありません。ドライブが通電して稼働している場合、モーターや稼働時間が他のドライブと同じになり、寿命が短くなります。確かにアクチュエータはそれほど使われないかもしれませんが、プロダクションサーバーを運用していない限り、通常は「コールド」スペアを棚に置いてすぐ使える状態にしておく方が良いでしょう。

RAID 5(6、10、またはどのレベルでも)は「バックアップ」とみなしてはいけません。これは何百万もの記事で徹底的に取り上げられています。

RAID障害やアレイ内のディスクがエラーを出し始めると、システムは復旧や同期のために非常に多くの作業を強いられます。これにより、他のドライブも同時にエラーを出したり故障したりすることが多いです。なぜなら、通常は同じ世代・使用状況だからですが、そうでなくても再同期は大きな負荷をかけます。

以上を踏まえて、唯一の予防策(これを読んでいる他の方へ、あなたにはもう遅いかもしれませんが)は、バックアップ戦略の一環として、別のデバイス(できれば複数のデバイス)にバックアップを取ることです。これはデータの重要性や変動性に合わせて行うべきです。

@dolbymanさんが指摘したように、ディスクを抜き取り、再同期が始まり、他のドライブが1台以上エラーを出している場合、バックアップがないなら、最善策はデータ復旧の専門家に相談することです――自分でいじって状況を悪化させる前に。

QNAPサポートにサポートチケットを送信して確認するのも良いですが、この時点で自分でいじると状況をさらに悪化させる可能性が高いです。

お時間をいただきありがとうございます、dosborneさん。

実際、ホットスペア(hot spare)を用意しておくことは、私自身にも、そして多くの人々にも長年にわたり非常に役立ってきました。私はITの専門家であり、エンジニアではありませんが、以前勤めていた会社の一つがEMCでした。

RAIDはバックアップではありませんし、その理由は一つだけではありません。また、RAIDがバックアップとして扱われていないことを指摘してくださったのは、これを読む方々のためにも正しいことです。

ドライブは同時に購入したわけではありませんが、仮に同時に購入していたとしても、統計的に見て同期が始まってから数分でエラーが発生するのは稀です。確かに、再同期(resync)は非常に負荷の高い操作です。ただ、ドライブはまだ2年未満のものです。

私はChatGPTとやり取りし、有益なアドバイスとして、smbやssh経由でシステムにアクセスし、ファイルをコピーしてみることを勧められました。この方法でいくつかのファイルを見ることができましたが、最も重要なデータが入ったディレクトリはクリーニングが必要で、「禁止された」操作でした。結論としては、システムをシャットダウンし、Linuxでドライブをマウントしてみることでした。

稀かもしれませんが、旧フォーラムでまさにこの現象が起きたという投稿を多く見てきました。これは無作為な提案ではなく、多くの人々の実際の状況に基づいた証拠があります。理にかなっています。同期はドライブにとっておそらくこれまでで最大の負荷がかかる作業です。ドライブの数が多いほど、どれか一つがストレスで不具合を起こす可能性も高まります。確かに稀かもしれませんが、確率はゼロ以上に上がります。

人それぞれですが、私も「ITプロフェッショナル」として40年この業界にいますが、現時点ではChatGPT(チャットGPT)に依存することはしませんね :slight_smile: :slight_smile: ChatGPT(チャットGPT)は、QNAP(キューナップ)システムが特に複数のレイヤーを持っているため、標準的なLinuxボックスでRAIDアレイを「マウント」するのが非常に複雑なプロセスであることを指摘すべきでした。チャットで提案されたコマンドを無作為に実行したり、ファイルシステムを理解せずにロードしようとすることは、実際のデータ復旧の可能性を危険にさらします。

実際のプロフェッショナル、まずはQNAP(キューナップ)サポートに連絡し、彼らがシステム内部に関する知識を持って適切なアドバイスをしてくれるか確認することを強くおすすめします。もし彼らが対応できない場合は、前述の通りデータ復旧の専門業者に頼る必要があるかもしれません。

SMB/FTP/SSH経由でファイルにアクセスするという提案は良いものであり、稀に一部ファイルの復旧ができる場合もあります。最終的には、エラーを出している残りのドライブの状態がどれほど悪いかによって、復旧の可能性が決まるようです。

あなたの取り組みがうまくいくことを願っていますし、サポートが少なくとも部分的には助けてくれると確信しています。

chatgptに頼らないというのは確かにもっともな意見です。だからこそ、まずここに来ました。私はAIよりもここの人たちを信頼しています。chatgptに相談したのは、切羽詰まった末の行動でした。ただ、smb経由でファイルを探すというアイデアは良かったと思います。

OK。私は違うふうに読みました。エラーを出し始めたそのドライブを引き抜いて、最初に取り外したドライブをそのスロットに入れたのだと思いました。

厳密にはホットスペアではありませんが、総ドライブ容量が(NumberDrive-1)×最小ドライブ容量となるため、ドライブが故障した場合の冗長性が組み込まれています。「ホットスタンバイ」ドライブがどのように機能するのか私には理解できません。それはRAIDアレイの一部ではないからです。たとえそのドライブにすべてのデータが入っていたとしても、意味はありません。そのドライブをRAIDに追加した瞬間、アレイのために必要なデータの再構築と書き込みが始まります。でも、あなたのやり方でどうぞ…

結論として、RAIDが同期中にドライブの取り外しをしてはいけません。

現時点では、QNAPにチケットを開くことをおすすめします。

状況の悪化を防ぐため、現時点ではハードドライブの交換やシステム設定の変更はお控えください。

重要なデータはできるだけ早くバックアップし、サポートチケットを提出されることを強くおすすめします。弊社サポートチームが詳細な分析と解決に向けてサポートいたします。よろしくお願いいたします。

こんにちは、Steve。

これまでサポートチケットを開いたことがないので、適切な方法を教えていただけますか?

システムがシャットダウンしています。

この件につきましては、NASのHelpdeskアプリから直接サポートチケットを提出するか、または次のURLからもご利用いただけます:Customer Service - QNAP

ありがとうございます。

ホットスペアについてですが、ホットスペアドライブはRAIDグループまたはプールに割り当てます。このスペアドライブの横には「スペア」と表示されます。つまり、実質的にRAIDグループの一部となり、ドライブが故障した瞬間に自動的に稼働し、同期を開始します。そのため、手動介入よりも2台目のドライブが故障するまでのリスクにさらされる時間が短くなります。これにより、交換用ドライブを調達するための時間的余裕が得られます。

ただし、新しいスペアへの同期による追加の負荷が、他のドライブに障害を引き起こしたり、完全に故障させたりする可能性があることに注意してください。これは理論上の話ではなく、リスクは比較的低いものの、実際に存在します。

ルールを忘れないでください:RAIDはバックアップではありません。ホットスペアもバックアップではありません。

:slight_smile:

ディスクが故障しても交換しないのですか?

あなたは本質を見落としています。人々はRAID(レイド)に頼り、バックアップを取っていません。これにより、自分は安全だと思い込んでしまいます。しかし現実は違います。この投稿、そしてインターネット上で繰り返し言われていることは、データを保護する唯一の方法は外部メディアにバックアップすることだということです。

ボリュームや物理ディスクに対して何か操作をすることは、リスクを伴います。このフォーラムを見れば、RAIDやスナップショット、同じNAS内のボリュームに頼っている人が、適当に操作してデータにアクセスできなくなって驚いている様子が分かります。

アレイの再構築が全てのドライブに負荷をかけるのはよく知られた事実です。

すべてのユーザーはバックアップ戦略を持つべきです。

バックアップ戦略はリスクを特定し、データの価値に基づいた計画を立てます。ディスクエラー、ドライブ故障、複数ドライブの故障、NAS故障、火災、洪水、盗難、ファイルの誤削除、意図的なファイル削除、マルウェア、停電、ネットワーク障害、クラウド障害、NASへのマルウェア、クラウドサービスへのマルウェアなど、何に対して保護するのかを考えます。

重要なデータもあれば、そうでないデータもあります。すべてのデータセットには適した戦略が必要です。バックアップ不要(再ダウンロード可能)なものもあれば、単純に別の場所にコピーするだけで良いもの、バージョン管理が必要なもの、レプリケーションが必要なもの、段階的なバックアップが必要なもの、アクティブなバックアップが必要なものもあります。

何が正しいかはユーザー自身が決めるしかありませんが、必ず実際のデータに基づいた情報に基づいて判断する必要があります。例えばRAID 1を設定したからといって、必要なファイルを誤って削除した場合や盗難、NAS故障などから守られるわけではありません。同じ構成でも、2つのボリュームにして段階的にバックアップする方がそのユーザーの用途には重要かもしれませんし、そうでないかもしれません。

状況やデータセットはそれぞれ異なります。唯一の正解はありません。ユーザーが自分のデータの価値を判断し、それに合った戦略を選べるよう教育することが重要です。そしてその戦略は複数の方法を組み合わせることになるでしょう。例:バックアップ不要なデータもあれば、RAIDアレイに保存するデータもあり、クラウドにコピーするデータもあり、別のNASにレプリケートするデータもあり、USBドライブにコピーして貸金庫に保管するデータもあります。家庭ユーザーとして、私はこれらすべての戦略を使っています。各データセットはその価値に応じてバックアップ戦略を選んでいます。

さらに、ハードウェアの交換はデータの交換とは同じではありません。

絶望的な状況での簡単な解決策として、ドライブを交換する前にデータの(新しい)バックアップを取ることです(理想的には常にバックアップを取っておくべきなので、これがそれほど重要でない場合もあります)。劣化モードでも、バックアップはリビルドよりリスクが少ないです。そして、データが保存できたらハードウェアの問題に対処します。