Lautstärke verloren

Ich habe ein TS-453D mit QTS 5.2.8.3359 und greife mit einem Mac über den Firefox-Browser auf das System zu.
Das System verfügt über 4 Seagate IronWolf Pro 4TB-Festplatten, die als RAID5 mit einem Hot Spare konfiguriert sind.
Der Hot Spare hat ein Problem verursacht, ist aus dem System verschwunden und wurde durch eine neue Festplatte ersetzt.
Die neue Festplatte hatte eine bessere Leistung als die anderen und ich habe beschlossen, sie als Datenlaufwerk zu verwenden.
Ich habe eine der Festplatten entfernt und das System begann mit der Synchronisierung.
Während der Synchronisierung traten bei einer weiteren Festplatte Lese-/Schreibfehler auf.
Ich habe die zuvor entfernte Festplatte wieder eingesetzt, aber diese wird jetzt als freies Laufwerk angezeigt.
Ich habe die fehlerhafte Festplatte zweimal auf fehlerhafte Blöcke gescannt, aber der Gesundheitsstatus zeigt weiterhin eine „Fehler“-Anzeige.
Das Volume ist schreibgeschützt.
Gibt es eine Möglichkeit, die entfernte Festplatte wieder in die RAID-Gruppe einzufügen und die Synchronisierung neu zu starten?
Jede Hilfe wäre sehr willkommen.

Ja, also ein paar Dinge hierzu.

1.) Erstens, was meinst du damit, dass du einen Hot Spare hast? Bedeutet das, du hast eine Festplatte, die nie benutzt wird? Dann solltest du ein 5-Platten-RAID5 haben, denn per Definition bietet RAID 5 Redundanz. Du hattest eine Festplatte, die effektiv nichts getan hat, obwohl sie Teil des Arrays sein und dir mehr Speicherplatz bieten könnte.

2.) Die Leistung eines RAIDs wird von der Leistung der „schlechtesten“ Festplatte bestimmt. Das Hinzufügen einer besser performenden Festplatte zum RAID hat also nichts gebracht.

3.) Dein RAID wurde gerade neu aufgebaut, als du das zweite Mal die Festplatte getauscht hast. Damit hast du effektiv gehandelt, als hättest du eine weitere defekte Festplatte. Ich hoffe, du hast ein Backup. Man sollte niemals, wirklich niemals, eine Festplatte aus dem Array entfernen, während es neu aufgebaut wird.

4.) Das erneute Einsetzen der ersten entfernten Festplatte hilft nicht, da das Array diese Festplatte jetzt als verloren ansieht und den Speicherplatz bereits neu aufgebaut hat.

5.) Du könntest versuchen, die Festplatte mit den Lese-/Schreibfehlern wieder einzusetzen, aber ich bin mir nicht sicher, ob das funktionieren wird.

Vielleicht kann jemand anderes bessere Einsichten bieten, aber ich hoffe wirklich, dass du ein Backup hast.

Ja… ohne Backups bleibt dir nur die Möglichkeit, einen Datenrettungsspezialisten zu kontaktieren… das wird teuer.

Vielen Dank für Ihre Antwort

Zu Punkt 3: Ich habe nur ein Laufwerk entfernt, damit das Hot-Spare übernehmen kann.

Während die Synchronisierung lief, zeigte ein weiteres Laufwerk Lese-/Schreibfehler an.

Ich werde Punkt 5 ausprobieren

Ich hatte auf eine Wiederherstellungsidee von dir gehofft, aber ich verstehe, heute gibt es keine Wunder.

Danke, dolbyman

Ich verstehe. Aber das RAID war gerade dabei, sich neu aufzubauen. Während des Neuaufbaus ist zu bedenken, dass ein weiteres Laufwerk ausgefallen ist. Aber ist es wirklich ausgefallen oder haben Sie nur angefangen, Fehler zu bekommen? Dennoch haben Sie durch das Entfernen dieses Laufwerks im Grunde einen weiteren Ausfall verursacht. Es wäre besser gewesen, einfach zu warten, bis das RAID vollständig synchronisiert ist, bevor Sie dieses Laufwerk entfernen. Aber das ist das Problem bei RAID5. Sie können es sich nur leisten, ein einziges Laufwerk zu verlieren. Wenn Sie ein Laufwerk verlieren und dann während des Wiederherstellungsprozesses (der Tage dauern kann) ein zweites Laufwerk verlieren, verlieren Sie alles.

Ich hoffe, Sie haben ein Backup dieser Daten.

Und nur zur Info: Setzen Sie sich in Zukunft nicht mit einem weiteren „Hot Standby“-Laufwerk hin. Das ist Verschwendung einer Festplatte. Entweder fügen Sie es Ihrem Array hinzu, um es als Speicherplatz in RAID 5 zu nutzen (das bereits ein „Hot Spare“ eingebaut hat), oder Sie machen Ihr Array zu RAID6, was Ihnen noch mehr Redundanz bietet. Wenn Sie den Speicherplatz dieses Hot Standby-Laufwerks nicht nutzen wollen, dann verwenden Sie eine RAID6-Konfiguration.

Ich habe kein anderes Laufwerk entfernt, klarer geht es doch nicht, oder?

Es fing an, Fehler zu melden und forderte einen Bad-Sector-Check an. Die Laufwerke sind immer noch an ihrem Platz.

Jetzt weiß ich nicht, woher diese Vorstellung kommt, dass ein Hot Spare in RAID 5 eingebaut ist. Wahrscheinlich meinen Sie, dass eine RAID-5-Gruppe einen einzelnen Fehler verkraften kann, denn genau das ist es. Das Hot Spare wird verwendet, falls Sie ein Laufwerk verlieren, damit die Daten mit den anderen Laufwerken synchronisiert werden und Ihr Risiko für einen zweiten Fehler, was die Zeit betrifft, minimiert wird – und das ist sein Nutzen.

Eine „heiße“ Ersatzfestplatte funktioniert in der Regel nicht gut. Wenn das Laufwerk eingeschaltet und in Betrieb ist, sind Motor und Betriebszeit identisch mit den anderen Laufwerken, was die Lebensdauer verkürzt. Ja, der Aktuator wird vielleicht nicht so oft genutzt, aber sofern man keinen Produktionsserver betreibt, ist es normalerweise besser, ein „kaltes“ Ersatzlaufwerk im Regal bereit zu halten.

RAID 5 (6, 10 oder jede andere Stufe) sollte niemals als „Backup“ betrachtet werden. Das wurde in unzähligen Artikeln bereits ausführlich behandelt.

Jeder RAID-Ausfall oder eine Festplatte im Array, die Fehler zu werfen beginnt, verursacht enormen Aufwand für das System, um wiederherzustellen oder zu synchronisieren. Dies führt OFT dazu, dass andere Laufwerke ebenfalls Fehler werfen oder gleichzeitig ausfallen, da sie meist alle das gleiche Alter und die gleiche Nutzung haben. Aber selbst wenn das nicht der Fall ist, verursacht das Resync viel Stress.

All das gesagt, die einzige Prävention (für andere, die dies lesen, da es für dich vielleicht zu spät ist) ist ein Backup auf ein anderes Gerät (oder vorzugsweise mehrere Geräte) als Teil einer Backup-Strategie, die dem Stellenwert und der Variabilität deiner Daten entspricht.

Wie @dolbyman bereits angemerkt hat: Sobald du Festplatten entfernt hast, Resyncs gestartet wurden und ein oder mehrere andere Laufwerke Fehler werfen, und du kein Backup hast, ist dein bester Plan ein Datenrettungsspezialist, BEVOR DU ANFÄNGST HERUMZUPROBIEREN UND DIE SACHE VERSCHLIMMERN.

Du solltest eventuell ein Support-Ticket bei QNAP Support eröffnen, aber es ist wahrscheinlicher, dass du die Situation verschlimmerst, wenn du jetzt daran herumspielst.

Vielen Dank für Ihre Zeit, dosborne.

Tatsächlich hat sich ein Hot Spare für mich über die Jahre als sehr nützlich erwiesen, ebenso wie für viele andere. Ich bin IT-Fachmann, kein Ingenieur, und eines der Unternehmen, für die ich gearbeitet habe, war EMC.

RAID ist aus mehreren Gründen kein Backup und wurde auch nie als solches behandelt. Sie haben recht, dies zum Nutzen aller Leser hervorzuheben.

Die Festplatten wurden nicht gleichzeitig gekauft, aber selbst wenn, ist es statistisch gesehen selten, dass Fehler nur wenige Minuten nach Beginn der Synchronisierung auftreten. Ja, das Resynchronisieren ist tatsächlich eine belastende Operation. Die Festplatten sind allerdings weniger als zwei Jahre alt.

Ich habe mich mit ChatGPT beraten und ein hilfreicher Ratschlag war, über SMB oder SSH auf das System zuzugreifen und zu versuchen, Dateien zu kopieren. So konnte ich einige der Dateien sehen, aber das Verzeichnis mit den für mich wichtigsten Daten musste bereinigt werden, und das war eine „verbotene“ Operation. Die Schlussfolgerung war, das System herunterzufahren und zu versuchen, die Festplatten unter Linux zu mounten.

Selten vielleicht. Aber ich habe viele Beiträge im alten Forum gesehen, in denen genau das passiert ist. Es ist kein zufälliger Vorschlag, sondern basiert auf Erfahrungen aus den tatsächlichen Umständen vieler Menschen. Es ergibt Sinn. Die Synchronisierung setzt eine Festplatte wahrscheinlich der höchsten Belastung aus, die sie je erleben wird. Je mehr Festplatten man hat, desto größer ist die Wahrscheinlichkeit, dass eine davon so stark beansprucht wird, dass etwas schiefgeht. Sicher, es mag selten sein, aber die Wahrscheinlichkeit steigt über Null.

Jedem das Seine, aber auch als „IT-Fachmann“ mit 40 Jahren Berufserfahrung würde ich mich noch nicht auf ChatGPT verlassen :slight_smile: :slight_smile: ChatGPT hätte auf den äußerst komplexen Prozess hinweisen sollen, ein RAID-Array auf einem Standard-Linux-Rechner zu „mounten“, da QNAP-Systeme insbesondere mehrere Ebenen haben, die berücksichtigt werden müssen. Zufällig vorgeschlagene Chat-Befehle auszuführen oder zu versuchen, das Dateisystem zu laden, ohne zu wissen, was man tut, gefährdet jede Chance auf eine tatsächliche Datenwiederherstellung.

Ich empfehle Ihnen dringend, sich an die echten Profis zu wenden, beginnend mit dem QNAP-Support, um zu sehen, ob sie Ihnen mit tatsächlichem Wissen über ihre System-Interna richtig weiterhelfen können. Falls sie Ihnen keine Hilfe bieten können, müssen Sie, wie erwähnt, möglicherweise auf Datenrettungsspezialisten zurückgreifen.

Der Zugriff auf die Dateien per SMB/FTP/SSH war ein guter Vorschlag, und in seltenen Fällen gelingt so die Wiederherstellung einiger Dateien. Letztlich scheint die Möglichkeit der Wiederherstellung davon abzuhängen, wie schwerwiegend die Fehler der verbleibenden Festplatte wirklich sind.

Ich wünsche Ihnen viel Erfolg bei Ihrem Vorhaben und bin zuversichtlich, dass der Support Sie zumindest ein Stück weit weiterbringen kann.

Sich nicht auf ChatGPT zu verlassen, ist ein berechtigter Punkt. Deshalb bin ich zuerst hierher gekommen. Ich vertraue den Leuten hier mehr als jeder KI. Es war ein verzweifelter Moment, als ich mich dann doch an ChatGPT gewandt habe. Die Idee, die Dateien über SMB zu finden, war allerdings gut.

OK. Ich habe das anders verstanden. Ich habe gelesen, dass du das Laufwerk, das angefangen hat, Fehler zu werfen, herausgezogen und das erste entfernte Laufwerk in diesen Slot gesteckt hast.

Es ist nicht wirklich ein Hot Spare, aber da die Gesamtkapazität der Laufwerke (AnzahlLaufwerke-1)*Kapazität_des_kleinsten_Laufwerks beträgt, hast du Redundanz eingebaut, falls ein Laufwerk ausfällt. Mir ist nicht klar, wie ein „Hot Standby“-Laufwerk funktionieren soll, da es nicht Teil des RAID-Arrays ist. Selbst wenn es alle deine Daten hat, macht das keinen Unterschied. Sobald du es zum RAID hinzufügst, beginnt der Wiederaufbau und die Daten werden auf das Laufwerk geschrieben, wie es für das Array benötigt wird. Aber mach du ruhig…

Unterm Strich: Wenn ein RAID synchronisiert, darfst du keine Laufwerke entfernen.

An deiner Stelle würde ich jetzt ein Ticket bei QNAP eröffnen.

Um eine Verschlimmerung der Situation zu verhindern, bitten wir Sie, derzeit keine Festplatten auszutauschen oder Änderungen an den Systemeinstellungen vorzunehmen.

Wir empfehlen Ihnen dringend, Ihre wichtigen Daten so bald wie möglich zu sichern und ein Support-Ticket bei uns einzureichen. Unser Support-Team wird Sie anschließend bei der weiteren Analyse und Lösung unterstützen. Vielen Dank!

Hallo Steve,

da ich bisher noch kein Support-Ticket eröffnet habe, könntest du mir bitte sagen, wie ich das am besten mache?

Das System ist heruntergefahren.

Bezüglich dieses Problems reichen Sie bitte ein Support-Ticket direkt über die Helpdesk-App auf Ihrem NAS ein, oder Sie können dies auch über folgende URL tun: Customer Service - QNAP

Vielen Dank!

Bezüglich Hot Spare: Sie weisen ein Hot-Spare-Laufwerk der RAID-Gruppe oder dem Pool zu. Neben diesem Ersatzlaufwerk befindet sich eine Anzeige mit der Bezeichnung „Spare“. Es ist also im Grunde Teil der RAID-Gruppe und wird automatisch aktiviert, sobald ein Laufwerk ausfällt, und beginnt mit der Synchronisierung. Daher ist die Zeit, in der Sie einem zweiten Laufwerksausfall ausgesetzt sind, kürzer als bei manuellen Eingriffen. So haben Sie mehr Zeit, ein Ersatzlaufwerk zu beschaffen.

Allerdings sollte man beachten, dass der zusätzliche Stress durch das Synchronisieren auf das neue Ersatzlaufwerk dazu führen kann, dass andere Laufwerke Fehler bekommen oder komplett ausfallen. Das ist nicht nur theoretisch, sondern es besteht tatsächlich ein Risiko, auch wenn es relativ gering ist.

Merke dir die Regel: RAID ist KEIN BACKUP. Hot Spares sind KEIN BACKUP.

:slight_smile:

Also wenn eine Festplatte ausfällt, werden Sie sie nicht ersetzen?

Du verstehst das Problem nicht. Viele verlassen sich auf RAID und haben keine Backups. Dadurch glauben sie, in Sicherheit zu sein. Die Realität sieht anders aus. Dieser Beitrag, und viele ähnliche im gesamten Internet, besagen, dass der einzige Weg, deine Daten zu schützen, darin besteht, sie auf ein externes Medium zu sichern.

Jede Aktion mit deinem Volume oder den physischen Festplatten birgt Risiken. Schau einfach mal in dieses Forum, wo Leute auf RAID, Snapshots oder Volumes innerhalb desselben NAS (Network Attached Storage) vertrauen, dann irgendetwas zufällig machen und überrascht sind, wenn sie nicht mehr auf ihre Daten zugreifen können.

Es ist allgemein bekannt, dass das Wiederherstellen eines Arrays alle Festplatten belastet.

Jeder Nutzer sollte eine Backup-STRATEGIE haben.

Eine Backup-Strategie identifiziert die Risiken und erstellt einen Plan basierend auf dem Wert der Daten. Schützt du dich vor einem Festplattenfehler, einem Laufwerksausfall, mehreren Laufwerksausfällen, einem NAS-Ausfall, einem Brand, einer Überschwemmung, Diebstahl, versehentlichem Löschen von Dateien, absichtlichem Löschen von Dateien, Malware, Stromausfall, Netzwerkausfall, Cloud-Ausfall, Malware gegen das NAS, Malware gegen den Cloud-Dienst usw.?

Manche Daten sind wichtig, manche nicht. Jeder Datensatz braucht eine passende Strategie. Manche müssen nicht gesichert werden (könnten erneut heruntergeladen werden), manche brauchen nur eine einfache Kopie an einen anderen Ort, manche benötigen Versionierung, manche Replikation, manche gestufte Backups, manche aktive Backups.

Nur der Nutzer kann entscheiden, was richtig ist, ABER ES MÜSSEN INFORMIERTE ENTSCHEIDUNGEN AUF BASIS VON TATSÄCHLICHEN DATEN SEIN. Zu glauben, man sei sicher, weil man z.B. RAID 1 eingerichtet hat, schützt nicht vor dem versehentlichen Löschen einer wichtigen Datei, Diebstahl, NAS-Ausfall usw. Mit genau derselben Konfiguration, aber als 2 Volumes, wäre vielleicht ein gestuftes Backup auf eine zweite Festplatte für diesen Anwendungsfall wichtiger – vielleicht auch nicht.

Jede Situation und jeder Datensatz ist einzigartig. Es gibt keine einzig richtige Antwort. Es geht darum, den Nutzer zu informieren, damit er entscheiden kann, wie wertvoll die Daten für ihn sind und eine Strategie wählt, die wahrscheinlich mehrere Lösungen beinhaltet. Beispiel: Manche Daten müssen nicht gesichert werden, manche kommen auf ein RAID-Array, manche werden in die Cloud kopiert, manche auf ein anderes NAS repliziert, manche auf ein USB-Laufwerk kopiert und im Schließfach aufbewahrt. Als privater Nutzer verwende ich all diese Strategien und mehr. Jeder Datensatz wird einer Backup-Strategie zugeordnet, basierend auf meiner Einschätzung des Wertes der Daten.

Außerdem ist das Ersetzen der Hardware nicht dasselbe wie das Ersetzen der Daten.

Eine einfache Lösung in einer verzweifelten Situation: Bevor du das Laufwerk ersetzt, mache ein (neues) Backup der Daten (Idealerweise hat man natürlich immer Backups, sodass dies weniger wichtig ist). Selbst im Degraded Mode ist ein Backup weniger riskant als ein Rebuild. Sobald die Daten gesichert sind, kann man sich um das Hardwareproblem kümmern.