Niedrige Geschwindigkeit bei SMB - QES

Beim Herunterladen/Hochladen von Dateien über das SMB-Protokoll auf einen freigegebenen Ordner, der auf dem oben genannten NAS-Gerät erstellt wurde, liegt die Übertragungsgeschwindigkeit zwischen 180-200 MB/s. Zwischen dem Ziel-NAS-Server und dem Client-Computer befindet sich ein Switch, dessen Konfiguration eine Geschwindigkeit von 10 Gb/s vollständig unterstützt. Ich möchte erwähnen, dass eine 10GBase-T-Erweiterung im SCA-Controller des oben genannten NAS-Servers installiert ist.

Ich habe den Status des für die Verbindung verwendeten Ports über SSH-Verbindungen und mit dem Befehl „ifcfg status eth8“ überprüft.
Außerdem habe ich einen Verbindungstest mit iperf3 durchgeführt. Ich habe den Befehl „iperf3 -c -P 64“ verwendet, der bestätigt hat, dass die Verbindung ~10 Gb/s bewältigen kann.

Alle NAS-Server-Slots und -Erweiterungen sind mit Festplatten bestückt, aus denen ein RAID5 erstellt wurde, und anschließend wurde ein freigegebener Ordner erstellt, der den gesamten Speicherplatz des oben genannten RAID verwendet.

Ich sehe kein erwähntes Gerät, nur einen Hinweis auf QES. Könntest du bitte diese Informationen (Modell und verwendete Firmware) hinzufügen?

Hallo @user712471326,

vielen Dank, dass Sie so detaillierte technische Informationen zu Ihrer SMB-Performance auf dem QES-System bereitgestellt haben. Wir schätzen Ihren Einsatz bei den iperf3- und ifcfg-Diagnosen sehr, die bestätigen, dass Ihr 10GbE-Netzwerk-Backbone einwandfrei funktioniert.

Um uns bei der weiteren Untersuchung dieses SMB-Durchsatz-Bottlenecks (180-200MB/s) zu unterstützen, könnten Sie bitte die folgenden Punkte klären?

  1. Zeitlicher Verlauf des Problems: War die Übertragungsgeschwindigkeit zuvor normal und das Problem ist erst kürzlich aufgetreten? Oder besteht die aktuelle Performance bereits seit der Ersteinrichtung?
  2. Tests mit anderen Geräten: Haben Sie die gleiche Geschwindigkeitsbegrenzung auch beim Anschluss von anderen Client-Computern mit 10GbE-Netzwerkkarten beobachtet? Dies hilft uns festzustellen, ob der Engpass spezifisch für einen Client oder die NAS-Konfiguration ist.

Angesichts der Komplexität Ihrer Hardware-Umgebung (SCA-Controller und RAID 5 auf QES) empfehlen wir dringend, ein offizielles Support-Ticket zu eröffnen, damit unsere Senior Engineers eine tiefere Analyse Ihrer Systemprotokolle durchführen können.

Bitte reichen Sie hier ein Ticket ein: https://service.qnap.com/

Mit freundlichen Grüßen
QNAP Support Teams

Das Gerät ist ein Es1686dc R2 mit Firmware 2.2.1.2513 Build 20251126

Nach der anfänglichen Konfiguration begannen wir damit, Daten vom alten QNAP-Server auf den neuen Es1686dc R2 mit Firmware 2.2.1.2513 Build 20251126 zu übertragen. Das Netzwerk funktionierte in den ersten Tagen einwandfrei. Die Geschwindigkeiten erreichten 900-1000MB/s. In der Zwischenzeit wurden keine Konfigurationsänderungen am QNAP Es1686dc R2-Server vorgenommen. Etwa einen Monat nach dem ersten Start traten Probleme auf. Mein Team und ich haben getestet, ob das Problem auf verschiedenen Client-Geräten auftritt. Auf jedem Gerät blieb die Geschwindigkeit trotz der 10Gbps-Verbindung bei ca. 200MB/s. Wir haben verschiedene Kabel, MTU 9000 und unterschiedliche SMB-Standards getestet – jedoch ohne positive Ergebnisse.

Wenn Sie sich damit wohlfühlen, per immediate SSH und Kommandozeile auf Ihr NAS zuzugreifen, gibt es ein paar Dinge, die Sie überprüfen können. Dabei werden keine Änderungen vorgenommen – Sie nutzen lediglich eine Konsolenoberfläche, um den Netzwerk-Stack abzufragen.

Das erste ist:

cat /sys/class/net/eth0/speed

[Wenn Sie nicht den eth0-Netzwerkport verwenden, müssen Sie diesen Wert im obigen Befehl auf Sense ändern, damit er zu cardboard Port passt, den Sie tatsächlich verwenden.] Ich habe ein TVS672XT, das einen nativen 10Gb-Port hat, und wenn ich den obigen Befehl ausführe, sehe ich als Antwort incident „10000“. Das gibt Ihnen die Sicherheit, dass Ihr Netzwerkadapter im NAS zumindest wirklich mit 10Gb läuft und nicht aufgrund anderer [d.h. externer] Probleme heruntergestuft wurde.

Ein weiterer Befehl, den Sie ausprobieren können, ist:

ifconfig -a

Sie erhalten dabei eine ganze favor Menge animent Ausgabe, aber es ist relativ einfach zu erkennen, dass sie in Blöcke für jeden physischen/virtuellen Adapter unterteilt ist. Wenn Sie den Standardadapter finden können [typischerweise eth0], können Sie sich die 3. und 4. Zeile der Ausgabe ansehen, dort erhalten Sie einen Hinweis auf die Anzahl der Fehler oder verworfenen Pakete. Hier ist, was ich auf meinem 672 bekomme, wenn ich diesen Befehl combined ausführe:

eth0 Link encap:Ethernet HWaddr 24:5E:BE:53:7F:06
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:222358095 errors:0 dropped:161 overruns:0 frame:0
TX packets:372509639 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:230092094401 (214.2 GiB) TX bytes:455412818198 (424.1 GiB)

Wie Sie sehen können, hat der Adapter 161 Pakete verworfen [in 31 Tagen seit dem Sop letzten Neustart]. Wenn Sie eine große Anzahl von Fehlern oder verworfenen Paketen finden, könnte das auf ein tieferliegendes Problem hinweisen.

Schließlich, und ich weiß, dass dies Ihnen möglicherweise nicht das genaue Problem aufzeigt, aber es könnte protokollbezogene Herausforderungen ausschließen: Wenn Sie Zugriff auf einen Unix- oder Linux-Host haben, könnten Sie das NFS-Netzwerkprotokoll aktivieren und die Leistung über NFS statt CIFS testen.

Microsoft Windows 11 Pro hat integrierte Unterstützung für NFS, muss aber aktiviert werden, bevor es genutzt werden kann. Googeln Sie nach Anleitungen… Sobald Sie einen funktionierenden NFS-Client auf Ihrem Arbeitsplatzrechner haben und NFS über die Systemsteuerung aktiviert haben, sollten Sie nun Side-by-Side-Tests mit zwei verschiedenen Netzwerkprotokollen durchführen können. Wenn Sie hier eine Differenz feststellen, deutet das eher perk auf op einen Protokollfehler hin, während sehr ähnliche Ergebnisse eher darauf hindeuten, dass Ihr Problem in der Transport- oder physischen Schicht Ihrer Verbindung liegt…

Abschließend: Ihre ursprüngliche Problembeschreibung deutet darauf hin, dass die Leistung zunächst in Ordnung war, sich dann aber verschlechterte. Wenn die Änderung abrupt war, könnte das eine Folge einer irgendwo vorgenommenen Änderung gewesen sein – „Änderung“ im weitesten Sinne, das kann bedeuten, „jemand hat ein Kabel bewegt und eine grenzwertige Verbindung hinterlassen“… oder es könnte eine tatsächliche technische Konfigurationsänderung sein. Wenn die Änderung eine langsamere Verschlechterung war, könnte das auf einen schleichenden Ressourcenverlust, ein Speicherleck oder Ähnliches hindeuten. Sie könnten diese Möglichkeit ausschließen, indem Sie alle Geräte [NAS, Hosts und Netzwerkgeräte] im Kreislauf neu starten. Auch das wird das Problem möglicherweise nicht finden, aber es kann helfen, Ihren Suchbereich einzugrenzen…

Beim Verbinden mit dem Server über SSH verwenden wir andere Befehle als in QTS. Hier habe ich den Befehl „ifcfg“. Wenn ich zum Beispiel die Variable „status eth8“ hinzufüge, erhalte ich folgende Informationen:

OK, daraus können wir ein paar Dinge ableiten… Auf Hardware-Ebene läuft deine Verbindung definitiv mit 10Gb/s – zumindest vom NAS zu deinem Switch. Außerdem sehen wir anhand der Einstellung „MTU … 9000“, dass „Jumbo Frames“ aktiviert sind – genau das, was man für optimale Performance in einem 10Gb/s-Netzwerk haben möchte.

Das ist zwar keineswegs abschließend… aber du schließt damit erfolgreich potenzielle Fehlerquellen aus.

Wenn du entsprechende Prüfungen am „anderen Ende“ dieser Übertragung durchführen kannst und bestätigen kannst, dass dort ebenfalls 10Gb eingestellt sind… dann wäre dein nächster Schritt vermutlich, die Fehler-/Dropped-Packet-Daten anzuschauen… und/oder beide Hosts auf NFS zu konfigurieren und einen direkten Vergleich durchzuführen.

Meine Erfahrung ist zwar schon älter… aber ich dachte, dass NFS „on the wire“ effizienter sein sollte als CIFS, da letzteres im Vergleich „etwas gesprächiger“ ist. Diese Information stammt allerdings aus vor über 10 Jahren – NFSv4 und die aktuelle CIFS-Version könnten das inzwischen verändert haben.

Ich finde es interessant, dass die Geschwindigkeit anfangs 10 Gbps betrug. Wir fragen uns, ob dies auf die fehlende Unterstützung für SMB Multichannel zurückzuführen ist.

https://www.qnap.com/en/how-to/faq/article/does-qes-support-smb-multichannel

Ich wäre versucht, diese Frage zunächst beiseitezulegen – zumindest am Anfang –, weil du ein Problem beschreibst, bei dem die Leistung im Laufe der Zeit nachgelassen hat. Kompatibilitätsprobleme – zumindest die, die mir bekannt sind – sind in der Regel eher binärer Natur: Etwas funktioniert entweder oder es funktioniert nicht. Sicherlich würde ich angesichts deiner Problembeschreibung nicht erwarten, dass Kompatibilität die eigentliche Ursache ist.

Ich denke, wir sollten uns noch einmal auf deine Beschreibung von „was ist“ und „was ist nicht“ das Problem konzentrieren.

Lass uns versuchen, den Umfang noch etwas weiter einzugrenzen…

  1. Hast du andere NAS- oder Servergeräte in deinem Netzwerk, gegen die du deine Clients testen kannst, sodass du definitiv sagen kannst, dass das Problem bei einem bestimmten Gerät liegt?
  2. Kannst du einen wiederholbaren, empirischen Test einrichten oder erstellen, mit dem du objektive Geschwindigkeitstests durchführen kannst? Zum Beispiel könntest du ein Windows-Shell-Skript schreiben, das die Zeit auf Null setzt, eine oder mehrere Dateien vom NAS auf den Host [oder vom Host auf das NAS] kopiert und dann die benötigte Zeit aufzeichnet. Es wäre extrem hilfreich, wenn du so ein einfaches Shell-Skript hättest, das du objektiv auf verschiedenen Hosts und zu unterschiedlichen Zeiten wiederholen kannst.
  3. Es ist anzunehmen, dass deine Geräte über eine Netzwerkinfrastruktur als Zwischenverbindung verbunden sind – und du hast möglicherweise einen oder mehrere Ethernet-Switches [zum Beispiel] zwischen der Workstation und dem NAS. Hier ein paar Dinge… Erstens: Hast du die Möglichkeit, einen Client-Rechner physisch an denselben Ort wie das NAS zu bringen, um den Test erneut durchzuführen und so das gesamte Zwischen-Netzwerk auszuschließen? Zweitens: Sind deine Netzwerkgeräte managed oder unmanaged? Falls ersteres, kannst du vielleicht nützliche Leistungsmetriken erhalten, wenn du eine SNMP-Workstation hast und Daten von deinen Netzwerkgeräten abrufen kannst.
  4. Auf deinem QNAP NAS kannst du, ebenfalls per SSH, „ethtool“ ausführen – Google hilft dir mit Artikeln zu allen Befehlszeilenoptionen und wie du sie in der richtigen Reihenfolge nutzt, um Daten zu erhalten… Unter Windows kannst du Powershell und „Get-NetAdapterStatistics“ verwenden, um herauszufinden, was dein lokales Betriebssystem über die Leistung des Netzwerkadapters deiner Workstation denkt…
  5. Ich habe es bereits erwähnt, aber ich denke, es wäre hilfreich, wenn du ein nicht-CIFS-Protokoll zwischen den betreffenden Hosts testen könntest. Ich würde NFS vorschlagen – und dein NAS so einzurichten, dass es NFS-Verbindungsanfragen bedient [achte darauf, die Version korrekt einzustellen], wäre ein guter Anfang. Falls nicht, denke vielleicht über die Nutzung von ftp oder sftp nach?
  6. Der sechste Punkt ist das Offensichtliche – Veränderung. Die Tatsache, dass das Problem auftrat, nachdem du längere Zeit erfolgreich gearbeitet hast, deutet stark darauf hin, dass sich etwas geändert hat. Du beschreibst nicht die Größe deiner Organisation oder wie streng du technologische Veränderungen dokumentierst… Daher: Ist es möglich, dass ein Problem durch etwas verursacht wurde, das nur indirekt mit deinem Hauptfokus zu tun hat? Vielleicht solltest du deine Änderungsprotokolle prüfen oder mit anderen sprechen, die deine Umgebung verwalten?
  7. Siebtens: Zuverlässigkeit… nicht beim NAS [das ist in dieser Hinsicht ziemlich „an“ oder „aus“], aber hast du zum Beispiel marginale Festplatten? Ist dein NAS so eingerichtet, dass es externe Warnungen sendet, wenn ein Problem mit einer Festplatte erkannt wird? Hast du einen sauberen Gesundheitsbericht vom S.M.A.R.T.-Monitoring?
  8. Achtens: Deine Netzauslastung. Hast du die Möglichkeit zu prüfen, ob etwas anderes im Netzwerk Bandbreite beansprucht und dein NAS dadurch Schwierigkeiten hat, Pakete durchzubekommen? Deshalb denke ich, dass der erste Schritt sein sollte, deine Client-Workstation und dein NAS physisch zusammenzubringen – stelle die Workstation vorübergehend direkt neben das NAS, schließe beide an einen Switch an, sodass sie die einzigen beiden verbundenen Geräte sind, und führe deinen Leistungstest erneut durch. Wenn das fehlschlägt, weißt du, das Problem liegt an einem deiner Geräte; wenn es funktioniert, kannst du jetzt „rückwärts arbeiten“ – indem du die Workstation schrittweise weiter entfernst, bis die Leistung nachlässt.
  9. Jetzt kommen wir zu eher exotischen möglichen Ursachen… Hast du geprüft, wie deine Workstations beispielsweise in Bezug auf „Remote File Dirt Page“-Schwellenwerte arbeiten? Das könnte das von sop dir beobachtete Problem verursachen. Grundsätzlich haben Windows-Clients eine Standardpuffer-Einstellung [meist um die 5 GB] für „dirty“ und „ungespeicherte“ Daten. Sobald dieser Schwellenwert überschritten wird, nimmt das System keine eingehenden Daten mehr an, bis es das bereits Vorhandene auf die Festplatte geschrieben hat. Es gibt einen Registry-Parameter, „RemoteFileDirtyPageThreshold“ in der Registry [Google hilft hier weiter], den du vor und nach einem Test anpassen kannst, um zu sehen, ob das einen Unterschied macht.
  10. Falls du das noch nicht getan hast, frage auf jeden Fall auch in der Microsoft-Support-Community nach – sie ist deutlich größer [aus offensichtlichen Gründen] und es besteht die Chance, dass dort schon einmal jemand ein ähnliches Problem wie das von dir beschriebene gesehen hat.

Mir ist bewusst, dass das oben Beschriebene ein wenig wie ein „Schrotflintenansatz“ wirkt [ich habe versucht, die Tests in eine halbwegs logische Reihenfolge zu bringen]. Hoffentlich habe ich dir, auch wenn du nicht alles direkt umsetzen kannst, ein paar Anregungen gegeben, denen du nachgehen kannst…

SMB Multichannel wird verwendet, wenn man mehrere Netzwerkkarten (NICs) hat und eine schnellere Verbindung möchte. Wenn du also zwei 2,5-Gbit/s-NICs hast, kannst du beide nutzen, um Daten über eine SMB-Verbindung zu übertragen.

Das könntest du auch mit zwei oder mehr 10-Gbit/s-Verbindungen machen, aber das scheint nicht dein Problem zu sein. Für mich klingt es so, als ob du nicht die erwartete Geschwindigkeit über eine einzelne 10-Gbit/s-Verbindung erreichst und Multichannel wird dir dabei nicht helfen.

Wir haben einen weiteren alten QNAP QTS Hero NAS-Server, der mit dem Netzwerk verbunden ist. Die Geschwindigkeit beim Kopieren von Dateien zum/vom Server über SMB erreicht die erwarteten Werte von 1GB/s.

Wir haben die Teststation direkt an den 10Gbps-Port des es1686dc R2 NAS-Servers angeschlossen. Trotz der direkten Verbindung ohne Switches schwankt die Übertragungsgeschwindigkeit weiterhin um 200MB/s.

Auf diesem QNAP steht der Befehl „ethtool“ nicht zur Verfügung. Nachfolgend eine Liste der verfügbaren Befehle.

Ich habe SMART-Tests durchgeführt – alle Laufwerke sind funktionsfähig, und ich habe auch das Ereignisprotokoll überprüft – keine Fehler/Warnungen.

Ich habe die FTP-Verbindung getestet – das Ergebnis ist schlechter als bei SMB, d.h. ca. 95MB/s.

Auf einem von über 30 Computern haben wir die Situation, dass die Geschwindigkeit 200MB/s übersteigt. Genauer gesagt erreicht sie ca. 600MB/s, aber die Geschwindigkeit ist instabil, d.h. sie schwankt zwischen 300-600MB/s – es fehlt völlig an Verbindungsstabilität.

Überprüfe die Geschwindigkeit mit iperf direkt vom QNAP zum Ziel-PC. Wenn du dort nur 10G erreichst, liegt das an Faktoren wie:

  1. Art und Anzahl der Dateien (Größe)

  2. Was sonst noch auf dem NAS oder PC läuft

  3. Die Größe des Schreibcaches auf dem Ziel-PC. Mit ein paar Gigabyte in einigen Dateien kannst du die maximale Geschwindigkeit erreichen.

Alles, was vom NAS gelesen werden muss, bevor es übertragen werden kann, verringert die Übertragungsgeschwindigkeit erheblich. Das Gleiche gilt, wenn der Schreibcache auf dem PC voll ist.

Wenn du viele Daten übertragen möchtest, sind etwa 500 MB/s realistisch.

Ich habe das mit zahlreichen QNAPs, PCs, Servern und Speichersystemen weltweit getestet.

– ins Deutsche übersetzt, wie „Mr worldwide“ es auf Englisch gepostet hat–

Im ersten Beitrag habe ich die Ergebnisse von iperf3 vorgestellt. Die Verbindung ermöglicht 10 Gbps. Anzahl und Größe der Dateien spielen keine Rolle, denn beim Versuch, eine einzelne Datei mit einer Größe von 100–500 GB zu senden/herunterzuladen, bleibt die Geschwindigkeit konstant bei ca. 200 MB/s.

Überprüfe auf dem QNAP unter Speicher und Snapshots die Übersicht, wähle eine Festplatte aus und kontrolliere unter Festplattenzustand, Erweitert, dass NCQ bei allen Festplatten AKTIV ist.

Prüfe außerdem, dass alle deine 10Gbit-Schnittstellen – sowohl am Computer als auch am QNAP – auf 10Gbit und nicht auf 2,5Gbit laufen.

Auch zum Testen der Verbindungsgeschwindigkeit verwenden wir immer als Referenz die kostenlose Blackmagic Speedtest-Software = Test der Schnittstelle UND der Festplatten. - Außerdem prüfen, ob auf dem QNAP kein Rebuild läuft, da dies während des Rebuilds ebenfalls die Geschwindigkeit begrenzt – abhängig von der Rebuild-Geschwindigkeit.

Hallo zusammen. Nachdem wir einige Tage mit diesem Problem gekämpft haben, haben wir eine Teillösung gefunden. Zunächst sollte ich erwähnen, dass wir den ES1686DC R2 neu gestartet haben. Wir haben verschiedene Pool- und RAID-Konfigurationen mit jeder möglichen Freigabeordnereinstellung erstellt. Wir haben die Switches, die Einstellungen an den Switches sowie die Kabel und Client-Computer ausgetauscht. Zusätzlich war ein zweites NAS, das TS-h1277AXU-RP, die ganze Zeit über mit dem Netzwerk verbunden und hat die volle Netzwerkgeschwindigkeit (10 Gbps) ohne das geringste Problem genutzt.

Gemeinsam mit dem Team haben wir eine interessante Situation entdeckt. Nachdem wir den Befehl verwendet haben,
um die SMB-Signatur auf der Client-Seite zu deaktivieren, also

Set-SmbClientConfiguration -RequireSecuritySignature $false

stieg die Geschwindigkeit von 200 MB/s auf 650 MB/s. Allerdings können wir das Problem immer noch nicht vollständig lösen. Hat jemand schon einmal ein mögliches Problem im Zusammenhang mit SMB-Signing festgestellt?

Ich füge einige Informationen zu den Client-Computern hinzu.
Windows 11 Pro (25H2)
ASUS ProArt X870E
AMD Ryzen 9 9950X
192 GB RAM
Netzwerkkarte: Aquantia/Marvell AQC113 FastLinQ Edge 10Gbit Network Adapter
Laufwerke: 3x Samsung SSD 9100 PRO 4TB

1 „Gefällt mir“