こんにちは。新しいTS-1232PXU-RPを企業環境でセットアップしようとしていますが、深刻な安定性の問題に直面しています。
ファームウェアはQTS 5.2.8.3359です。
NASのメモリは16GBに増設済みです。
8台の機械式ハードディスクをRAID-6アレイで使用しています。
目的は、Linuxワークステーション(RHEL 9.7およびRHEL 10.1)向けにNFSv4.1でフォルダを共有することです。
NASはほぼ工場出荷時の設定のままで、デフォルトの管理者アカウント、単一のIPアドレス、NTPによる時刻同期、DNSサーバーによるホスト名解決、NAS上でNFSサーバーが有効化されているだけです。
NASとクライアントのネットワーク接続は、スイッチへの1Gbpsイーサネット直結です。単一サブネットで、ルーティングやファイアウォールはありません。
NASには現在大きな負荷はかかっていません。テスト段階で、クライアントPCの台数も10台未満です。
マニュアルをよく読み、以下のように共有フォルダを設定しました:
- サーバーはNFSv4.1のみ許可(NFSv2/v3/v4.0は無効化)
- 共有フォルダはNFSクライアント192.168.1.0/24、sec=sys、rw、no_root_squashで設定
クライアント側では、rootで以下のコマンドを実行しています:
mount -t nfs -o nfsvers=4.1,sec=sys,rw <ip_of_nas>:/shared_folder /mnt/shared_folder
ほとんどのクライアントは正しくフォルダをマウントでき、マウントコマンドは約1秒で完了し、リモートファイルにアクセスできます。
問題1:ランダムに、一部のクライアント(毎回同じとは限らない)がマウントに失敗します。"mount"コマンドが永遠にハングし、CTRL+Cで中断します。何度試しても同じ結果です。
ワークステーションを再起動すると、うまくいくこともあれば、ダメなこともあります。再起動を繰り返す必要があります。特定のワークステーションで丸一日動作しないこともあり、翌日には動作することもあります…。
マウントがハングしているとき、クライアントで「dmesg」を実行すると、以下のメッセージが表示されます:
RPC: state manager: lease expired failed on NFSv4 server with error 10082
問題2:ワークステーションが共有フォルダを正しくマウントできていても、数時間後に(何も操作していなくても)ハングすることがあります。クライアントのdmesgには「NFS server not responding, still trying …」と表示され、再度umount/mountし直す必要があります。
問題3:NASを再起動すると、すべてのクライアントが「NFS server not responding, still trying」と表示され、NASがネットワークに復帰してもアクセスできません。再度umount/mountし直す必要があり、一部のクライアントは再び失敗します(問題1に戻る)。
なお、他の(QNAP以外の)NFSサーバーではワークステーションとの連携に全く問題がありません。そのため、NAS(サーバー)側に何か問題があるのではと疑っています。
NFSサーバーを正しく動作させるためのアドバイスをいただけないでしょうか?