QNAP TVS-473が頻繁に電源オフになる

私のQNAPがランダムに電源が切れてしまいます。特に説明も見当たらず、行ってみると電源が切れています。数日から数週間持つこともあります。何が起きているのかを調べるには、システムのどこを確認するのが一番良いでしょうか?QTS 5.2.3.3006を使用しています。

dmesg にエラーメッセージはありますか?メモリ障害はこのような問題の有力な候補です(すべて標準設定ですか、それとも何か手を加えていますか?)

それをどうやって見つけるか調べているところです。dmesgにはあまり詳しくないので、Googleで調べてみて、分かったことを共有します。

はい、できました。テキストを検索したところ、私が見つけた唯一の「エラー」はこれです:

「[ 8.207133] ACPI: \PR.P003: Found 2 idle states[ 8.211991] ERST: Error Record Serialization Table (ERST) support is initialized.」

何か他に探すべきものはありますか?

SSHを使用してdmesgを確認できます

https://www.qnap.com/ja/how-to/faq/article/how-do-i-access-my-qnap-nas-using-ssh

上記で見つけたエラー以外に、何を確認すればよいですか?

メモリエラーが最初に考えられます

I searched for the word memory in the dmesg and these are what I found:

[ 0.006862] ACPI: Reserving FACP table memory at [mem 0xdd951e38-0xdd951f43]
[ 0.006864] ACPI: Reserving DSDT table memory at [mem 0xdd94a200-0xdd951e32]
[ 0.006865] ACPI: Reserving FACS table memory at [mem 0xddc8cc80-0xddc8ccbf]
[ 0.006866] ACPI: Reserving APIC table memory at [mem 0xdd951f48-0xdd951fc5]
[ 0.006867] ACPI: Reserving FPDT table memory at [mem 0xdd951fc8-0xdd95200b]
[ 0.006868] ACPI: Reserving FIDT table memory at [mem 0xdd952010-0xdd9520ab]
[ 0.006870] ACPI: Reserving MCFG table memory at [mem 0xdd9520b0-0xdd9520eb]
[ 0.006871] ACPI: Reserving HPET table memory at [mem 0xdd9520f0-0xdd952127]
[ 0.006872] ACPI: Reserving WDRT table memory at [mem 0xdd952128-0xdd95216e]
[ 0.006873] ACPI: Reserving ASF! table memory at [mem 0xdd952170-0xdd952245]
[ 0.006874] ACPI: Reserving UEFI table memory at [mem 0xdd952248-0xdd952289]
[ 0.006875] ACPI: Reserving IVRS table memory at [mem 0xdd952290-0xdd95235f]
[ 0.006876] ACPI: Reserving SSDT table memory at [mem 0xdd952360-0xdd952bb3]
[ 0.006877] ACPI: Reserving SSDT table memory at [mem 0xdd952bb8-0xdd95b2f1]
[ 0.006878] ACPI: Reserving CRAT table memory at [mem 0xdd95b2f8-0xdd95b8bf]
[ 0.006879] ACPI: Reserving SSDT table memory at [mem 0xdd95b8c0-0xdd95cd3e]
[ 0.006880] ACPI: Reserving SSDT table memory at [mem 0xdd95cd40-0xdd95d3d1]
[ 0.006881] ACPI: Reserving SSDT table memory at [mem 0xdd95d3d8-0xdd95e9c7]
[ 0.006882] ACPI: Reserving EINJ table memory at [mem 0xdd95e9c8-0xdd95eaf7]
[ 0.006883] ACPI: Reserving ERST table memory at [mem 0xdd95eaf8-0xdd95ed27]
[ 0.006885] ACPI: Reserving BERT table memory at [mem 0xdd95ed28-0xdd95ed57]
[ 0.006886] ACPI: Reserving HEST table memory at [mem 0xdd95ed58-0xdd95edff]
[ 0.006895] ACPI: Local APIC address 0xfee00000
[ 0.006933] Zone ranges:
[ 0.006934] DMA [mem 0x0000000000001000-0x0000000000ffffff]
[ 0.006936] DMA32 [mem 0x0000000001000000-0x00000000ffffffff]
[ 0.006938] Normal [mem 0x0000000100000000-0x000000087effffff]
[ 0.006939] Movable zone start for each node
[ 0.006940] Early memory node ranges
[ 0.006941] node 0: [mem 0x0000000000001000-0x000000000009dfff]
[ 0.006943] node 0: [mem 0x0000000000100000-0x0000000007ffffff]
[ 0.006944] node 0: [mem 0x0000000008200000-0x00000000dd6cbfff]
[ 0.006945] node 0: [mem 0x00000000dd7c9000-0x00000000dd8c5fff]
[ 0.006946] node 0: [mem 0x00000000ddf77000-0x00000000deffffff]
[ 0.006947] node 0: [mem 0x0000000100000000-0x000000087effffff]
[ 0.006950] Initmem setup node 0 [mem 0x0000000000001000-0x000000087effffff]

[ 0.103354] PM: hibernation: Registered nosave memory: [mem 0x00000000-0x0000 0fff]
[ 0.103356] PM: hibernation: Registered nosave memory: [mem 0x0009e000-0x0009 efff]
[ 0.103357] PM: hibernation: Registered nosave memory: [mem 0x0009f000-0x0009 ffff]
[ 0.103358] PM: hibernation: Registered nosave memory: [mem 0x000a0000-0x000d ffff]
[ 0.103359] PM: hibernation: Registered nosave memory: [mem 0x000e0000-0x000f ffff]
[ 0.103361] PM: hibernation: Registered nosave memory: [mem 0x08000000-0x081f ffff]
[ 0.103363] PM: hibernation: Registered nosave memory: [mem 0xdd6cc000-0xdd7c 8fff]
[ 0.103365] PM: hibernation: Registered nosave memory: [mem 0xdd8c6000-0xddc8 dfff]
[ 0.103366] PM: hibernation: Registered nosave memory: [mem 0xddc8e000-0xddf7 6fff]
[ 0.103367] PM: hibernation: Registered nosave memory: [mem 0xdf000000-0xf7ff ffff]
[ 0.103368] PM: hibernation: Registered nosave memory: [mem 0xf8000000-0xfbff ffff]
[ 0.103369] PM: hibernation: Registered nosave memory: [mem 0xfc000000-0xfdff ffff]
[ 0.103370] PM: hibernation: Registered nosave memory: [mem 0xfe000000-0xfe0f ffff]
[ 0.103371] PM: hibernation: Registered nosave memory: [mem 0xfe100000-0xfeaf ffff]
[ 0.103372] PM: hibernation: Registered nosave memory: [mem 0xfeb00000-0xfeb0 0fff]
[ 0.103373] PM: hibernation: Registered nosave memory: [mem 0xfeb01000-0xfeb7 ffff]
[ 0.103374] PM: hibernation: Registered nosave memory: [mem 0xfeb80000-0xfec0 1fff]
[ 0.103374] PM: hibernation: Registered nosave memory: [mem 0xfec02000-0xfec0 ffff]
[ 0.103375] PM: hibernation: Registered nosave memory: [mem 0xfec10000-0xfec1 0fff]
[ 0.103376] PM: hibernation: Registered nosave memory: [mem 0xfec11000-0xfecf ffff]
[ 0.103377] PM: hibernation: Registered nosave memory: [mem 0xfed00000-0xfed0 0fff]
[ 0.103378] PM: hibernation: Registered nosave memory: [mem 0xfed01000-0xfed7 ffff]
[ 0.103379] PM: hibernation: Registered nosave memory: [mem 0xfed80000-0xfed8 ffff]
[ 0.103379] PM: hibernation: Registered nosave memory: [mem 0xfed90000-0xfedb ffff]
[ 0.103380] PM: hibernation: Registered nosave memory: [mem 0xfedc0000-0xfedc 0fff]
[ 0.103381] PM: hibernation: Registered nosave memory: [mem 0xfedc1000-0xfedc 1fff]
[ 0.103382] PM: hibernation: Registered nosave memory: [mem 0xfedc2000-0xfedc 8fff]
[ 0.103383] PM: hibernation: Registered nosave memory: [mem 0xfedc9000-0xfeff ffff]
[ 0.103384] PM: hibernation: Registered nosave memory: [mem 0xff000000-0xffff ffff]
[ 0.103386] [mem 0xdf000000-0xf7ffffff] available for PCI devices

[ 0.250136] Memory: 34306956K/35084220K available (16386K kernel code, 2054K

[ 1.677438] Freeing SMP alternatives memory: 52K

[ 7.982364] Freeing initrd memory: 28276K

[ 8.015799] check: Scanning for low memory corruption every 60 seconds

[ 8.253984] Non-volatile memory driver v1.3

[ 8.289530] amdgpu 0000:00:01.0: amdgpu: Trusted Memory Zone (TMZ) feature no t supported

[ 8.420377] [TTM] Zone kernel: Available graphics memory: 17167770 KiB
[ 8.426994] [TTM] Zone dma32: Available graphics memory: 2097152 KiB

[ 8.442673] [drm] amdgpu: 512M of VRAM memory ready
[ 8.447569] [drm] amdgpu: 3072M of GTT memory ready.

[ 8.540773] [drm] DM_PPLIB: memory_max_clock: 93300

[ 8.593189] [drm] DM_PPLIB: memory_max_clock: 93300

[ 8.603130] [drm] DM_PPLIB: values for Memory clock
[ 8.608032] [drm] DM_PPLIB: 667000
[ 8.611528] [drm] DM_PPLIB: 933000
[ 8.615020] [drm] DM_PPLIB: Validation clocks:
[ 8.619469] [drm] DM_PPLIB: engine_max_clock: 80000
[ 8.624620] [drm] DM_PPLIB: memory_max_clock: 93300
[ 8.629759] [drm] DM_PPLIB: level : 8

[ 11.471203] Freeing unused kernel image (initmem) memory: 1468K
[ 11.482459] Write protecting the kernel read-only data: 24576k
[ 11.489020] Freeing unused kernel image (text/rodata gap) memory: 2044K
[ 11.496107] Freeing unused kernel image (rodata/data gap) memory: 1120K
[ 11.502746] Run /init as init process
[ 11.506412] with arguments:
[ 11.506413] /init
[ 11.506413] with environment:
[ 11.506414] HOME=/
[ 11.506415] TERM=linux
[ 11.506415] BOOT_IMAGE=/boot/bzImage

[ 337.037593] IPVS: Connection hash table configured (size=4096, memory=64Kbyte s)

[ 381.828721] cgroup: runc (786) created nested cgroup for controller “memory” which has incomplete hierarchy support. Nested cgroups may change behavior in th e future.

[ 381.843629] cgroup: “memory” requires setting use_hierarchy to 1 on the root

[ 4468.400963] ==== memory usage ====
[ 4468.428622] MemTotal: 34340172 kB
[ 4468.433087] MemFree: 326752 kB
[ 4468.437423] MemAvailable: 28027920 kB
[ 4468.441524] Buffers: 4519568 kB
[ 4468.445601] Cached: 23052276 kB
[ 4468.449669] SwapCached: 40 kB
[ 4468.453734] Active: 3230128 kB
[ 4468.458013] Inactive: 28681680 kB
[ 4468.462109] Active(anon): 482572 kB
[ 4468.466020] Inactive(anon): 4350352 kB

あなたのNASのメモリは純正品ですか、それとも後付け品(アフターマーケット)ですか?

注文内容を確認したところ(設定してから5年経っているので)、4GBで出荷され、同時にCrucial CT16G4SFD8266の16GB DIMMを2枚購入しました。システム情報(添付のスクリーンショット参照)を見ると、4つのスロットに(16GB / 16GB / 2GB / --)と表示されています。これは、2GBのDIMMのうち1枚が故障した可能性があるということでしょうか?

前回のコメントに加えて、16GBのDIMMのうち1枚が間違ったスロットに挿さっているのが見えます(添付の写真参照)。ここで最善の対応策は、2GBのDIMMを両方とも取り外し、2枚目の16GB DIMMを空いた青いスロットに移動することだと思います。それが問題であれば、5年間も問題なく動作していたのに今になって不具合が出始めたのは驚きです…もしかすると2GB DIMMの故障が引き金になったのかもしれません。

元のRAM以外をすべて取り外してテストし、それでも再起動する場合は、QNAPにチケットを開いてください。ただし、純正(標準)RAMのみを搭載した状態にしておいてください(そうしないとサポートが拒否される可能性があります)。

別途取り付けたRAMを取り外すことをトラブルシューティングの一環としてお試しいただき、原因の切り分けを行うことをお勧めします。また、メモリーテストを実行することもお試しください。ガイドはこちらをご参照ください:
QNAP NASでメモリーテストを実行するには? | QNAP

さらに問題が発生した場合は、お気軽にご連絡ください。よろしくお願いいたします。