Menemukan penyebab blok yang tidak konsisten pada scrub

Saya memiliki TS-469 lama dengan empat (sejauh yang saya tahu) hard disk WD Red+ 6 TB. Saya sering mendapatkan laporan “blok tidak konsisten” setiap kali melakukan scrub, bahkan ketika hanya ada beberapa file yang ditambahkan atau diubah di antara proses scrub. Minggu lalu, laporannya lebih dari 15 ribu blok tidak konsisten, yang diklaim telah diperbaiki.

Jadi… masalahnya - saya tidak bisa menemukan masalahnya! Semua disk melaporkan dalam kondisi baik, tidak ada sektor rusak, dan sebagainya. Ada saran bagaimana cara melacak penyebabnya?

Apakah Anda sudah meng-upgrade memori di NAS Anda? Apakah Anda sudah mencoba tes memori?

Saya akan mencoba itu. Tampaknya tidak mungkin, tapi itu bisa menjelaskan masalahnya meskipun tidak ada hard disk yang rusak. Terima kasih.

Baiklah (menjawab diri sendiri), ternyata lebih sulit dari yang saya kira. Tidak ada tes memori bawaan, dan saya juga tidak dapat menemukan yang bisa diunduh dan ditambahkan. Jadi sepertinya saya harus membuat flashdisk bootable, membeli USB hub, dan mencoba menjalankan semuanya tanpa drive. Ternyata jauh lebih rumit daripada seharusnya.

Apakah kamu sudah melihat ini?

https://www.qnap.com/en/how-to/faq/article/how-do-i-perform-a-memory-test-on-qnap-nas

Meningkatkan RAM pada perangkat lama ini tidak akan banyak membantu, maksimal hanya mendukung 3GB, lihat lembar data

Salam

Hanya saat menjalankan QTS.

Jika Anda beralih ke distro lain, 4GB dapat dipasang dan digunakan. Tanyakan saja bagaimana saya tahu. :wink:

Saya tidak mencoba untuk meng-upgrade perangkat lama itu, hanya ingin membuatnya kembali berfungsi dengan benar. Selama seminggu, saya hanya mengganti lima atau enam file kecil, tapi malah muncul lebih dari 15 ribu error. Sampai sekarang, saya bahkan belum bisa menemukan di mana “blok rusak” itu berada. Maksudnya, apakah semuanya ada di satu drive, atau tersebar di beberapa tempat. Semua log hanya memberi tahu bahwa error ditemukan saat scrub, lalu diperbaiki. Tapi pada scrub berikutnya, malah muncul lebih banyak lagi.

Saya tidak menemukan indikasi bahwa ada HDD yang bermasalah. Itulah sebabnya ada yang menyarankan bahwa mungkin ini adalah error pada memori. Jadi sekarang saya mencoba mencari tahu seberapa sulit untuk menemukan monitor dan keyboard cadangan, membuat USB drive bootable, dan mencari salinan MEMTEST.

Sebagai seorang engineer, rasanya tidak seharusnya sesulit ini untuk setidaknya menemukan sumber error-nya.

Bisakah Anda memberikan tangkapan layar pesan kesalahan tersebut? Ini akan membantu saya mendiagnosis masalah dengan lebih efektif.

Selain itu, sudah berapa lama hard drive Anda digunakan?

Mohon juga pastikan Anda mencadangkan data penting sebelum masalah teridentifikasi secara pasti, untuk memitigasi risiko yang mungkin terjadi.

Tentu saja ini bukan benar-benar sebuah screenshot, karena ini adalah NAS. Namun, dari log, baris-baris yang relevan adalah:

Semua drive masih relatif baru. Saya yakin yang paling tua usianya sekitar 1 tahun, dan NAS ini sangat jarang digunakan. Saya sempat curiga pada salah satu drive yang pernah diganti, jadi saya menggantinya. Tidak ada perbaikan. Selain itu, yang cukup mengganggu, saya TIDAK mendapatkan masalah apa pun yang muncul pada drive. SMART dan pengujian tidak menunjukkan apa-apa. Waktu loading, percobaan ulang, dll. semuanya baik. Suhu berada di kisaran 30°C rendah. Jujur saja, saya bingung. Tapi saya jelas tidak bisa mengandalkan unit ini dalam kondisinya sekarang.

Sejujurnya: Saya pernah mengalami masalah serupa dengan TS-669. NAS tidak menunjukkan error apa pun, tetapi tampaknya ketika ada beban kerja, volume berubah menjadi hanya-baca (read-only) tanpa alasan yang jelas. Saya pernah melakukan setup dengan disk yang benar-benar berbeda, dan itu berhasil, tetapi saat memulai pekerjaan copy, volume kembali menjadi hanya-baca setelah beberapa menit, dan ini bisa direproduksi.

Saat ini, kecurigaan saya adalah ada komponen (apapun itu) yang sudah mencapai akhir masa pakainya sehingga menyebabkan hal-hal aneh terjadi.

Jadi mungkin NAS Anda juga mengalami hal yang sama.

Jadi jika saya berada di posisi Anda, saya akan melakukan setup ulang secara menyeluruh dan cek apakah NAS berperilaku berbeda setelahnya.

Salam

Terima kasih atas {informasi yang kurang menggembirakan} ini. {:>)

Build ini sebenarnya tidak terlalu lama, sayangnya. Saya memasukkan disk dan memulai dari awal sekitar 5 bulan lalu. Semuanya baik-baik saja sampai sekitar sebulan yang lalu. Selain itu, sistem ini cukup andal.

Satu masalah yang saya lakukan saat menyiapkannya - saya pada dasarnya mengatur agar semua storage digunakan sebagai thick volume. Itu tidak masalah sampai masalah baru-baru ini yang menyebabkan sistem menjadi “read-only” dan mencoba recovery. Ternyata, sistem membutuhkan >32GB ruang kosong di luar volume untuk melakukan recovery. Jadi recovery gagal. Sayangnya, QNAP QTS memungkinkan Anda memperluas volume, tapi tidak bisa mengecilkannya. Jadi meskipun saya punya sekitar 7TB ruang tersisa di NAS, satu-satunya solusi adalah menghapus semuanya dan mulai dari awal. [Atau menghentikan error yang terjadi. ]

Terima kasih atas informasinya. Saya akan mengganti memori dalam beberapa hari ke depan, hanya untuk mencoba.

Volume tebal (thick volumes) selalu menggunakan ruang yang Anda alokasikan untuknya. Jadi, jika Anda memiliki volume tebal yang menghabiskan sebagian besar ruang drive Anda lalu membuat snapshot atau hal serupa, Anda bisa dengan mudah membuat drive Anda masuk ke mode hanya-baca (read-only) meskipun masih ada banyak ruang kosong di volume tebal tersebut. Bagi NAS, ruang itu sudah dianggap terpakai—sudah dialokasikan, dan ketika tidak ada cukup ruang ekstra untuk melakukan hal lain, itu menjadi masalah.

Saya juga hanya menggunakan volume tebal, tetapi di TS-x69 Anda tidak dapat menggunakan snapshot.

Ini adalah NAS kategori 2, namun kemampuan untuk snapshot tidak tersedia di sini.

Salam

Untuk informasi terkait, silakan merujuk ke FAQ berikut:
What does the log, mismatched blocks detected and fixed imply while performing RAID scrubbing? | QNAP