QNAP HA (High Availability): Tentang konsistensi data saat terjadi failover

Hal-hal yang Diharapkan Saat Failover dalam Konfigurasi HA

Ketika menggunakan dua NAS untuk membangun konfigurasi HA (High Availability), apa yang diharapkan saat terjadi failover? Tentu saja, ekspektasi utamanya adalah “ketika satu unit mengalami kegagalan, proses akan dialihkan ke unit lainnya sehingga pekerjaan dapat tetap berlanjut”.

Namun, jika ditanya “Apakah tidak masalah jika terjadi kerusakan data atau kekurangan data seperti data yang sedang ditulis saat failover, asalkan pekerjaan tetap bisa berlanjut?”, pada dasarnya jawabannya adalah “Tidak”. Beberapa pengguna mungkin berpendapat, “Jika terjadi failover, file yang sedang ditulis bisa ditulis ulang, jadi tidak masalah”.

Namun, jika ada fakta bahwa “mungkin terjadi anomali pada konsistensi data” atau “dalam beberapa kasus, file belum tersinkronisasi ke unit cadangan”, maka saat failover terjadi, kita harus memeriksa dataset dan checksum file di unit cadangan untuk memastikan tidak ada masalah.

Baru-baru ini, NAS QNAP telah mendukung HA, sehingga muncul pertanyaan, “Apakah konsistensi data terjamin saat terjadi failover dalam konfigurasi HA pada NAS QNAP?” Saya pun mencoba memastikannya. Pengguna tersebut menggunakan NAS dari produsen Jepang, dan melaporkan bahwa “saat terjadi failover, terdapat banyak file yang belum tersimpan di unit cadangan.

Mari kita langsung lakukan pengecekan.

Lingkungan Pengujian

Berikut adalah lingkungan pengujian yang digunakan kali ini. Secara garis besar, konfigurasinya seperti berikut.

Pemeriksaan Konsistensi Saat Failover

Dari PC operasional, file disalin ke IP cluster 192.168.131.230. Saat proses penyalinan berlangsung, kabel listrik unit utama dicabut untuk memicu failover, lalu setelah penyalinan selesai, nilai md5sum dicek di IP cluster untuk memastikan apakah hasilnya sesuai.

File yang digunakan untuk pengujian adalah installer Windows 11 berikut.

Konten artikel

Eksperimen! Penyalinan File Berukuran Besar

Sesuai rencana, kabel listrik unit utama dicabut saat proses penulisan file ke cluster sedang berlangsung. Penyalinan sempat terhenti hingga failover selesai, lalu proses penyalinan berlanjut hingga selesai…

Berikut hasil dari tiga kali pengujian seperti ini.

Percobaan 1 - 297b8c040ef6bb78edfb8d216b04b307 - Tidak ada masalah
Percobaan 2 - 297b8c040ef6bb78edfb8d216b04b307 - Tidak ada masalah
Percobaan 3 - 297b8c040ef6bb78edfb8d216b04b307 - Tidak ada masalah

Pola di Mana Penyalinan Sempat Terhenti

Selama pengujian, ada pola lain yang muncul. Saat failover dari unit utama ke unit cadangan, muncul error “Terjadi kesalahan jaringan yang tidak terduga.

Dalam kasus ini, file yang sedang ditulis di unit utama sudah tercermin di folder unit cadangan, sehingga muncul pertanyaan “Karena file sudah ada di unit cadangan, apakah ingin menimpa file tersebut?

Saat dicek di IP cluster, file tersebut adalah file yang belum selesai disalin, dan checksum-nya berbeda.

Dalam kasus seperti ini, dengan memilih “Coba lagi” → “Ganti file”, penyalinan file dapat diselesaikan tanpa terjadi inkonsistensi.

Eksperimen 2 Penyalinan Banyak File

Selanjutnya, dilakukan penyalinan banyak file dan saat proses berlangsung, failover dipicu untuk memastikan apakah file dapat disalin ke unit cadangan tanpa ada yang tertinggal.

Sebagai file dalam jumlah besar, digunakan data sampel WIDER_train (jumlah file 12.880, jumlah folder 63, total kapasitas 1,37GB).

Sama seperti pada file berukuran besar, penyalinan dilakukan sambil mematikan listrik unit utama.

Untuk folder yang telah disalin, dibuat daftar md5sum dengan perintah berikut. Daftar checksum dan file dibandingkan.

find ./ |sort |xargs md5sum > md5sum.list

Dengan memeriksa daftar menggunakan diff seperti ini, perbedaan dapat diketahui dengan mudah.

Konten artikel

Pengujian diulang tiga kali, dan tidak ditemukan adanya perbedaan.

Kesimpulan

Dengan membangun HA pada NAS QNAP dan “mencabut kabel AC unit utama saat proses penyalinan file berukuran besar maupun banyak file”, dilakukan pengecekan apakah terjadi inkonsistensi file atau kehilangan sebagian file saat failover.

Kesimpulannya, dalam kasus seperti ini, tidak terjadi kekurangan konsistensi file maupun kehilangan sebagian file.

Ringkasan

Karena ada pertanyaan dari pelanggan mengenai “perilaku dan spesifikasi NAS dari produsen lain yang mereka miliki, bagaimana dengan NAS QNAP?”, maka dilakukan pengecekan perilaku saat terjadi failover dalam konfigurasi HA.

Di sini, dilakukan pengecekan pada dua pola, yaitu “failover saat penyalinan file berukuran besar” dan “failover saat penyalinan banyak file”.

Hasilnya, pada kedua pola tersebut, tidak terjadi masalah seperti kekurangan konsistensi file maupun kehilangan file.

“Failover” sendiri biasanya dipicu oleh kerusakan NAS, sehingga jarang terjadi. Justru karena jarang terjadi, penting untuk memahami perilakunya terlebih dahulu agar dapat menangani dengan tenang jika sewaktu-waktu terjadi.

Jika ada kemungkinan “terjadi kekurangan konsistensi file atau kehilangan file…”, maka operasi saat failover akan menjadi rumit.

Namun, dengan membangun HA pada NAS QNAP, Anda dapat menggunakan dengan tenang karena tidak terjadi kekurangan konsistensi maupun kehilangan file, meskipun terjadi failover.

1 Suka