TrueNAS Scale 障害試験

TrueNAS Scale の構築が完了したので、障害試験を実施する。

Summary

これは、家庭利用でも大事で障害発生時の挙動を確認しておくことで慌ててデータをロストしないようにするため大切です。

  • 再起動(電源断)
  • DataVol1 の 1本抜去
  • OS Disk の破損

再起動(電源断)

仮想マシンでテストした。 Proxmox VE の Console 上から Reset を実施

Dataset がロックされているのを確認、解除する ロック解除ができた

ロック解除後なら SMB なども問題なく利用できる

DataVol1 の 1本抜去

DataVol1 の Disk を1本抜去してみる。通常オペレーションで実施した場合インシデント案件であるがテストしておくにこしたことはない。また、 Linux RAID の場合は RAID の同期が走り直し、18時間ほど再同期にかかった経験もある。

戻した所、一瞬で復旧した

ZFS Health が Degraded になっているのと、Alertが出ます

OS Disk の破損

はい、お待ちかねの OS 破壊試験ですね。
弊宅ではストレージの都合で USB SSD を利用しています。これの MTBF や書き込み耐性などが仕様として明記されていなく、現在不明です。 TrueNAS Scale では USB メモリー にインストールは非推奨になり SSD が推奨されている。

そのため、最悪の状態では OS Disk が壊れて起動できなくなることが想定されるため吹き飛ばしてテストする。 方法は今回は仮想マシンなので、 Proxmox VE から Disk を Detach して空と入れ替えてやる

そして ISO からインストールを実施

zfs pool が見えるやつは使用中のため Disk は慎重に選択する

残りはセットアップの記事と同様

インストールが完了して WebGUI が見えるようになったら、 Cloud Sync Tasks で設定したバックアップデータをダウンロードして Import してみる

Rclone の暗号化 S3 から取り出すには下記の「緊急時の取り出し方法」を参考にすれば可能である

WebGUI にログインし System Settings > General > Manage Configuration > Upload File でアップロードすることで設定が復元できる

Manage Configuration > Upload File パスワードSeedがない場合はすべてのパスワードがリセットされる警告

DataVol1 の暗号化を パスフレーズで解除すれば Backup Credentials, Local Users, local Groups, SMB共有なども問題なく利用できた。

Built with Hugo
テーマ StackJimmy によって設計されています。