1月4日にメインデスクトップ機のミラーリング利用しているSSDが 2台同時にふっとんでえらいめにあって やっと落ち着いたので戒めメモ。
zfsでミラー化してあったのである程度安心していたのだが、 SSDにはきっかり寿命があるということを頭では理解していても 実際には大丈夫だろうと油断していた。
どういうことかというと、ミラー化していると、SSDのスペアブロックの 消費も2台同時に進み、なおかつ同じ種類、同じ導入時期のSSDだと 完全に同時にスペアブロックを使い果たして同時にぶっ壊れるということが 現実に起こりうるということである。
nvmectlだとか、smartmontoolsで、寿命や残りスペアブロックが 出るはずなので、それをしっかり監視しておかないとだめということを 知った。また、ミラー構築する際はTBWの違う銘柄にするとか、 導入時期を少しずらすとかしないと、同時交換する羽目になるので 注意が必要である。
また、読み出したりするだけで不良ブロックは増えるので データのサルベージも難しい。HDDだと dd conv=noerror,sync で 壊れかけのものも読めるところだけ引き出せるのだが、 SSDは不良ブロックがあるとマザーボードごとフリーズしてしまったり することもあり、そうなると一度SSDへの通電を切らないと 次回ブートができなかったりしてたいへん。そんなこんなで 読めるデータを救い出すのに、「エラーが出たら電源OFしてあげ直し」 を繰り返すことになったので、復旧作業に丸2日かかった。
かといって、もうHDDには戻れないしな。寿命の長いSSDが 早く出ないかな。5年後くらいにはなんとかならんかね。