RAIDを構成したHDDが壊れたときにやるべきこと

最近自宅サーバーのHDDベイにエラーの表示が現れました。リビルドをする過程を記録として残しておこうかと思います。

HDDのエラー
HDDのエラーランプが点灯
ソフト側でもエラーを確認
ソフト側でもエラーを確認

とりあえず今まではRAID10を構成していたためにこのままでも生き延びることはできますがエラーの起こったHDDを交換しようと思います。

手順

  • 故障を確認
  • RAIDマネージャをインストール(普通はRAID構成時に入れておく物)
  • RAIDカードの型番を確認してホットスワップ対応かを確認する
  • HDDを抜く
  • 新しいHDDを入れる
  • リビルドする

現在の構成を確認

OSはWindows Server 2016 DatacenterですがWindows10でも動作はすると思います。

サーバー本体はFujitsuのPRIMERGY RX200 S8でHDDを8台使用して4台でRAID0、それをRAID1を構成し、RAID10を構成しています。

RX200 S8を調べたところ、ホットスワップに対応していることも確認できました。しかし、RAIDを構成した段階でRAIDマネージャーのインストールをしていなかったので今インストールしてからエラーに対処したいと思います。

RAIDマネージャーのインストール

Fujitsuのwebページにインストールするべきソフトウエアが書かれていました。

RAIDマネージャーのマニュアルはこちら

RAIDマネージャー
ServerView RAID Manager

こちらの動作にはJAVAが必要なようなのでJDKもインストールします。

JDKをインストール
JDK

JDKへのリンクも添付しておきます。

サーバー側で起動させますが、なぜか起動しない。。。

どうやら環境変数の変更が必要だったみたいです。

環境変数の変更画像
環境変数の変更

画像のようにシステムのプロパティにアクセスした後変更します。

サーバーサイドで起動を確認します。クライアントからリモートでアクセスするのはルーター側でポートフォアーディングする必要があるみたいですが今回はサーバを直接操作するためその辺の設定は行いませんでした。

故障している様子
故障

HDD換装

故障しているドライブの番号を確認したら、電源を切らずに、勇気を出してガバっと抜きます。怖いですが、これでいいのです。トレイを外したら新品のHDDをトレイに装着して差し込みます。

リビルド中。
リビルド

新しいHDDを認識して自動でリビルドを開始します。

リビルド中のやること

リビルド中はめちゃくちゃデリケートです。絶対に電源を切らないようにしてください。また、リビルドはめちゃくちゃ時間がかかるものです。量量が大きいほど時間がかかります。RAID10構成、1TBをリビルドが完了するのに2日間かかりました。とにかく安静にさせてあげましょう。そしてリビルド中はパフォーマンスが半分くらいに低下します。この間にベンチマークを図るような愚かな行為はやめましょう。

最後に

さまざまなRAIDを構成しているサイトは見受けられますが、リビルドの仕方を詳しく書いてあるサイトは見つかりませんでした。この記事を参考にしてください。役に立てたら幸いです。

Author: うに

1 thought on “RAIDを構成したHDDが壊れたときにやるべきこと

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です