目的
お客様から譲っていただいた6,7年前のHPE DL360 Gen10にAzure Stack HCI(ASH)をインストールするまでの流れ(苦労?)を書こうと思います。古いマシンを再利用される方がいれば参考にしてください。
はじめの壁
古いマシンであったことから、Azure Stack HCI OSのインストールに非常に手間がかかったので、まずはそこまでの課題と問題点を記載します。実は現時点でもいくつか解決していない問題があって、それはおいおい説明します。
はじめの問題は、HPEのインストーレーションガイドであるIntellgent ProvisioningのバージョンとiLOを含めたファームウェアの古さです。Azure Stack HCI OS(23H2)は、Windows Server 2022をベースにしたGUIの無いServer Coreと呼ばれるOSがベースになっています。また、HPEはデバイスドライバを単体で公開していないため、SPP(Service Pack for ProLiant)と呼ばれるISO形式のメディアでの提供となっています。
理想は単体OSをインストール後、SPPを適用すればいいんですが、GUIが無い環境であることと、HPEの推奨はIntellgent Provisioning経由でのOSインストールであるため、ドライバーと一緒にインストールできるIntellgent Provisioning方式を選択しました。
ここがトラブルの一歩。
SPPメディア選択の苦労
どうしてはわかりませんが、USBメモリを使ったSPPからのブートは、途中でメディアをアンマウントできないというエラーが出て、止まってしまいました。
また、SPPはサイズが大きいため、DVDメディアに焼くことができず、結果iLOの仮想メディア経由でないと起動できませんでした。LAN越しとなるため、ものすごく遅い作業となります。
SPPでは、Intellgent Provisioningのバージョンが上がらず起動もしなくなった
最も新しいSPPのバージョンをいきなり当てると、失敗して何も更新されないという事象も発生しました。そのため、少しだけ新しいものへ上げてから、最新のものにアップデートしました。
しかし、SPPにはIntellgent Provisioningのファームが含まれておらず、また、F10からIntellgent Provisioningを起動することもできなくなりました。
Intellgent Provisioningは単体でISOメディアが提供されているため、DVDに焼いて、ブートすることで、3台中2台のバージョンアップに成功し、Intellgent Provisioningの起動ができるようになりました。
現在も解決していない問題①
3台の残りの1台ですが、Intellgent Provisioningの復旧メディアを使うとブート途中で止まり、Linux OS経由でRPMパッケージでインストールしたところ、バージョンは上がるものの、事象は変わりませんでした。
HPE DL360 Gen10以降は、Intellgent Provisioningが起動しないとRAID構成の変更などの作業が行えません。厳密には初期のブート画面で、メニュー選択で、RAID管理アプリを選択できるのですが、Intellgent Provisioningが起動できない事象と同様に途中で止まってしまいます。
Intellgent Provisioning経由でのOSインストールの開始
起動直後、「Rapid Setup」を実行使用すると、ボタンがグレーアウトして、実行できません。これが時間によって変わるということに気づくまでに少し時間がかかりました。
とりあえず、テスト環境なので、RAID構成は行わず、すべて単体のディスクに変えます。なので、はじめに起動した状態では以前の環境としてのRAID構成が残っていました。
一つの物理SSDへOSをインストールするように変更しました。
その後、基本的なOS設定を行いますが、言語は英語しか選択できないので、英語を選び、タイムゾーンだけ、日本にしました。
HPEはAzure Stack HCIのサポート用に事前にuser_tokenを作る必要があります。指示されたURLにアクセスし、作成されたトークンをUSBメモリに保存して、空いているUSBポートに接続すると、自動的にファイルを探してくれます。
ようやくインストールの開始ですが、ここでファームウェアのアップデートが動いていることに後で気づきます。このファームウェアのアップデートが非常に厄介でした。ファームウェアによっては、インストール後筐体の再起動が必要なものもあり、複数回再起動後、下記のような画面が何度も表示されます。
ちなみに、事前にSPPを使って最新にアップデートしていましたが、なぜか古いバージョンにロールバックされていました。やり直しです。
※必ずファームウェアのアップデートはすべてスキップしましょう。
「Rapid Setup」が完了すると、OSのインストールが始まります。
無事にインストールが完了すると、ログイン画面が表示されます。ここで、GUIが使えないことを初めて認識しました。
初回ログイン後にドライバ関連が適用されているように見えます。その後自動的に再起動し、またログイン画面が表示されます。
ログインすると、scconfigというメニュー形式の画面が表示されます。
インストールまでの感想
正直、Azure Stack HCI推奨構成をBTOで組んでもらった方がはるかに簡単な作業だと思いました。物理サーバでかつ3台で作業していたので、iLO経由でのコンソール操作はお手軽のような印象を受けて、地味にレスポンスがストレスでした。
あと、途中途中でiLOの操作を受け付けなくなるので、時々直接ディスプレイとキーボードを繋げて操作しなくてはいけないので、これもめんどくささを感じました。
今回はまだ前編ですが、すでに心が折れそうな感じでした。エンタープライズで導入する場合は、メーカーの営業さんと相談して、構成済みの機器を買ったほうが絶対にいいと思います。
しかも、まだ折り返しです。
これからAzure側との接続やクラスター構成などが残っています。
Commenti