前回の記事に引き続き、インターン中に行ったメニューについて書かせていただきます。
メニューについて
このメニューは、物理サーバの接続先がスイッチのどのポートに接続されているか、またインターフェイスにどのような設定がされているかを見るもので、実際にDCで当該マシンのUTP(LANケーブル)を挿抜まで行います。このメニューは以下のように進めました。
機器の情報の把握
設定の把握
挿抜しても問題ないかの調査
実際に挿抜する
1. 機器の情報の把握
事前にもらっているIPアドレスや認証情報などをもとに、調査対象のサーバやスイッチのベンダーやインターフェイスの情報などを把握しました。
2. 設定の把握
1で把握した情報をもとにサーバは/etc/sysconfig/network-scripts
の中を、スイッチはconfigを眺め、どのような設定をされているのかを確認しました。
ここでは、サーバーとスイッチはUTP2本で接続されていて、リンクアグリゲーション(LACP)が設定されていることが把握できました。
3. 挿抜しても問題ないかの調査
1や2で把握した情報をもとに、挿抜しても問題がないかを判断します。
2で書いたようにスイッチとサーバ間はLACPによる冗長構成が取られているため、UTP1本までならリンクダウンしても問題ないと判断しました。
4. 実際に挿抜する
実際にDCへ行き、サーバからUTPを抜去します。実施する筐体を間違えてはいけないので、サーバのweb管理画面からPowerLEDを点滅させたり、ラック構成表と照らし合わせたりなどして、実際に操作する筐体を特定しました。
SSHでサーバに入り、以下のスクリプトをwatch
で実行し、状況を監視しながらUTPを抜きました。
#!/bin/bash echo -e "\n-------------team0 state\n" teamdctl team0 state echo -e "\n-------------p1p1 state\n" ip addr show dev p1p1 echo -e "\n-------------p2p1 state\n" ip addr show dev p2p1
結果としては、ちゃんとリンクアグリゲーションが動作し、UTPを抜いて1系統がリンクダウンしても通信断が発生せず、通信し続けていました。また、再びUTPを接続した際にもリンクアップ後すぐにリンクアグリゲーションが有効になり、正常に動作する状態になりました。
5. 感想
実際にサービスを提供しているサーバに対し物理的な操作を行うのは、非常に面白かった。また、何事も起こさないように入念に準備をしてから実行することで、影響を出さないようにタスクをこなせる、という知見を得ることができた。