豚吐露@wiki
失敗あるあるonAzure
最終更新:
ohden
-
view
CODT2022 失敗あるある on Azure
日本マイクロソフト株式会社所属 髭分将
設計・検証時につぶせた可能性のある失敗
設計・検証時につぶせない失敗
設計・検証時につぶせない失敗
オンプレミスとクラウド(azure)の常識の違いを上手く認識できていないケースが結構ある
- Case1: 夜中のbat処理がエラーになってる
翌朝終わってなくてトラブル
→IaaS VMを実行してる仮想化ホスト側で月1patch適用メンテナンスをしてる
→サービス側で適宜メンテが実施される:オンプレとの大きな違い
→数秒~30秒程度IaaS VMが一時停止する
→そのタイミングでDBなど外部接続を含む処理を実施してると接続タイムアウト→切断→bat Errorとなる。
→メンテの影響を最小限にする:再接続の仕組みを含める
→IaaS VMを実行してる仮想化ホスト側で月1patch適用メンテナンスをしてる
→サービス側で適宜メンテが実施される:オンプレとの大きな違い
→数秒~30秒程度IaaS VMが一時停止する
→そのタイミングでDBなど外部接続を含む処理を実施してると接続タイムアウト→切断→bat Errorとなる。
→メンテの影響を最小限にする:再接続の仕組みを含める
Hyper-Vホスト側で更新がかかる
→ホスト再起動
→ホスト上で動くVMを他のホストへ逃がすこともできるが...通常しない。
→ホスト再起動の間、VMは一時停止する。メモリは保持、退避してるので、再起動後VMを再開する。
→夜間実行される。
→ホスト再起動
→ホスト上で動くVMを他のホストへ逃がすこともできるが...通常しない。
→ホスト再起動の間、VMは一時停止する。メモリは保持、退避してるので、再起動後VMを再開する。
→夜間実行される。
- Case2:移行の前後で接続できなくなった
オンプレからAzure VMへ移行したが、一部のVMへ接続できない。
→hostsファイルによる名前解決が一部残ってる
→IP変わるのでhostsに名前解決が残ってると死ぬ可能性がある。
→Windows更新プログラムが古い
→更新されてないWinServer2008、2012系をそのままもってくるとAzure上で動かないことがある。
→NW、ストレージのモジュール
→更新して持ってくる
→固定IP設定をそのまま持ってきた。
→hostsファイルによる名前解決が一部残ってる
→IP変わるのでhostsに名前解決が残ってると死ぬ可能性がある。
→Windows更新プログラムが古い
→更新されてないWinServer2008、2012系をそのままもってくるとAzure上で動かないことがある。
→NW、ストレージのモジュール
→更新して持ってくる
→固定IP設定をそのまま持ってきた。
上記はAzureのお作法ではNG。
→更新プログラムを適用する。
→DHCP使いましょう。
→更新プログラムを適用する。
→DHCP使いましょう。
L2延伸
→AVS(Azure Vmware Solution)を利用するケースと2022AzureEditionで利用できる拡張ネットワークを使うとL2延伸が可能。
→基本はIPありのL3延伸。
→AVS(Azure Vmware Solution)を利用するケースと2022AzureEditionで利用できる拡張ネットワークを使うとL2延伸が可能。
→基本はIPありのL3延伸。
- Case3:Strageに通信できないログがでてる
VMからStrage系PaaSに接続できない
→オンプレのイントラ内パブリックIPレンジを使ってる
→オンプレのIPとAzure上のIPが重複する。
→ExpressRouteプロバイダサービスであることが大事
→PaaSへ直接経路を確保するServiceEndpoint/PrivateEndpointがある。
→オンプレのイントラ内パブリックIPレンジを使ってる
→オンプレのIPとAzure上のIPが重複する。
→ExpressRouteプロバイダサービスであることが大事
→PaaSへ直接経路を確保するServiceEndpoint/PrivateEndpointがある。
オンプレ側とのルーティングを大変。
→やってみないと分からない。/32でstatic切って逃がす。
→やってみないと分からない。/32でstatic切って逃がす。
まとめ
→ドキュメントはちゃんと読もう。
→とりあえず動かしてみよう。
→ドキュメントはちゃんと読もう。
→とりあえず動かしてみよう。
更新日: 2023年08月17日 (木) 22時59分24秒