豚吐露@wiki

失敗あるあるonAzure

最終更新:

ohden

- view
管理者のみ編集可

CODT2022 失敗あるある on Azure

日本マイクロソフト株式会社所属 髭分将


設計・検証時につぶせた可能性のある失敗
設計・検証時につぶせない失敗

オンプレミスとクラウド(azure)の常識の違いを上手く認識できていないケースが結構ある

  • Case1: 夜中のbat処理がエラーになってる
翌朝終わってなくてトラブル
→IaaS VMを実行してる仮想化ホスト側で月1patch適用メンテナンスをしてる
 →サービス側で適宜メンテが実施される:オンプレとの大きな違い
  →数秒~30秒程度IaaS VMが一時停止する
   →そのタイミングでDBなど外部接続を含む処理を実施してると接続タイムアウト→切断→bat Errorとなる。
 →メンテの影響を最小限にする:再接続の仕組みを含める

Hyper-Vホスト側で更新がかかる
→ホスト再起動
 →ホスト上で動くVMを他のホストへ逃がすこともできるが...通常しない。
  →ホスト再起動の間、VMは一時停止する。メモリは保持、退避してるので、再起動後VMを再開する。
→夜間実行される。

  • Case2:移行の前後で接続できなくなった
オンプレからAzure VMへ移行したが、一部のVMへ接続できない。
→hostsファイルによる名前解決が一部残ってる
 →IP変わるのでhostsに名前解決が残ってると死ぬ可能性がある。
→Windows更新プログラムが古い
 →更新されてないWinServer2008、2012系をそのままもってくるとAzure上で動かないことがある。
  →NW、ストレージのモジュール
   →更新して持ってくる
→固定IP設定をそのまま持ってきた。

上記はAzureのお作法ではNG。
→更新プログラムを適用する。
→DHCP使いましょう。

L2延伸
→AVS(Azure Vmware Solution)を利用するケースと2022AzureEditionで利用できる拡張ネットワークを使うとL2延伸が可能。
 →基本はIPありのL3延伸。

  • Case3:Strageに通信できないログがでてる
VMからStrage系PaaSに接続できない
→オンプレのイントラ内パブリックIPレンジを使ってる
 →オンプレのIPとAzure上のIPが重複する。
→ExpressRouteプロバイダサービスであることが大事
→PaaSへ直接経路を確保するServiceEndpoint/PrivateEndpointがある。

オンプレ側とのルーティングを大変。
→やってみないと分からない。/32でstatic切って逃がす。

まとめ
→ドキュメントはちゃんと読もう。
→とりあえず動かしてみよう。


更新日: 2023年08月17日 (木) 22時59分24秒

名前:
コメント:

すべてのコメントを見る
記事メニュー
目安箱バナー