SD-WAN VMware SASE VMware SD-WAN

VMware Edge Network Intelligence ご紹介ブログ  パート3: AIOpsを使用してSD-WANインフラの自己回復を支援します!

パート3:優れたパフォーマンス、セキュリティ、可用性、効率を実現する自動運転ネットワークを構築しましょう!

*このブログは、VMware Edge Network Intelligence™により、IT部門がクライアント端末のエクスペリエンスとクライアントの行動に関するより良い洞察を得る方法について、4回に分けてご紹介するシリーズの第3回です。

ネットワーク管理をよりシンプルに、より効果的にしよう

このシリーズの最初の投稿では、AIOpsがグローバルSD-WANネットワークによって生成される膨大なデータから得られるパフォーマンスベースラインなどの実用的な情報を企業に提供する方法について概要を説明しました。2つ目の投稿では、デバイスからアプリケーションまでのクライアントジャーニーに沿って作成される追加のデータソースが、ネットワークエンジニアが支社のネットワーク問題をビジネスオペレーションに支障をきたす前に迅速に修正するのに役立つコンテキストを提供する方法について詳しく説明しました。

この3つ目の投稿では、VMware Edge Network Intelligence™データ分析によって、VMware SD-WANのベスト・オブ・ブリードのセルフヒーリング機能がどのようにさらに効果的になるかを紹介します。この組み合わせは、ネットワークITチームがネットワークの責任をより効果的かつ効率的に管理する上で重要な役割を果たします。

革新的な自己修復機能

VMware SD-WANプラットフォームは通常、ローカル情報に基づいてネットワークの変化に反応し、ビジネスポリシーと意図に導かれて自己修復を実行します。例えば、VMware SD-WANは、作成するすべてのトンネルの健全性を常に測定します。他のサイト、エッジ、またはクラウド内のゲートウェイに至るまで、トンネルの健全性を分析し、問題が検出された場合にプラットフォームが対応できるようにします。ネットワーク全体の品質を維持するため、システムは別のWANリンクに切り替えたり、冗長性を追加したり、複数のパスを巧みな方法で活用したりします。

つまり、今日のSD-WANネットワークは、短期間に提供されるローカル情報に基づいてすでに自己修復しているのです。単一のエッジが自身のトンネルを測定し、トンネルの健全性が時間とともに低下していることを判断し、問題に対応しています。この機能は、全体的なトンネルの健全性に基づいて、アプリケーションまたはパケット単位で行われています。AIOpsが自己回復の観点からもたらすのは、より長期にわたってグローバルな情報を取り込む能力になります。

AIOpsは、自己修復をより効果的にするためのグローバルな情報を提供します

前回のブログでは、AIOpsに供給される追加のデータソースを使用することでSD-WANの管理が容易になることを説明しました。これらのソースにはネットワーク自体からのデータ、あるいは無線デバイス、スイッチ、ネットワークサービス、SD-WAN、ゲートウェイ、ハブなどのクライアントからアプリケーションまでの経路に沿った他の視点からのデータが含まれます。 さらに、他のVMware SD-WAN 企業ネットワークからの匿名化された洞察がVMware Edge Network Intelligence™に供給されます。これらの情報はすべて、SD-WANプラットフォームがパターンを検出し、ネットワーク問題の原因を実際に突き止めるのに役立ちます。

方程式に自己修復を加えることは、AIOps が本質的にSD-WANネットワークと他の制御可能なネットワークに、これらのグローバルな問題を解決するためのアクションを取るように指示することを意味します。より長い期間にわたってサンプリングされたより大きなデータセットを使用することで、意味のある分析のレイヤーが追加されます。トンネルの健全性の測定と対応に加え、AIOps は各アプリケーションを分離し、各アプリケーションのパフォーマンスを個別に分析する機能を提供します。そして、それは始まりに過ぎません。

例えば、トンネルの健全性は問題ないが、そのトンネル上のアプリケーション・パフォーマンスが低いままである場合、おそらくそれは特別な種類の修復が必要な特定のアプリケーションの問題です。短期的な修正では、長期にわたって問題を解決することはできません。幸いなことに、このアプローチにより、システムは傾向を分析し、出現しつつあるパターンを判断し、AIOps が提供するグローバル情報を使用して、アプリケーションベースで問題を軽減する能力を実際にプログラムすることができます。他のVMware SD-WANネットワークで実行された修正の効果を分析することも、このプロセスの一部です。

自己強化機械学習、集中型アーキテクチャ、VMware SD-WAN Gatewayが実現するセルフヒーリングシナリオ例

障害切り分けに基づく自己修復

では、実際に自己修復を行う具体的な例を、さらに掘り下げて見ていきましょう。1つ目の方法は障害の切り分けに基づくもので、アプリケーションのパフォーマンスが低下しているときに、ネットワークのどこに問題があるかを特定することが高度なレベルで必要となります。クライアント側の LAN、WAN、データセンター、クラウド、あるいはアプリケーション自体に問題があるのでしょうか。このアプローチでは、問題のあるセグメントがどこにあるかを特定します。例えば、障害のあるセグメントがデータセンターにある場合、SD-WANネットワークはトラフィックを別のデータセンターに切り替えることができます。

そして、障害のあるセグメントが WAN内にある場合、ネットワークはトラフィックを特定の方法で優先順位付けしたり、あるいは別のルートを計算するなど、WAN自体で緩和措置を取ります。同様に、問題がクライアントLANにある場合、おそらくSD-WANネットワークが自己修復できる問題ではないでしょう。この場合、クライアントまたはそのネットワークプロバイダーは問題を特定し、解決するために行動を起こす必要があります。

この特定の例では、VMware Edge Network Intelligence™を搭載したVMware SD-WANは、まずこれらのデータをすべて分析し、次に障害がどこにあるのかを単純に切り分けることによってネットワークを自己修復します(クライアントLAN、WAN、データセンター、またはクラウド)。場所の決定に基づいて、ネットワークは問題の回避を試み、何らかの緩和策を講じ、SD-WANネットワークで問題が解決できない場合は警告を発します。

これは SD-WANデータに基づく障害切り分けベースの分析とその後の自己修復をカバーする。同じアプリケーションをエッジ、ゲートウェイ、データセンターハブなどの異なる視点から見ることで、そのデータをAIOpsプラットフォームに供給した後に障害切り分けを行うことができます。

根本原因に基づく自己修復

自己修復の2つ目の方法は、根本原因ベースです。根本原因ベースの解析では、AIOpsプラットフォームはあらゆるネットワーク問題の特定の根本原因を特定しようとします。例えば、あるサイトのネットワークでZoomのパフォーマンスが悪いのは、5GHz同チャネル干渉による無線信号の不良が原因であるとします。

最終的な目標は、非常に具体的な根本原因を突き止めることで、システムが無線LANネットワーク自体をプログラムしようとするか、WANでは問題を軽減できないと判断します。後者の場合、システムは最も可能性の高い根本原因に関する洞察を提供することができ、実際には問題解決に最も時間がかかる部分となります。

WANでの緩和を可能にする根本原因ベースの解析の例として、拠点またはゲートウェイ内部でのキューイングが原因でパケットがドロップされることによるZoom パフォーマンスの低下が挙げられます。これは、同じリンク上で送信される他のアプリケーションよりもZoomトラフィックの優先順位を高くすることで修正できます。

すべてのトラフィックを同じゲートウェイに送るのではなく、複数のゲートウェイにトラフィックを分散させることも選択肢の1つです。システムは、単に WAN セグメントに障害があるというだけでなく、問題を明確に説明する正確な根本原因を突き止めようとしています。システムが検出した根本原因を元に戻すだけで、自動修復が可能になります。

別の例では、同じリンク上のFacebookトラフィックが原因で、在庫管理ソフトウェアのパフォーマンスが低下している可能性があります。システムは、そのリンク上のFacebookのトラフィック量に上限を設けるか、Facebookの使用率を制限することで問題を解決できます。どちらの方法でも、問題は自動的に解決されます。

強化に基づく自己修復

自己修復の3つ目のアプローチは、強化ベースと呼ばれるものになります。この手法では、強化学習と呼ばれる機械学習技術の一種を修復に使用します。この場合、システムはネットワーク問題の正確な障害根本原因を特定しません。ただ問題があることはわかりますが、その正確な性質はわかりません。

この時点でシステムは、最もうまくいく可能性が高いと思われるさまざまな修正をテストし始めます。そして、重要なフィードバック・メカニズムを活用して、その有効性を判断します。そのため、障害切り分けや根本原因の自己修復手法においても、システムが自動的にネットワーク・パフォーマンスのベースラインを知ることは、非常に重要な要素となります。このベースラインは、修復が実際に機能したかどうかを知るためのフィードバック・メカニズムを提供します。

強化ベースのモデルを適用する場合、システムはプロセスの各ステップにおいて、ベースラインを報酬関数として使用します。ベースラインをより良くすることが正しい改善アプローチであるという観点から、最適な解決策に向かって解決策を推進しようとするものです。

例えば、あるネットワークでMicrosoft 365のパフォーマンスが低下しているとします。 システムはさまざまなアプローチ(トラフィックの優先順位の変更、別の経路への誘導など)を調査し、最も有望と思われる(つまりベースラインを最も改善する)特定のアプローチを採用することができます。

システムは、実際に機能するものを見つけることができるまで、この方法を続けます。しかし、機械学習モデルがそのシナリオに最適な修復方法を教えてくれるため、失敗した試みはすべて無駄にはなりません。強化ベースのアプローチは、最終的に問題の原因とその正しい修正を決定するために、緊密なフィードバックメカニズムに依存しています。

情報セキュリティ問題の自己修復

積極的にネットワークパフォーマンスを改善することに加え、自己修復は潜在的なセキュリティ問題の解決にも適用されます。例えば、PCIに準拠する必要があるPOSデバイスが、iPhoneやその他のユーザートラフィックと同じネットワークセグメント上にあることをシステムが自動的に検出することができます。これはPCIルール違反です。そのため、これらのデバイスは自動的に独自のマイクロセグメントに配置され、修復される必要があります。

別の例としては、特定のデバイスがよりリスクの高い宛先にアクセスして異常な動作をしていることを検出することが挙げられます。システムは、これらのデバイスへのアクセスを拒否するルールを自動的にプログラムすることで、問題をプロアクティブに処理します。VMware Edge Network Intelligence™と組み合わせた VMware SD-WANプラットフォームは、パフォーマンスの観点から自己修復機能を提供する一方で、セキュリティポリシーの観点からも同様のアプローチを取っています。このアプローチは、優れたパフォーマンスとエッジにおける最先端のSASEとセキュリティサービスの両方を備えたSD-WANネットワークを提供するというVMwareの全体的なビジョンと結びついています。

AIOpsがネットワーク管理者の効率化を実現

ネットワークの問題を自動的に修正するためにSD-WANプラットフォームが利用可能なこれらの自己修復メカニズムすべてについて、IT 管理者はこの自動化技術について快適に思っていただけるかと思います。そして、自動化されると、それらをレポートして欲しいと思うでしょう。レポート機能は、自己修復機能を持つAIOpsプラットフォームを含むSD-WANソリューションのROIを決定する際に重要です。

自動化を行うにあたり、システムが推奨されるアクションについてIT管理者に通知することは重要です。事前に通知があることで、エンジニアは特定のアクションが発生する前に、システムがそのアクションを実行することに問題がないかどうかを判断することができます。

また、自己修復アクションを自動化し、そのアクションに関する情報をベースラインに注釈することもできます。IT管理者は、自動化されたアクションに関する通知と、その後のネットワークパフォーマンスに関する詳細を受け取ることができます。ネットワーク・エンジニアには、今後同様の自動アクションを許可するかどうか指定することもできます。これにより、ネットワークへの自己修復アクションが成功した場合、夜中に電話がかかってくるのを防ぐことができるようになります。

最終的に、SD-WANプラットフォームに投資することは、最先端のAIOps機能と組み合わせることで、より良い選択となります。