vRealize Operations 工作负载优化演示 — 实现服务等级 SLA

工作负载优化演示 — 实现服务等级 SLA

下面给大家看一个利用 vRealize Operations 的工作负载优化能力提供不同服务等级来保证关键业务应用性能的演示，建议先阅读一下文章“vRealize Operations 自动驾驶式运维之性能优化”，有助于理解演示中所涉及的知识和概念。

在演示的环境有两种类型的服务器：

Gold (金牌)：最新的高性能服务器，提供最高等级的计算服务；
Silver (银牌)：比较老的服务器，性能相对差一些，提供一般等级的计算服务。

这些服务器都被打上了标签类型“SLA Tiering (SLA 等级)” ，根据服务器的类型分别打上金牌和银牌两种标签。这些服务器组成了两个集群：

Cluster3：兼有金牌和银牌服务器，“SLA Tiering” 打上了 Gold 和 Silver 两种标签；
Cluster4：只有银牌服务器，所以打上了“SLA Tiering = Silver” 的标签。

演示环境中的工作负载也分为两类：

关键应用：对应于关键业务，要求保证应用运行性能，需要“金牌”等级的计算服务，虚机被打上 “SLA Tiering = Gold” 的标签，在下图中表示为橙色；
一般应用：对于性能的要求相对较低，只需要“银牌”等级的计算服务即可，虚机被打上 “SLA Tiering = Silver” 的标签，在下图中表示为灰色。

优化前：有两个关键应用虚机运行在 Cluster4 中

管理员在 vRealize Operations 中把运维意图设置为“均衡 (Balance)”；把业务意图 (Business Intent) 设置为分层的服务等级 (SLA Tiering)，指定了 Gold 和 Silver 两种服务等级，并且激活了优先考虑高等级服务开关 (Enable Prioritization)。优先考虑高等级服务意味着同时存在金牌和银牌服务器的情况下，调度工作负载时优先考虑高等级的服务器，在下图中 “SLA Tiering = Gold” 的编号是1，优先级要高于编号为2的 “SLA Tering = Silver”。

设置好工作负载优化策略后就可以启动优化操作，优化后原来运行在 Cluster4 中的两个关键应用虚机被迁移到了 Cluster3 中，这样它们可以享受金牌等级的计算资源，保证关键应用的性能。同时，原来 Cluster3 中的非关键应用虚机也保持不动，继续运行在金牌等级的 Cluster3 中，因为现在的优化策略是优先考虑高等级服务，当 Cluster3 中还有空闲的计算资源时，也会允许一般的应用在其中运行，以充分利用高性能的服务器资源。

优化后：这两个关键应用虚机被迁移到了 Cluster3，在“金牌”服务等级的服务器上运行

这是一个零售企业，双11的时候业务量暴增，Cluster3 中的资源消耗殆尽，在下面的示意图中可以看到某些虚机变大了 (消耗的资源变多了)，从而导致某些关键应用的性能下降，甚至无法正常工作 (演示中 Nginx 因为资源竞争出现了 Bad Gateway 的错误)，vRealize Operations 提示该数据中心需要性能优化。

管理员手动启动优化后，Cluster3 中的部分非关键应用 (灰色 VM) 被迁移到到了 Cluster4，从而释放了一部分资源给 Cluster3 中的其他应用，我们可以看到原来受阻的关键应用恢复了正常工作。

为了清楚地展现每一个步骤，演示中的性能优化操作都是手动启动的，在实际环境中更多的是采用自动优化，vRealize Operations 会根据管理员设置的优化策略寻找优化机会，并且自动地进行数据中心性能优化。为了让管理员了解在过去一段时间内是否有自动的优化操作发生，vRealize Operations 还提供了一个优化历史 (History) 工具 (如下图所示)，管理员可以拖动时间轴来显示过去一段时间内自动执行的优化操作，直观地看到虚机迁移的过程。

演示视频 (提示：请选择视频下方的“高清 720P”选项来观看)