超融合架构

VMware 发布 vSAN 6.6.1

2107 年 7 月 27 日,VMware 发布了 vSphere 6.5 的更新版本 Upadate 1,一同发布的还有存储虚拟化产品 vSAN 的最新版本 6.6.1,该版本在 3 个月前发布的 vSAN 6.6 基础上增加了一些新功能,来进一步帮助用户降低运营成本和简化日常的管理工作。

VMware vSphere Update Manager (VUM) 集成

vSphere Update Manager (VUM) 已经被管理员们广泛使用了,它可以针对整个集群自动完成系统升级和补丁安装,大大简化了系统管理的工作。 但是在系统更新之前,管理员还是需要手工检查硬件的兼容性,例如 Raid 控制器或 NVMe 设备是否支持更新后的 vSphere 和 vSAN 版本,这项工作需要人工来核对 VMware 兼容性指南 (VMware Compatibility Guide) 文档。

vSAN 6.6.1 免除了这些手工步骤,VUM 现在可以直接从云端的硬件兼容性列表 (HCL – Hardware Compatibility List) 和 vSAN 发行版本目录 (Release Catalog) 中获得硬件兼容性信息,从而根据本地运行平台的硬件信息自动决定是否需要更新设备驱动、软件安装顺序和必要的关键补丁。这项功能目前支持包括 Dell、 Fujitsu、Lenovo 和 Supermicro 这些厂商的硬件。

VUM 中定义了一条系统基线 (baseline),从而保证集群中所有的服务器都运行在相同的 vSphere 和 vSAN 版本上;每当有新的系统更新发布时,vSAN 的 Health Service 中就会主动显示一个提示,管理员就可以让 VUM 完成整个集群的升级工作。

 

vSAN Cloud Analytics 支持性能诊断

vSAN Cloud Analytics 是 6.6 中新增加的功能,vSAN 用户可以选择参加客户体验改进计划 CEIP (Customer Experience Improvement Program) 来获取 VMware 对于 vSAN 环境的建议和指南。VMware 从参加 CEIP 的用户环境中收集信息,在云端进行分析,然后针对每个客户的环境给出建议,例如:vSAN 环境中服务器上的固件、驱动和软件配置是否符合 VMware 的建议;特定硬件环境中遇到过的故障也可以对其他客户及时提出预警,避免类似问题再次发生。

vSAN 6.6.1 在 Cloud Analytics 中增加了性能诊断的功能,它会收集和分析 vSAN 集群的性能数据,然后跟一个预先记录的性能标杆相比较。性能分析的结果会告诉你造成性能问题的根本原因,以及建议相应的优化措施。具体的性能测试是由 HCIBench 完成的,HCIBench 是 VMware 专门为超融合系统提供的一个性能测试工具,它实际上就是一个虚机,通过运行一组测试用例来分析系统性能。vSAN Cloud Analytics 收集性能测试的数据并进行分析,帮助用户实现端到端的性能测试验证 POC (Proof of Concepts),从而确定当前的软硬件配置是否能够支撑所需的工作负载。

管理员可以选择想要的性能目标 (最大 IOPS、最大吞吐量、最小延迟),指定性能数据分析的时间段。下面的截屏显示了性能诊断的一个例子,通过分析发现了以下问题:
✎ vSAN 环境在一个或多个磁盘组中有拥堵现象;
✎ 整个系统的性能可能达不到想要的目标;
✎ 出现的 IO 延迟可能超出预期的限制。

管理员需要采取一定的措施来提高系统的性能,如选择更高性能的 SSD 作为读写缓存等。

 

存储设备可维护性增强

vSAN 环境中的服务器都有很多块硬盘,当某一块硬盘发生故障时,怎样在十几块硬盘中确定是哪一块硬盘发生了故障呢?vSAN 6.6.1 提供了一个有用的功能来提高存储设备的可维护性,管理员可以通过管理界面让故障硬盘的 LED 灯进行闪烁,从而快速定位和更换故障硬盘。这个功能要求 vSAN 了解特定存储设备的接口,目前 vSAN 在 HPE DL 和 ML 系列服务器的 Gen9 控制器上支持这一功能。

 

支持 Intel 新一代至强处理器 Skylake-SP

最近,Intel 发布了新一代至强处理器 Skylake-SP (Scalable Processor),vSAN 6.6.1 能够充分利用 Skylake-SP 的处理能力,极大提升了整体系统性能。下图展示了 vSAN 的性能测试结果,左半部分是基于上一代处理器平台 Broadwell-EP (Intel Xeon processor E5-2600 v4) 的性能数据,右半部分是基于新一代 Skylake-SP 和 Optane 闪存技术的性能数据 (其中 P3250 和 P4500 是 Intel 的 SSD)。测试结果表明:跟前一代服务器技术相比,基于 Skylake-SP 和 Optane 的平台能够提供高达 2.5 倍的性能提升和虚拟机密度。

 

ROBO 和 Horizon 环境增加企业版支持

除了新功能之外,vSAN 6.6.1 也增加了对于远程办公室和 Horizon 环境的企业版许可证支持。

通常情况下 vSAN 是按照 CPU 来计算许可证数量的,但是在远程办公室或分支机构 (ROBO – Remote Office Branch Office) 的应用场景下,需要用到的虚拟服务器数量比较少,VMware 专门提供了按虚机计算许可证数量的 ROBO 许可证模式。在一个分支机构中物理服务器可能有好几台,但是用到 vSAN 存储的虚拟服务器可能只有5台,这种情况下只消耗5个虚机的 vSAN ROBO 许可证。vSAN ROBO 许可证25个一组,可以被多个远程办公室或分支机构的虚机所共享。vSAN 6.6.1 中增加了 vSAN ROBO 企业版的许可证,使得用户在这种应用场景中也能使用企业版中才有的数据加密和延伸集群等高级功能。

Horizon 高级版和企业版中自带了免费的 vSAN 高级版功能,很多 Horizon 用户都要求升级到 vSAN 企业级,所以 vSAN 6.6.1 中增加了给 Horizon 添加 vSAN 企业版功能的选项来满足这一部分用户的需求。