vSAN 自从 2014 年诞生至今,vSAN 业务和技术都得到了迅速的发展,截止 2016 年底,vSAN 在全球的用户超过 7000 家;vSAN 每隔 6 个月就会发布一个新版本,不断地增强 vSAN 的功能,vSAN 也从一个技术创新产品,成功地发展为一个企业级的成熟软件定义存储平台。2017 年 4 月,vSAN 又发布了最新版本 6.6,这里来给大家介绍一下 vSAN 6.6 的新功能。
1. 更高的可靠性
原生数据加密
实际上,vSAN 从版本 6.1 开始就支持数据加密,不过那时的加密依赖于硬件,通过支持加密的 Raid 控制器、或是自加密 SED 硬盘 (Self Envrypting Drive) 来实现的。vSAN 6.6 新增了原生的数据加密功能,用户不再需要额外采购具有加密功能的硬件,从而帮助用户降低 IT 成本。
vSAN 6.6 采用对称加密算法 AES 来对存储数据进行加密,高级加密标准 AES (Advanced Encryption Standard) 是美国联邦政府采用的一种区块加密标准。vSAN 通过调用 CPU 的 AES-NI (Advanced Encryption Standard – New Instruction) 指令集,通过硬件来加速加密算法,Intel 的 CPU 从 Westmere 开始就全面支持 ASE-NI 指令集,所以对性能几乎没有影响。
vSAN 的加密是针对底层的所有数据的,即使硬盘被窃,也无法从硬盘上破解出原始数据来。加密密钥来自于用户自购的第三方密钥管理系统,vSAN 支持任何符合 KMIP ((Key Management Interoperability Protocol) 标准的 KMS 系统,包括 SafeNet、Hytrust、Thales、Vormetric 等。加密功能是在 Datastore 物理层面上的,支持所有其他 vSAN 现有的功能,如混合、全闪存、Checksum、纠删码、去重、延伸集群等等。
新增不依赖于 vCenter 的管理界面
传统的 vSAN 管理界面是整合在 vCenter 之中的,虽然有管理上的便利,但是当 vCenter Server 不可用时 (计划或非计划的),就没法对 vSAN 进行管理监控了。vSAN 6.6 新增了额外的管理界面,分别是基于 ESXi Host Client 的图形管理界面,和基于 ESXCLI 的命令行管理界面,从而使得管理员不依赖于 vCenter 也能够对 vSAN 进行管控,提高了 vSAN 系统的可靠度和灵活性。
新增的管理界面不再赖于 vCenter API 来实现管理功能,它能够直接与集群中的 ESXi 服务器通讯来完成各种信息收集和管理操作,具有完善的 vSAN 管理功能:
- 显示 vSAN 的配置信息;
- 对 vSAN 进行配置;
- 监控 vSAN 的健康状态和性能。
主动式硬盘高可用性(vSAN Proactive Drive HA)
vSAN 会定期收集和分析驱动器的性能特征数据,如果发现某一个驱动器的数据异常,例如为了纠错重复读写而引起性能下降,vSAN 就会根据智能算法判定这块驱动器是否将会发生硬件故障,并采取相应的动作来保护数据安全。
对于被判定为将会发生故障的驱动器,vSAN 会对上面存储的数据对象采取相应的保护措施:
- 如果该数据对象存在其他副本 (replica),vSAN 就把该对象设置为“不存在(Absent)”状态,等待60分钟后执行重构操作 (等待60分钟是为了防止某台服务器网络掉线等暂时性可恢复故障时,不要盲目执行重构操作以免造成额外的系统资源消耗)。
- 如果该数据对象是唯一的存储副本了,vSAN 会马上执行“疏散(Evacuation)”操作,把该数据对象转存到其他驱动器上去。
主动式硬盘高可用性能够更有效地保证数据安全,同时避免一些不必要的系统资源过度消耗 (overhead)。
主机退役假设分析
主机退役 (Decomissioning Host) 操作包括把一台服务器置于维护模式 (Maitenance Mode)、或是把一个硬盘或硬盘组从 vSAN 环境中移除掉等等。主机退役时需要把该服务器上的数据疏散或副本重构,当 vSAN 集群空余资源不足时,会导致主机退役操作失败。vSAN 6.6 在执行主机退役操作之前,会对系统资源做一个完整的分析,确保 vSAN 集群中有足够的资源来完成退役操作。
如果分析结果显示现有的资源不足以完成主机退役操作,管理员可以采取一些措施来获得额外的空闲资源,例如可以降低 FTT (Failures To Tolerate,允许故障数) 的数值,来释放资源;或是在其他服务器上增加硬盘来获得额外的存储空间等等。当然,如果不是很紧急的话,他也可以暂时放弃维护操作,等到一个合适的维护窗口来关闭整个 vSAN,以便完成相应的硬件维护操作。
2. 更低的 TCO
vSAN 6.6 也增加了一系列简化系统管理的新特性,从而帮助用户降代使用 vSAN 的总体成本。
延伸集群中的双重数据保护措施
延伸集群 (Stretched Cluster) 提供了一种低成本的双活数据中心高可靠方案,vSAN 6.6 为延伸集群提供了本地和跨站点的双重数据保护机制。简单地说,就是一般的本地故障尽可能在数据中心本地得到恢复;只有发生站点级故障时 (如整个数据中心站点断电了),才跨数据中心进行恢复。这样可以尽可能地减少不必要的跨数据中心网络流量,不需要购买额外的灾备硬件和软件就可以实现双活数据中心的高可靠性。
vSAN 在这一方案里提供的是数据存储层面的高可靠性机制,它把 FTT (Failures To Tolerate) 分为两个层级:
- Secondary Failures to Tolerate (SFTT) 指定站点内的 FTT 策略,取值可以是 0-3;
- Primary Failures to Tolerate (PFTT) 指定的是跨站点的 FTT 策略,取值可以是 0-1,0表示没有跨站点的数据保护,1表示在另一个站点保存一份数据副本。
如果某个虚机不需要进行跨站点的保护,管理员就可以把虚机对象的 PFTT 值设为0,这样就不会进行跨站点的数据复制,从而节省了不必要的存储和网络开支。一些关键应用本身已经具有了跨站点保护功能,如 Exchange DAG、SQL Availability Groups 等,它们也不需跨站点保护。
Failure Tolerance Method (FTM) 参数指明了数据容错的方法:
- 跨站点和站点内都采用 RAID1 (镜像),对混合和全闪存配置都可行;
- 跨站点采用 RAID1,站点内采用 RAID5/6 (纠删码),仅对全闪存配置有效。
vSAN 集群采用更简单的 Unicast
6.6 以前的 vSAN 集群要求使用 Multicast 网络通信方式,这样才能保证 vSAN 集群的正常运行。vSAN 6.6 采用了更为简单的 Unicast,从而简化了网络设计和部署的工作量。
基于大数据分析的 vSAN 使用指南 (vSAN Cloud Analyst)
vSAN 6.6 的用户可以选择参加客户体验改进计划 CEIP (Customer Experience Improvement Program) 来获取 VMware 对于 vSAN 环境的建议和指南,这些指南是 VMware 从全球上千家用户中收集的信息经过分析提炼,专门针对你的环境所给出的建议,例如:你的 vSAN 环境中服务器上的 firmware、driver 和软件配置是否符合 VMware 的建议;其他客户相同硬件环境遇到过的故障也可以对你及时提出预警,避免类似问题再次发生。
- 针对你的环境给出明确的分析建议,减少你故障排查的时间;
- 基于云端服务的健康检查,及时提醒你已知问题,并且推荐给你对应的 KB (Knowledge Base) 文章;
- 针对你的系统进行性能诊断,及时报告性能异常。
参加 CEIP 计划很简单,只要在 vCenter 中选择 Home > Administration > Customer Experience Improvement Program > Join 就可以加入了,当然是否参加 CEIP 是基于自愿的。请大家放心,CEIP 计划不会收集你的业务环境相关数据,如 IP 地址、主机名称等都会被经过匿名处理。
简便的安装部署
vSAN 6.6 把安装部署步骤整合到了 VCSA (vCenter Server Appliance) 的安装工具中,可以全自动安装部署 VCSA 和 vSAN 服务,然后再向集群中增加服务器。这样大大简化了 vSAN 环境的安装部署过程,节省了很多部署成本。
另外 vSAN 6.6 提供一个 “Config Assist” 工具来帮助管理员快速获得所有硬件板卡的最新 firmware 和 driver,“Config Assist” 也用于保证相关软件的配置参数是否正确:
- 简化超融化系统管理:一键式完成控制器 firmware 和 driver 更新;
- 自动检测硬件兼容性:检查相关硬件的 firmware 和 driver 版本是否正确;
- 检验和修复关于 vSAN 环境的软件配置;
- 通过 wizards 来检验 vSAN 环境的相关软硬件配置是否符合最佳实践建议。
vRealize Operations Management Pack for vSAN
vROps 对于 vSAN 的支持以前是通过 Management Pack for Storage Devices (MPSD) 来实现的;从 vSAN 6.6 开始,vSAN 有了自己专用的 Management Pack,从而实现跟 vROps 的深度集成,并且提供更细颗粒度的监控功能。
vSAN Mgmt Pack 提供预定义的仪表盘 (dashboards),也允许用户在仪表盘上自定义任何 vSAN 数据。vSAN Mgmt Pack 让 vROps 能够在同一个管理界面上监控数据中心的所有资源,让用户对于软件定义数据中心的管理更加简便。
3.与时代前沿技术同步
持续优化的系统性能
VMware 开发团队持续对 vSAN 产品进行一系列的优化,例如对于各种全闪存系统的支持、去重和 checksum 算法的优化等等。跟 6.5 相比,vSAN 6.6 实现了最多 50% 的性能提升 (以 IOPS 衡量,基于 4KB 读写 [70%读 / 30%写]),读写延迟最多减少了 35%。
这些性能的优化进一步增强了用户把关键业务应用转移到 vSAN 平台的信心,vSAN 不仅能够支持各种工作负载,也能够有效降低总体成本。
对于最新创新技术的同步支持
3月19日 Intel 发布了首款基于闪腾 (Optane – 3D XPoint) 技术的闪存驱动器 Intel® Optane™ SSD DC P4800X,容量 375GB,后续会有 750GB 和 1.5TB 容量的型号发布。VMware 跟 Intel 的工程师紧密合作,也在同一时间宣布了 vSAN 对于 P4800X 的支持。
在 Intel 和 VMware 举行的联合测试中,Optane NVMe 闪存在 vSphere 平台上的表现优异。在 vSAN 的读写缓存测试中,Optane NVMe 闪存比 Intel 上一代的 P3700 NVMe SSD 对于写密集型工作负载 IOPS 性能提高了 2.5 倍,而写操作延迟也最多减少了 2.5 倍。
除此之外,vSAN 6.6 还提供了对于 1.6TB 闪存盘作为缓存的支持。vSAN 对业界最新技术的同步支持使得用户能够充分利用最新的硬件产品创新所带来的性能提升和成本降低。
支持新一代的应用系统
vSAN 的优异性能使它成为新一代应用系统的理想运行平台,无论是传统的大型应用 SAP,还是新一代的大数据平台 Hadoop 都可以运行在 vSAN 上,vSAN 也可以支持云原生应用架构如 Mesos、Kubernetes 和 Swarm 等。vSAN 6.6 为各种典型的应用提供了参考架构设计,包括:
- Intersystems Caché;
- Hadoop and Big Data;
- XenDesktop/XenApp。