VMware vSphere作为虚拟化技术的代表产品之一,长期占据城商行虚拟化市场主流位置。如今随着市场的变化,很多城商行正在开展VMware虚拟化平台替换工作。
城商行关键应用IT架构以物理机和虚拟化架构为主,平稳替换是主流需求,但在具体落地方面,仍面临很多挑战——
-
VMware虚拟化长期使用、承载了大量业务系统,如何设计适合企业的替换策略?
-
关键应用国产虚拟化软件有哪些关键的选型要素?
-
数据库类应用国产虚拟化架构如何设计容灾方案?
-
存量VMware虚拟化与替换后的虚拟化如何实现统一管理?
……
针对这些实践上的具体难点,深信服云计算产品规划总监牛孟涛、某股份制银行王振华、某城商行云技术组组长刘肃羽、某城商行朱向东,以及40多位城商行同行相聚在twt社区于5月12日举办的线上活动中,围绕主题“城商行如何实现关键应用VMware虚拟化平稳替换?”展开交流。
本次研讨议题主要是【城商行VMware虚拟化技术替换的需求分析与策略探讨】和【城商行VMware虚拟化技术替代方案和产品选择的关键点】。各位专家根据城商行在替换工作落地实践时容易遇到的问题,探讨实在有效的共识:
一个观点:
所有的迁移尽量是以业务为维度的迁移,迁移不能完全依赖厂商的支持,因为最了解业务的还是银行自己的团队。企业需要自己独立分析业务需求,主导迁移。
两个架构:
ARM架构(包括鲲鹏和飞腾)性能不断提升,产品线丰富;X86架构(包括海光和兆芯)性能较强,应用生态丰富。
三类应用:
数据库类(如Oracle)、中间件(如WAS)、业务系统应用程序是城商行关键业务VMware虚拟化承载的应用。实施迁移时,需要具体问题、具体分析。
四个重点:
-
可靠性:硬件或者平台软件出现问题,不会对业务产生相关的影响。
-
生态兼容性:平稳替换会涉及外置存储的对接、新服务器的适配,最好具备强大的兼容性;
-
性能:需保障关键业务系统的性能。
-
厂商实力:需关注厂商的整体实力而非单个产品的能力,重点考察其能否支撑完整的迁移计划并提供风险预案,保障业务系统迁移后有良好的运行效果。
同时,深信服云计算产品规划总监牛孟涛与某城商行云技术组组长刘肃羽也分别针对解决方案与最佳实践,以及技术路线选型及落地实践经验进行分享,为在场的40余位银行业嘉宾提供多种替代思路。
专家分享之外,参会嘉宾也有许多关于自己在VMware替换时遇到的真实难题,下面也向各位分享本次交流中的精彩问答。
需求分析和策略探讨
当前操作系统的版本,包括操作系统上安装的中间件,数据库的类型都非常多,有C开发的应用程序,也有Java的应用程序,如何在线迁移到不同架构的CPU上?需要怎么做考虑?怎么做测试验证?
某股份制银行王振华:
虚拟化替换主要是提前规划要如何做?重点关注哪些地方?第一个是稳定性和应用性,这和我们选的厂商有关系。选型之前会做一个POC测试,会搭一套测试验证环境,厂商要进场之前,必须在测试验证环境上面去部署一整套的产品。
把相关的功能点全部放在POC测试里面去,然后,看这些功能点是否全部能满足我们的需求。如果都能满足,那就达到我们的要求,就通过POC测试了。
如何实现虚机操作系统级的迁移?迁移到系统里面的先后顺序是基于哪些方面去考虑的?虚机迁移之后的利旧问题怎么解决?
某城商行朱向东:
所有的迁移尽量是以业务为维度的迁移。基于虚机的迁移是可以做的,但是要根据自身情况去决定,在银行里有一些相关的规定,操作系统的版本是否在厂商支持的范围之内,一些老的版本,厂商已经不再提供服务了。如果基于虚机这种方式迁移,基于一个老的系统去迁移,技术上是没有难度能迁移成功,但是应用程序要换到新版本操作系统里就会涉及大量的改造工作了。做迁移的时候,厂商去做的辅助保障只能做自身产品的底层的保障。应用层一定要自己的团队去做,一定要做好实际的测试。
一般情况下把应用分成了三类,一是办公类、二是一般类、三是核心类。要求办公类先进行改造,第二是一般类,最后是核心类,大概按照这个顺序迁移。
老旧的设备,包括软件都是基于X86来做,国内首先C86是一个技术路线,ARM也是一个技术路线,这两个路线对应的架构,指令集是不同路径的演进结果。应用是要做改造的,所以选型要具备前瞻性,这种方式和老环境去做互通,20台机器作为一个集群,这个集群里的所有资源都是共享的,这样更利于成本上的一些节省,也是发放到不同的资源池,规划是一个应用至少是四个节点,每一个节点都放在不同的资源池。这样任何一个资源池出现整体故障业务是不受影响的。
方案路径及产品选型关键点
做平替换选型的时候,要考虑哪些点?选型后到底要做出哪些调整能迅速适应虚拟化环境?旧系统做改造的时候,要关注哪些改造点?选型新产品的时候,如何确认这个产品能适应未来的发展?
深信服牛孟涛:
平替的选型考虑问题,综合目前市场上用户的需求,进行分类分析后发现,有几个关键点。
-
可靠性是最重要的考虑之一,平台的可靠性是怎么做的,是不是通过高可靠架构,通过软件兜底等方式,目的是硬件或者平台软件出了问题,不会对业务产生相关的影响,这是考虑的重中之重。
-
替换会涉及到外置存储的对接,服务器的适配。生态兼容性需要重点考虑。
-
性能是一个重要考虑因素。性能表现通常是综合的,影响因素也有很多,如使用外置存储的性能如何?有没有其他方式提高性能?目的是考虑如何能保障关键业务系统的运行性能。
-
迁移考虑的是厂商的能力,而不是仅仅是产品的能力,多考虑厂商对迁移整体计划的完整程度,以及风险预案,这是业务系统能顺利迁移过去的保障。
除此之外,易用性是大家都很关注的,怎么调整运维人员的能力,能够让运维人员来适应新产品的运维,要提供手册、日常操作命令,常见故障的处理等方式来完成自主维护。
对于业务当前的重要程度、未来在改造之后的期望,是决定我们选择平稳替换或选择重构的一个很关键的因素。我们希望迁移之后能够实现更多有效的事情,或者希望通过这次改造能够让它产生更多的价值,那么我们尽量会选择重构。
而该如何选型来适配未来发展?厂商对产品的一些投入程度是关键,是决定了未来产品能够平滑演进的一个很关键的点。未来数据中心的生态不仅只有容器,也不仅只有虚拟机,我们在进行平滑替代之后,还应考虑到未来基础设施的发展,以及管理或者统一调度的情况。因此需要按照行内规划,业务发展,并结合厂商对未来的投资进行综合考虑,选择合适的产品。
虚拟化平替方案要考虑哪些点?如何选择适合的产品并且如何保障产品的可靠性?
某城商行朱向东:
实现虚拟化的平替,现在国内很多虚拟化产品如何去选?首先要结合自己单位的实际情况,要去选择适合你的,不是所有的虚拟化产品拿过来都可以直接使用,在选型的时候一定要做现场实测,要结合现有的网络环境和将来的网络规划去做新产品的实际场景选型测试。
在虚拟化产品的功能上,只要是能符合你们实际的使用需求即可。常用的虚拟化的功能有哪些就重点测试哪些,对于以后可能规划要用的一些功能,也可以重点的去做测试。
结合现有环境的使用年限,生命周期也要做提前的考虑,比如十年前或者五年前,采用的技术与当前流行技术可能是不一样的,所以在做实际测试的时候尽量要结合历史的演进情况,把对将来的一些规划一些前瞻性考虑融合到里边去。
选型最关键的是可靠性和安全性,还要考虑生态和兼容性,功能选择适合自己的。新的虚拟化平台的网络结构,尽量的要去前瞻考虑,兼顾老环境的网络的连通性,提前做好网络规划。
在选型过程中,如何通过配套的文档甄别哪一个产品更符合自己所需,哪一个产品是确实好用的?
深信服吴大立:
现在所提的虚拟化替代更多的是指虚拟化产品的替代,而不是单虚拟化能力的替代,除了虚拟化能力也需要关注整个产品DFX能力,包括性能、稳定性、可维护性、开放性等。
在虚拟化能力上大家应该都比较熟悉,技术的底层原理可分两条线,一条是VMware的线,另外一条线是基于KVM这条线。国内虚拟化主要是基于KVM路线去演进,在技术方向上各家基本一致,但在软硬协同与DFX能力上各家还是能体现出差异来。现在各厂商都会提供技术白皮书,我们可以通过这些信息来评估各厂商在软硬协同优化方面的能力。
另外一个关键点是产品的知识库,因为这部分会决定用户的自运维能力。我们遇到很多用户反馈:虽然厂商能提供上门服务,但厂商上门会存在路程耗时等问题,处置问题的及时性远不如自己的运维人员。因此是否提供一个足以支撑用户自运维的产品知识库也是一个重要的评估点。