本期焦点
某制造业上市集团开始全面推进数字化变革,全方位构建数字化营销、研发、制造、供应链、服务等数字化经营能力,旨在建立具有持续创新能力的自进化型的数字化企业。
集团数字化进程在加速,加之原有VMware架构面临的诸多状况,为了让企业信息流更加畅通,提高生产效率和质量,降低生产成本和风险,集团决定使用深信服超融合替换原有IT架构,承载核心MES系统。
Part1 MES系统介绍
MES系统概述
MES(Manufacturing Execution System):制造执行系统,是一个用于生产过程控制和管理的信息系统,起着承上启下的调度作用,类似于排期的课程表,告诉你在什么节点该执行什么任务。
MES填补了ERP等上层管理系统与生产控制之间的信息“断层”,使企业信息流更加畅通,提高生产效率和质量,降低生产成本和风险。
如上图,MES系统向上承接ERP下达的生产计划,与APS系统集成进行生产排程,MES系统根据现场任务的进度安排向ERP系统提供领料需求,ERP系统向MES系统提供零件领料的详细信息,使车间及时了解生产准备情况。
MES系统向下与自动化控制系统集成,提供生产执行指令,自动化控制系统向MES实时反馈执行结果及工艺参数、设备性能参数,WMS系统向MES提供物料相关信息,根据MES系统的生产调度指令,按需进行物料配送;QMS系统向MES系统实时提供质量检测结果,并根据MES系统提供的质量相关数据进行质量分析。
生产任务完成后,MES向WMS提供完工产品信息及数量,WMS完成自动入库,并将完工信息反馈给ERP系统:ERP自动关联到相应订单并进行完工处理,从而打通生产环节的物流与信息流,实现计划、物流、生产的闭环管理。
此外,CÁPP及PDM/PLM等系统通过与MES系统的集成,向MES系统提供产品的加工图纸、工艺信息、作业指导书等,保障MES系统能够展开工艺级别的生产排产和调度,MES系统也会收集反馈生产现场各类数据,用于后期产品的设计与工艺优化。
MES系统功能架构
MES涉及车间现场管理的人、机、料、法、环、测、能(5M2E),从生产排产、生产计划执行、生产工艺指导、生产过程追溯、车间现场数据采集、生产物料供应、设备管控、生产质量管控、在制品管理、人员排班、生产绩效分析等多个维度对生产现场进行集成管理。制造企业应用MES系统的核心价值在于实现生产现场的透明化,实现生产过程的全程追溯,提升产品的按期交付率遵从行业法规与标准,提高设备和人员绩效,提高生产质量等。
MES是工业4.0实现纵向集成的枢纽,也是智能工程建设的核心系统。广泛用于制造业,包括机械、电子、汽车、家电、电气、造船等离散制造行业,化工、钢铁、石化、水泥等流程制造行业,制药、食品饮料、烟酒、轮胎、日用消费品等混合制造行业。
MES部署资源要求及业务架构
(1)MES系统架构:
MES属于生产环节最经典且最重要的系统,管控着整个生产流程,数据量大、实时性强、并发访问频繁且数据吞吐量大,需要保证数据存取的高效响应时间、高可靠性,以及系统抵御数据丢失风险的能力和系统的容灾能力。
MES系统数据总量(每月)换算公式为以下三个指标相加之和:
-
过站数据=每月产量*每产品工序数
-
追溯数据=每月产量*关键部件数
-
测试数据=每月产量*测试工序*每工序测试项目
核心系统MES都是采用关系型数据库(SQL Server /Oracle),业务逻辑除了应用层会完成部分外,还有多数业务逻辑运算在数据库层中实现,非常依赖于数据库服务器的性能。
(2)MES系统对IT资源的需求:
-
MES WIP(OLTP)数据90%都是写操作,故OLTP 存储需要进行写操作优化,ODS必须保证与WIP(OLTP)性能一致。
-
备份作业尽量少地影响存储性能。
-
有足够的备用磁盘,单个磁盘损坏能快速重构。
-
IOPS 最低要求:MES OLTP 1500 以上,ODS 2000 IOPS 以上。
Part2 集团MES建设思考
集团简介
该集团正全面推进数字化变革,运用前沿数字化技术,全方位构建数字化营销、数字化研发、数字化制造、数字化供应链、数字化服务等数字化经营能力,建立具有持续创新能力的自进化型的数字化企业,为客户持续创造价值,推动时代进步。
集团当前服务器已超过100台,业务部署较为分散,主要分布在集团总部、国内及海外各事业部,本次为下属某工厂新建MES系统。
如图所示,该工厂MES系统为传统架构,前端终端操作人员负责提交生产指令,通过PDA等设备录入生产信息;排产系统负责排程,数采将现场采集数据推送反馈到MES系统;后端MES数据库采用Oracle RAC部署,保障高可用。
集团MES承载架构的选择
(1)原IT架构介绍:
该工厂原有IT情况:
如上图所示,用户原来采用3台物理服务器组建VMware集群,单台服务器为192G内存,架构为vSphere+外置SAN存储,应用主要分为应用服务器和数据库服务器两类,均采用单台虚拟机部署,共运行有13台虚拟机,总存储空间为10.06 T。
(2)原架构存在的挑战:
- 集群老旧,平台维护成本高:集群搭建于2017年左右(部分服务器采购于2016年之前),版本为vCenter 6.0,集群老旧且VMware升级维护成本很高,面对集团产能增加,现有集群难以满足未来业务承载需要。
- SAN存储架构可靠性不足,早期建设存储因成本原因没有做主备或者集群,形成了单点故障,一旦存储网络或者存储本身出现问题会直接影响产线生产工作开展,造成巨大经济损失。
- 存储性能&容量瓶颈,这几年随着业务快速发展,性能已经出现瓶颈,但原本采用的外挂SAN存储受限于存储控制器,性能无法随着业务升级演进进行快速扩展。而且因为盘柜数量有限,当前已经无法继续扩容,只能更换规格更大的存储设备,还面临更换存储过程中数据迁移慢,业务中断时间长的问题。
(3)超融合架构的选择与资源配置
架构选择及设计:
-
在规划新的承载平台时,考虑到生产系统产能提升,以及资源冗余、高可靠等因素,因此新建平台采用超融合集群。
-
考虑到MES为核心生产系统,因此考虑采用3副本,提升数据可靠性。基于3副本的选择,本次集群也扩展为5节点,使得该场景下同时两台服务器出现故障仍可以正常进行业务访问和数据读写。
-
考虑MES的数据库高性能访问,在每台主机中配置6块SSD、4块SATA。其中每台提供4块SSD,共20块SSD形成全闪分卷。另外每台提供2块SSD、4块SATA形成混闪分卷。全闪用来作为数据库的业务分卷、混闪作为普通业务分卷。既保障业务承载的性能,也一定程度上帮助用户降低硬盘成本。
Part3 集团MES承载实践
MES实际承载资源配置
整个资源池已稳定承载MES近一年时间,集群中共有5个主机,CPU总量1.1THz,内存总量1.9TB。
平台有2个存储,其中虚拟存储2个,1个为全闪,1个为混闪,外置存储0个,存储总容量为133.3 TB。
共运行21台业务虚拟机,虚拟机在线率达90.5%。
MES承载生产运行过程数据记录与分析
(1)MES承载关键能力
MES系统与生产设备正常工作关联度较高,因此在MES系统上线验证、运行过程中核心关注两个指标:
-
业务运行可靠性,本次已经采用超融合集群三副本+Oracle RAC多活架构,进行了主机中断故障等场景模拟,均不影响业务运行。
-
需要验证MES运行过程中的时延,通常不同产线的要求不同,但一般都不应超过15ms,否则会影响数据库性能进而导致前端生产线受到影响。
(2)MES生产运行性能
混合磁盘读写时延↑
混合磁盘命中率↑
全闪磁盘IO吞吐↑
全闪磁盘IO时延↑
-
混闪资源池(应用):平均IO速率在2MB/s左右,平均IO读时延在3 ms,写时延在0.5~1.8ms之间,主机命中率达99%。
-
全闪资源池(数据库):平均IO速率在100MB/s左右,平均IO读时延在0.5 ms,写时延在1~2ms之间。
(3)MES承载数据分析
从实际运行来看,混闪集群因为都是小应用服务,主要是小块IO,IOPS与吞吐量较低,业务访问都可以命中SSD缓存,整体服务效果很好。
而全闪集群因为有核心数据库访问,IO吞吐量较高,目前基本已经跑满千兆网络,但因为已经采用了高性能卷,所以实际读写时延并没有因为压力的大幅增加,整体控制在2ms以内。
生成环境数据,充分验证了该方案在MES业务系统承载过程中突出性能表现,而且根据当前资源状况,后续随着产线数量增加或者业务压力增大,现有超融合集群还可以承接3-5倍当前压力的业务。
Part4 场景价值
-
满足该集团产能扩张需求,通过低时延、高性能确保MES高峰期业务运行,支持300以上的MES并发。
-
通过三副本集群模式大幅提升数据可靠性和业务可靠性能,帮助MES系统规避单点故障风险,保障集团生产业务连续性。
-
新架构平台扩展性好,厂区后续新业务可以快速部署,按需增加节点满足容量和性能的扩展。
云话技术是深信服打造的一档云技术内容专栏,将定期为大家推送云计算相关的技术解析、场景实践等内容,为大家深度解析深信服在云计算领域的创新能力、技术动态、场景应用及前瞻分析等内容。