12月30日消息,今日,华为数据存储公众号发文,揭秘了华为南方工厂打造高端存储的奥秘——可靠性7个9如何达成。
据介绍,7个9代表着年意外停机时间不超过3秒,作为存放企业关键生产数据的存储,华为一直在持续不断挑战高端存储的可靠性高度,力争做到极致。
从部件级可靠性做起,华为从容忍三盘失效、容忍单个引擎及单个硬盘框失效,最终到容忍单套设备失效,重重可靠性保障,最终达到7个9的终极目标。
当然,这一切,都离不开高质量的产品。质量是什么?是研发的每一段代码,是电路的每一个实现,也是生产线上的每一个环节。
坐落于东莞松山湖高新技术园区的华为南方生产基地,依托AI质检这一前沿技术,实现了数据存储设备制造全过程的实时质量管控。
数据存储产品的质量检测,涵盖了从螺钉、散热器、风扇、导热垫的有无,到条码、铭牌、合格证、型号面膜、LOGO等信息的完整性及粘贴准确性,以及装配人员的取螺钉数量、打螺钉顺序、散热器及纽扣电池的装配操作等,无一遗漏。
华为AI质检解决方案
华为AI质检解决方案,由OceanStor 2910计算型存储结合慧视AI质检软件及中心训练平台组成。
该方案通过AI推理技术精准识别质量问题,同时借助昇腾训练平台的高效模型训练能力,造就了华为数据存储质量管控的防线。
慧视AI质检软件由产线的慧视端侧软件和OceanStor 2910里内置的AI平台组成。部署在工位侧的端侧软件负责质检数据采集,通过摄像机采集数据并上传到AI平台;AI平台则进行图像/视频分析及处理,并根据推理结果得到是否存在质量问题的结论。
慧视AI平台汇聚了华为南方工厂400多个产线AI质检算法的开发部署经验,提供16大类800多个工业算子,全面覆盖工业复杂场景。并且采用业界领先的检测算法,准确率超过99.5%,确保产品质量无忧。
OceanStor 2910计算型存储集计算、推理、企业存储、网络于一体,内置DME及慧视AI平台,极大简化了部署与运维流程。
通过双控主存储和企业级特性,提供99.9999%电信级高可靠性,保障产线7*24小时不间断运行。
此外,计算平台安装了慧视AI平台软件及华为数据存储DME数据管理平台软件,DME专用于海量视频图片的检索及管理,在产品质量出现问题进行回溯时,通过DME管理软件,可以实现百亿文件秒级检索。
AI训练中心则引入业界通用的分割大模型技术,实现one-shot或zero-shot自动标注,标注效率平均提升80%,大幅降低人力成本。仅需正常样本及少量未知缺陷样本(百张以内,甚至几张),即可实现质量风险拦截,助力新场景快速上线。
2024年南方工厂实现了1500多个工位与AI质检平台的对接,全年拦截质量风险超过15000起。