制造百科
如何打好工业大数据实施与落地"攻坚战"?
2021-10-28近年来,随着企业所拥有的数据日益丰富,以及数据驱动意识的不断提升,越来越多的制造企业加强了大数据应用探索,并已有一些成功的应用实例。然而,对于很多制造企业而言,在推进工业大数据的应用过程中仍面临着以下难题:采集了很多数据,如何来分析和利用这些数据,找到与自身业务融合的应用场景以解决实际问题?如何务实推进工业大数据的实施与落地?本文将围绕着以上问题进行讨论和分析,希望为企业开展工业大数据的实施与应用提供启示与借鉴。
合适的场景是工业大数据落地的关键
当前,工业大数据在制造企业已形成加速产品创新、生产工艺优化、生产流程优化、质量监测、能耗管理、设备故障预测、销量预测、供应链优化、智能化服务、个性化定制等典型应用场景,不仅帮助企业优化了现有业务,如指导产品设计、监控与优化生产过程、推动精准营销、优化供应链管理、快速服务响应等,还促进了企业的转型升级,为产品、服务和商业模式的创新提供了有力支撑。
以上应用场景与突出价值为制造企业推动工业大数据提供了参考,并加快了其大数据探索的决心。但是,工业大数据能否落地,不在于技术的先进性,关键是企业能否找到与自身业务融合的应用场景。
然而,工业大数据应用具有非常强的个性化特征,不同企业基于不同的产品、制造工艺、数据基础、应用需求等,便会产生不同的应用方式和层次;同时,工业大数据的门槛较高,应用场景的效果产出需要企业具备一定的行业知识和数据应用能力与经验,且当前缺少统一、规范化的工具、标准和流程来支撑。因此,如何找到合适的场景和融合方式成为了众多制造企业推进工业大数据应用的首要难题。
在笔者看来,企业应用工业大数据的核心目标是创造价值,合适的应用场景一定是能为企业持续带来价值的,是拥有比较理想的投入产出比的。
基于此,企业在明确自身核心需求与痛点的基础上,可以从以下三个方面着手确定应用场景的选择是否合适。
◉ 业务价值较高。
数据驱动价值已成为企业共识,但并非所有的数据,都值得去深入开展分析挖掘,如一些变化维度低的“死”数据,根本没有分析价值;也不应为了一些微不足道的性能指标提升而投入大量资源去应用大数据技术。
建议企业可以从那些采样频率高、变化维度多的数据或者高价值、关键的设备/工序等着手,探究业务应用场景,并基于已有的历史数据资产,来估算潜在价值高低。
针对这一突出性问题,该工厂详细评估了刀具的损耗率和因刀具问题导致的产品不良率影响,有效估算了智能刀具管理场景应用大数据分析的潜在价值。最后,通过与产品技术服务商、高校研究团队的有效协作,构建了刀具状态在线监测、使用寿命评估等分析应用,提高了产品良率和刀具使用效率与价值。因此,具备较高的业务应用价值,是大数据技术应用的首要条件。
◉ 复制性强。
如果项目选定的大数据应用场景,只适用于单个或少数的产品,不具备较强的复制性或推广空间,很可能会因为项目边界成本高难以持续。建议企业选择复制性强的应用场景和应用模式。如上例中,无论是100台还是更多的机加设备,基于统一的技术架构和模型,采集各设备运行的数据,就能实现同样的场景扩展应用,大大降低项目成本。
◉ 数据可支撑。
由于大数据分析应用类项目,在早期对业务场景、影响因素的认识很难完备,现有数据资产可否支撑、实际分析结论与假设是否相符等均有待随着实施深化来验证。这些不确定性需要在后面的阶段,通过强化数据资产(如增加数据采集点、加大现有数据采集频率/维度等),多次迭代数据模型,并从多个维度去论证建模思路合理性,才有可能形成相对完备的问题理解与目标达成。
八步实施法助推工业大数据项目有序推进
企业在确定了工业大数据应用主要方向的前提下,具体的实施可参考如下步骤,该步骤基于CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行业数据挖掘应用标准流程)并补充了新的内涵。
1、业务理解
从业务角度理解项目目标,并将其转化为一个可解且可达成的数据分析问题,包括厘清关键因素,确定分析问题的范围和目标等。工业数据分析需要将专业领域的知识和数据模型有机融合,才能得到有价值的分析结果。而数据分析师通常对工业过程缺乏深入了解,业务人员则对数据分析的技术方法与思路了解不深。因此,业务理解的过程需要企业的业务专家和数据分析师通力合作。
2、数据理解与数据的可采集性分析
在理解业务的基础上,准确建立数据和业务间的关联关系,包括需要哪些数据、这些数据是从哪儿来,是生产设备、智能产品、复杂装备等产生的工业物联网数据,还是来自ERP、MES、SCM等的信息化数据,还是设备在运行过程中所处的环境数据等?是否需要线上、线下相结合的数据等。同时,确定制造企业当前的历史数据存量和可获取的数据增量,即在不增加采集点、采集频率、采集维度等的情况下,可以采集到的数据有哪些。
这一阶段需要数据分析师根据经验对数据颗粒度、数据质与量和数据间的关联关系等进行初步判断论证,确定当前的数据是否满足业务场景的要求。
3、数据准备
对所需的数据进行数据加工与治理,包括原始数据抽取、多数据源融合、数据清洗与质量提升等。一般需要企业成立专项数据治理组织,通过数据集成和定期运维等方式保证业务系统和线下数据准确与完整,包括剔除掉那些假的、错的、偏差大的、缺失的、不合理的、暂时性的脏数据等。数据准备与预处理环节不仅由数据分析师组成,还包括懂行业know-how的专家,对于一些不合理、不符合物理规律的数据,如燃气燃煤加热设备在极短时间内出现温度数据的急剧变化是不合理的,数据分析师很难发现,需要结合行业专家的经验认知判断。
4、特征提取
特征提取即借助统计学方法对数据进行转换、映射、分析,找到数据中的规律,并进行特征提取,即最大限度地从原始数据中提取特征以供算法和模型使用。这一步非常重要,只有对数据特征有了清晰的认识,企业才能更好地完成拓扑数据结构的搭建,开展数据建模。部分企业由于缺乏对数据的深入探索和理解,一有了原始数据就直接着手构建大数据模型,结果失败率非常高。
值得注意的是,针对一些特定领域问题 ,特征提取应充分利用行业已有的专业知识,不要将时间过多浪费在该领域早已熟知的行业规律发现上。
5、小数据验证
如果说在实施工业大数据项目前,是通过历史数据估算场景价值点,来初步判断应用场景是否合适。那么,到了具体的应用落地实施阶段,则需要依赖现有的预处理数据,对业务场景的价值进行更具体的计算,得出一个可量化的值,从而来验证数据分析的价值。
6、数据建模
基于业务知识和合适的算法及建模工具,输出数据分析模型。当前,机器学习、数据挖掘等分析理论、技术发展较成熟,也有很多明确的指导原则和丰富的算法和建模工具,可以帮助企业优选出合适的算法模型。因此,真正的数据建模过程在项目实施过程中花费的时间并不是最多。但值得一提的是,算法不是越复杂越先进越好,应用可解释、较简单的算法去解决业务实际问题更值得被关注。
7、模型的验证和评估
模型的验证是对分析模型从数据和技术的角度进行充分检验评估,确认数据分析的结果或模型是否满足具体工业应用场景的使用需求;任何模型都有一定的适用前提,模型的评估即是从业务的角度审视模型在什么范围内有效,有效程度是什么,在什么情形下不适用,需要分场景去验证和评估。
8、模型上线与迭代
模型的上线是将模型以便于企业使用的方式和要求重新固化,形成便于模型服务调用的形式,如可重复使用的数据挖掘程序、模型服务程序等。同时,模型在运行过程中,还应对模型进行持续的修正、迭代和完善。
如前文所述,与一般的信息化项目不同,工业大数据项目的实施是一个循环迭代、螺旋上升的过程。因此,以上8个步骤会存在多处循环和反复迭代,如在建模阶段,假如现有的特征无法满足模型的开发或者存在过拟合的问题,则需要返回到数据准备,甚至会出现业务理解的修正调整。另外,即使企业基于现有数据完成模型的上线后,还需进一步评估,是否需要增加现有数据量,是增加数据的采集频率,还是增加额外数据采集点,进一步迭代模型,如此反复,从而不断优化模型,得到更可靠的分析结果。
来源网络侵删
本文地址:http://www.msnbrh.com/news/baike/210.html