WorkshopLiveData 数据中心_车间现场数据

车间现场数据

生产企业的主要工作概括为做好三件事情,即:生产什么产品、生产多少、如何生产。生产什么和生产多少产品是根据市场的需求,可能获得的资源和原材料,以及企业的生产条件和环境所决定的,这是企业计划部门的任务。如何安全、高产、优质和低耗地完成企业下达的生产计划,这是生产执行者的任务。企业的最终产品是由各种设备和相关的控制系统通过人的操作而实现的。显然,企业大体可以分为三个层次,计划层、执行层和控制层。

首先,企业的生产装置及辅助设施总是沿着物流分布的,特别是那些大型企业,分散的程度更大。将所有历史上形成的信息孤岛在物理上连通起来,在此基础上,进一步建立存放生产实时数据(一种非结构化数据)的实时数据库,及存放各种管理信息(结构化数据)的关系数据库。各种与企业生产有关的信息就可以组织和存放在数据库中。这为企业车间奠定了信息基础。数据库系统虽然提供了强大的数据储存和查询等手段,但不能对数据进行深入的分析和处理。

从信息学的观点看,车间数据是一种原始的、未经解释的信号或符号。数据只有进行一定的分析,作出解释,并赋予一定的意义才能成为信息。信息经过综合后,形成的观点或在一定范围内适用的理论就是知识。只有信息和知识才是企业各个部门分析问题、制订计划和决定行动的依据。实际上,企业所制订的每一个计划、下达的每一条生产调度指令以及所采取的每一个行动都是一系列决策过程。一个完善的决策过程可分为五步:测量、分析、预报、决定和实施。测量就是获取生产数据,而分析、预报和决定是分析和处理数据。

综上所述,建立车间数据分析应从两方面着手,首先,将分散的企业生产数据集中起来,组织和储存在数据库中,为企业搭建一个信息平台。第二,对数据进行分析和处理,从中提取信息和知识,开发各种应用,为企业生产的决策和优化服务。

车间的数据挖掘是包含多个处理步骤的知识发现过程,包括数据清洗、数据集成、数据转换、数据挖掘、模式评估和知识表达。通常将数据挖掘系统分为三部分:数据予处理、数据挖掘和建模、结果的解释和评价。数据挖掘是一门新兴的交叉学科,汇集了数理统计、机器学习、模式识别、人工智能和数据库等学科的内容。

在决策的分析阶段,建议采用数据挖掘技术(Data Mining)。数据挖掘虽然源于数理统计,但是它可以处理规模大的数据集,从大量的生产实时数据中寻找未被发现的模式(Pattern)和关联(association),利用可视化技术将数据集图形化,可以大大改善模式识别过程。如果将实时数据中隐含的变量之间关系搞清楚,发现生产规律,提前预报可能发生的事故,就将为企业带来很大的效益。

车间数据挖掘系统可以从过程数据中发现特征模式(Characterisc Pattern),用于以下三个方面:一、发现生产中的问题,该系统可以鉴别生产中存在的问题以及造成问题的原因;二、生产过程的优化,通过对影响生产的主要因素鉴别和定量分析,估计最佳的操作点;三、装置试车,通过数据挖掘得到的结果,帮助技术人更好地理解生产过程。

车间数据挖掘是从庞大的数据集或数据库中提炼有用信息的交叉学科。为了让计算机自动或半自动地从数据中提取信息,学习知识,首先要为机器提供足够的数据进行训练,数据集又被称为训练集。

车间生产常常是机理复杂的物理和化学过程,在实际生产中,有时难以用已经掌握的理论分析生产中遇到的问题,数理统计是唯一的数据分析方法。数理统计需要从研究的对象中提取有代表性的数据,称为样本,通过对由样本点构成的样本集的分析来推断总体(对象)的特性。数理统计可以分为描述性统计和分析性统计,描述性统计学重点研究数据的收集和整理,对数据进行简单的直观描述。分析性统计学研究对数据的分析,并对母体进行估计和推断。例如,当生产质量碰到问题,而影响的因素较多时,常常用方差分析来鉴别数据的波动中哪些由随机因素引起的,哪些由于生产条件变化引起的,并进一步分析哪些是主要因素。数理统计的回归分析则可以建立变量之间的代数表达式,由此可以定量地研究变量之间的关系,并预报未来,是生产技术人员常用的一种统计建模方法。数理统计方法仍是目前普遍应用的有效的数据分析方法,也是数据挖掘的重要方法。但是,数理统计的应用有其局限性,当生产过程所涉及的因素多,变量为非高斯分布,数据中存在高噪声,变量之间存在非线性和强关联性时,数理统计方法常常难以处理,不能挖掘出有价值的规律和知识,不能解决生产中深层次的问题。

在生产中,工程技术人员常常按照某一事先确定的标准鉴别生产所处的不同状态,例如,是否正常、是否优化等,并进一步找出影响生产的原因,寻求解决方案,使生产调整到所要求的状态。模式识别技术就是研究用计算机模拟人类识别各种事物能力的学科,对个别事物通过观测所得到的信息称为“模式”(Pattern),根据某属性可将模式分成若干类,属于同一类别的模式的总体称作模式类,例如,以上提到的生产所处的各种状态可以定义为不同的模式类。模式识别系统由信息获取、预处理、特征提取、分类器设计和分类决策等部分组成。模式识别方法在数据挖掘技术中占有重要的地位。

现有的优化建模算法多以经典统计数学为依据。经典统计数学的理论推导多根据大数定理,以训练集数据无限多为前提。认为对已知数据拟合最佳的数学模型就必然是预报最可靠的数学模型。以下就数据挖掘中的几个基本问题,

生产中的每一个数据都是从某个侧面反映了事物的特征,称为数据特征或简称特征。但是它所携带的信息很少,可将其称为粗特征。数据挖掘的任务是从中提取有用的信息,模式识别方法首先从粗特征中提取精特征。

需要指出的是,这种特征提取过程并不改变样本点之间的原有关系,不损害原数据集所携带的信息。从几何意义上理解,这种转换只是把样本点向新的坐标系上投影,以便我们从不同的角度考察数据的分布规律。

在特征提取中,选取恰当的转换准则是优化算法的关键。可以用谋求变量的最大变异作为特征提取准则。还可以利用已知训练集中样本点的分类信息,使不同类型样本点之间的离差取最大,而同类样本点的离差取最小作为特征提取准则。如此等等,可以设计出不同的特征提取算法。

数据文件评估数据文件评估主要考察所提供的数据文件是否有足够的信息量,软件中用以下方法进行评价:超多面体模型评估、最近邻留一法判据和非线性回归判据。

数据结构分析是对所提供的数据结构进行分析,并对数据的结构特征作出判断,为以后的自变量筛选、以及采用什么样的建模策略和建模方法提供依据。本软件中采用以下方法:拓扑类型判别、近邻分析、近线性分析、时间序列分析、FISHER指数等。

样本筛选为了提高数据的可靠性和可分性,对原始数据样本中的离群点和噪声进行处理,以便剔除那些假数据。另一方面,还应尽可能将那些主要因素包含进来,如果在变量中忽视了某个主要因素,会严重影响数据挖掘的质量,因此要采取措施补充进去。本软件中所用的方法有:子空间分割、死区分割、离群点删除等。

相关分析相关分析是对变量之间(因变量与自变量、自变量与自变量)的关系进行分析,以便通过对这些关系的研究找到主要因素,及其存在的优化区。所用的分析方法有:单因子分析、双因子分析、多因子分析等。

自变量筛选所谓自变量筛选是指将对优化目标影响不大的因素剔除,以突出主要因素,并降低求解问题的维数,使应用更为简洁方便。所用的方法有:投票法、熵法等。

建模根据具体的应用情况不同,可以归纳为:分类判别问题、定量拟合和预报问题。因用户的需求不同,本软件最终提供用户不同方式的优化模型,用户利用这些模型指导生产和管理,达到优化生产或管理的目的。所提交的优化模型有以下方式:优化边界方程、优化具体建议、灵敏度分析图、优化剖面图、预报模块、MREC回归方程、MREC-ANN结构参数等。

车间数据分析是在对优化问题进行系统分析后,通过对收集的生产历史数据的挖掘,获得了生产优化结果后为用户定制的工况诊断和目标预测、优化操作指导、建模和模型维护。

工况诊断和目标预测工况是指与生产的目标相对应,有关生产参数所达到的状态,是衡量生产操作性能的一种指标。工况诊断就是根据用户提供的某些工艺参数的测量值来推断生产的工况,以便及时发现生产中问题,调整生产参数,使工况保持良好的状态。如果已经建立了预报模型,则输入某些工艺参数的测量值后,系统将自动预报目标值。在流程行业中,大部分产品或半成品的质量不能在线检测到,通常由人工采样分析获取,分析周期为数小时、一个班、或一天,甚至更长。在这种情况下,工况诊断和目标预测能提前预报生产中存在的问题,对于控制产品质量、优化生产操作、提高生产效益十分重要。

优化操作指导如果当前工况处于“差”的状态,如何调节工艺参数,使工况转到“优”的状态呢?当影响优化目标的因素有多个时,调节哪几个参数?调节多少?这是生产操作人员所面临的难题,目前大部分企业仅靠工人的经验,还没有一个行之有效的辅助决策工具。将为操作工人提供详细的操作指导,告诉你应该调整那几个参数,其中每个参数各调整到多少。本软件还提供各种图形,帮助操作人员分析工况,决定操作动作,观察操作后的效果。

建模和模型维护以上两项功能都是基于生产优化模型,只有好的模型才有好的效果。当生产装置运行的过程中,在设备或工艺流程方面会有所变动,在一般情况下我们为用户提供的定制系统都能适应小的变化,但是当这种变动较大时,优化模型的精度较差,这就会影响工况诊断和目标预测的准确率,会影响优化操作指导的效果。

数据挖掘特别强调人的参与,将人的经验和知识充分融入数据分析过程,因此有人将数据挖掘技术认为灰箱原理。将成百上千个数据投影在一幅两维的图形上,远比从若干张数据表格上获取的信息更多。

车间整体看板

维度:车间整体、产品、设备

指标:计划数、实际数、达成率、OEE、不良数、DPPM、温度、压力、速度

分析意义:

1、实时监控车间产品生产量达成情况、设备综合利用率、实时监控凌晨到当前时间不良数,能及时采取改善措施;

2、车间设备保养倒计时监控

解决生产装置的瓶颈制约。若干单元设备由于受多个因素的影响使产品质量、收率或能耗不稳定,但又找不到规律时,可以收集足够的历史数据(根据我们的经验,如果数据具有代表性,数据质量较好,两个月的生产数据就可以了),利用数据挖掘技术从中找出生产参数的调整方案,解决制约生产的瓶颈问题。

监控车间所生产的产品生产质量,及时监控每个产品的不良数,做到及时发现问题,及时纠正

参数监控车间设备的关键参数,如生产周期、温度、压力、焊锡时间

设备Downtime监控,设备宕机及时监控,及时知道各设备的状态

对生产装置进行实时工况监控。为了鉴别生产是否有异常情况,或生产是否离开优化区,根据生产历史数据建立模型,然后将模型下载到与生产现场连接的计算机,生产实时数据将在两维特征图上画出一组折线,一旦离开预定的区域,软件报警,操作人员根据报警信号进一步调用贡献图、载荷图等工具判别故障原因,根据这些工具提供的诊断信息,调整生产参数。

监控每条产线生产负荷情况,设备停机或待机都有颜色标记记录

新装置、新工艺的开工。一个新装置或新工艺总是要经过一段时间的摸索才能使生产正常或达到预定的设计指标,开工初期生产的波动较大,这时所收集的生产数据恰恰包含了较多的信息。利用数据挖掘对开工数据的分析,可以发

数据挖掘可用于工厂范围的辅助决策。数据挖掘软件可直接与企业实时数据库或关系数据库连接,从上、下游装置多个变量之间的复杂关系中探索规律,从生产调度或生产指挥人员的角度建立模型,设计画面,提高决策的科学性。当各个装置的生产数据已经采集到实时数据库的情况下,可以做到实时调度和指挥,提高时效性。利用模式识别的降维功能,可以将众多的生产变量经过数据处理后映射到一个低维空间中,他们只要监视一两个特征变量就可以掌握生产情况。

收发料全过程监控

数据挖掘还可以用来解决企业的各种难题,建立模型,优化调合,数据挖掘技术也可以有所作为。总之,只要有数据的地方,数据挖掘都有用武之地。