工业大数据的知识表达和利用

日期:2024-10-03 10:39

导读】2024年7月2日,由中国科学技术协会、广西壮族自治区人民政府主办,中国自动化学会承办第二十六届中国科协年会通用大模型未来演进路线——数据、算力、算法论坛在广西南宁召开。会议特别邀请中国自动化学会副理事长、青岛科技大学副校长、上海交通大学教授李少远,作了题为“工业大数据的知识表达和利用”的主旨报告。报告详细介绍了工业大数据、知识图谱与知识嵌入技术的深度融合与创新,指出了工业大数据、知识图谱与知识嵌入技术的协同发展将为工业4.0时代的企业构建起强大的认知基础设施,实现从数据到知识,再到智慧决策的无缝转化,开启一个高度自治、高效协同与可持续发展的智能制造新时代。

 

关于工业系统的应用,特别是流程工业,我国已在全球占据了重要地位。从现状来看,我国流程工业中的许多设备和软件并不落后,甚至在某些方面处于领先地位。然而,如何真正发挥这些设备和软件的效益,充分利用其优势,仍然存在诸多问题。一个主要问题是操作经验和人类知识的积累和利用。尽管我国购买了大量的先进过程控制(APC)软件,但许多工程师由于担心出错,往往不敢轻易调整和使用这些软件。这导致了软件的实际效益未能得到充分发挥。同时,某些厂家的运行情况非常良好,积累了丰富的经验。然而,这些宝贵的运行经验能否在行业内得到广泛分享,成为一个关键问题。如何有效地利用和推广这些先进的经验,对于提升整个行业的运营水平至关重要。

因此,我们需要深入研究并解决这些问题,确保先进设备和软件的最佳利用,促进经验共享,从而实现我国流程工业的持续发展和优化。


一、工业系统的数据与模型

催化裂化流程是一个复杂的工业生产过程,涉及物料流、能量流及其他多种流体的混合。这一过程不仅在工艺上复杂,且运行过程中产生的数据非常丰富,尤其是在短周期内。这样的复杂性和数据量为人工智能提供了实际数据进行学习和训练的理想场景。

在工业系统中,存在着大量的软件和不同的系统,从上层的企业资源规划(ERP)到中层的制造执行系统(MES),再到底层的过程控制系统(PCS)和制造控制系统(MCS)等。每个层级和系统基于不同的机理进行分工,并拥有各自不同的软件和数据权限,以及操作经验等。要有效利用人工智能技术,必须打破这些系统之间的壁垒,整合不同来源的数据和经验。

例如,按照分钟级别采集数据,可以获得非常丰富的数据信息,如图1所示。这些数据不仅反映了整个系统的运行是否处于优化的平衡点上,还能揭示出能耗是否最低,产品产出是否最优。通过分析这些数据,能够提炼出大量的操作经验,为优化生产流程提供重要的参考。

因此,催化裂化流程中的丰富数据和复杂性正是人工智能技术发挥作用的理想场景。通过人工智能的应用,可以更好地分析和优化这些数据,提升整个工业系统的运行效率和产出质量。

 

1 工业数据的来源多样

在流程工业领域,国内外的情况存在一些区别。虽然中国的流程工业在设备和软件上看起来都很先进,但在操作和运行过程中,尤其是在优化控制和人工智能技术的应用上,还远未得到充分的释放和利用。

如在炼油行业,国外与国内有所不同。我国的炼油原材料成分非常丰富且变化多样,有中东原油、国产原油,还有其他国家的原油,成分变化非常大。然而,设备是固定的,不能随时进行调整。因此,在这种情况下,优化控制和人工智能技术的作用显得尤为重要。我国对优化控制和人工智能技术的需求更加迫切,但目前许多企业只追求安全生产,效率方面却大打折扣。提高流程工业的效率对于我国来说至关重要。

在流程工业的运行过程中,数据、操作经验和人类知识的积累非常丰富,但这些宝贵的信息并未得到充分利用。研究如何进行多信息融合,是解决这一问题的关键,即如何将数据、语音和图像等多种信息融合起来,这一概念在工业系统中显得尤为必要。

在这一背景下,如何将数据和知识融合起来,统一进行建模和优化,是流程工业领域亟需解决的问题。这不仅涉及知识的载体和融合,还包括自动化操作等各个方面的要求。通过将多元信息融合并进行优化控制,可以提升工业系统的整体效率和运行质量。这正是工业控制领域的研究重点和方向。


二、隐式知识的发现和利用

在工业系统中,隐性知识是指操作人员对设备及其运行机制的认知和经验,如图2所示。这些知识虽然表面上不显眼,但在实际运行中往往起到关键作用。例如,许多自动化领域的专家在设计控制器时,通常基于一个模型,而这个模型包含了许多在控制器运行过程中未被充分利用的知识,包括操作人员的经验。

 

2 隐式知识的发现和利用

首先,信息获取存在困难。相比过去,现在的信息获取手段有了显著改善。过去主要依赖传感器,而现在增加了图像、视频和语音等多种信息来源。然而,如何有效融合多元化的信息仍是一个技术难题。

其次,隐性知识的存储较为复杂。这些经验往往以简短的语言表达,如老工程师在紧急情况下的几句话。这些经验如何统一到系统控制器中并进行有效存储,是一个挑战。如何将操作人员的经验和知识系统化、标准化地存储起来,以便在系统控制中发挥作用,是我们需要解决的问题。

此外,知识和数据的共享也是一个重要课题。即使在同一个行业中,不同地点的相同装置由于加工原材料不同,操作数据和知识也会有所差异。如何实现数据和知识的共享是一个重要课题。虽然中国自动化学会和企业在对话中探讨了数据共享的可能性,但实际操作中面临诸多挑战。一种可行的解决方案是通过标杆学习和数据利用,使数据资源在不同情况下都能被有效利用,而不是局限于数据所有权的问题。

最后,隐性知识和多元信息的利用仍然不足。目前,隐性知识、操作经验和多元信息的融合和利用仍然不足。这种利用不足是推动我们努力改进的重要动力。通过更好地结合这些信息,我们可以显著提升工业系统的整体效率和控制水平。解决这些问题不仅需要技术上的突破,还需要政策和标准的支持,以实现数据和知识的有效获取、存储、共享和利用。这些方面的综合改进将大大增强工业系统的优化控制能力,提高生产效率和产品质量。

在工业系统中,如何将人的经验和知识,包括操作过程中的知识纳入系统是个较为重要的内容。主要包括三个方面:下层数据、人的经验和知识、机理模型。

所谓的知识图谱,是对传统模型的进一步扩展。传统模型仅关注系统的输入输出,而知识图谱则包括系统内部的操作变量、状态变化和输出因素。通过这种方式,可以全面描述系统的状态及其变化因素。

我们要构建一个立体化、全方位的知识图谱,其中包括操作经验、控制变量和操作变量。首先,通过知识图谱了解系统发生了什么变化,并判断是否需要产生控制作用。这一概念是对传统模型控制优化技术路线的扩展,需要不断丰富和发展。

我们的工作之一是探讨如何通过迁移学习等先进人工智能技术,应用于工业系统,以提出新的方法,如图3所示。这包括机理建模、装置结构和子系统之间的拓扑关系等新表述的探索。通过分析多维数据,发现系统变化的主要特征,从而构建知识图谱。通过实际运行数据,可以看到系统变化的输入因素,判断系统运行是否处于优化状态,是否存在安全隐患等。

 

3 相似系统知识辅助的迁移-增量学习建模

有了实时运行数据、操作经验、运行经验和装置运行结构特征等多方面的信息,我们可以构建一个完整的知识图谱,如图4所示。然而,这并不是我们的最终目的。传统控制器使用模型进行推理,而模型的关键作用在于推理。

 

4 从数据中发现模式,从模式中固化知识


三、融合关系知识的数据驱动建模和优化

第二个方面的工作是如何从知识图谱中进行进一步的演化和推理,以了解整个系统的状态是否满足要求。特别是对最终产品进行预测,判断其是否合格和最优。反过来,指导各个装置之间的操控,包括操控变量和操作条件的优化。这是对传统控制概念的进一步扩展,通过知识图谱实现更精准的控制和优化。

原有的控制系统主要作用于单个装置,例如调节温度至1200度,并在允许的误差范围内进行调整。然而,现在我们需要扩展这一概念,将其应用到整个生产线。通过利用知识图谱建立内部各种关系之间的推理关系,进行全局的推理,使得生产线能够持续优化,不断运行。无论内部条件如何变化,生产线都能在环保、优化的状态下运行,并提高产品的生产指标。根据不同的要求,调节相应的变量。

从学术角度来看,流程工业中存在大量的关系和知识,需要不断地加以利用。如何有效利用这些关系和知识?我们采用了多种新的方法。例如,在工业系统中按照递阶结构进行实时控制,从底层控制到中间的DCS,再到上方的RPU,最后到ERP,打通各个层次的不同定位。对于我国而言,生产结构难以改变,在这种情况下,如何将数据和知识更好地融合起来?

在控制系统中,数据的输入和输出之间存在因果关系,这与一般通用大模型仅从大数据中发现规律和特征有所不同,如图5所示。从这个角度来看,我们建立了许多拓扑结构,探讨各个子系统之间的相互关联和影响,实现全局系统的动态变化特征的捕捉和递进。

 

5 工业生产过程


四、融合公式化机理知识的数据驱动建模和优化

我们采用了深度神经网络、图神经网络等先进技术和人工智能方法,从而进一步推动工业生产和应用场景的发展,如图6所示。这些技术帮助我们统一构建知识图谱和知识大模型,解决优化问题,确定每个装置的操作条件。通过实际案例,如炼油过程中的操作经验,根据生产运行的实际情况进行推理,最终实现整个系统的运行优化。

 

6 融合多视角先验知识图的质量预测

在具体实施过程中,我们主要使用图神经网络和机器学习等先进算法,如图7所示。整个系统结构从底层的PID控制、中间的MPC(模型预测控制)到上层的RTO(实时优化)和ERP(企业资源计划)都是逐层工作的。在这一过程中,我们嵌入了大量图神经网络的算法,最终以MPC计算控制为框架,包括模型、滚动优化算法和法规校正等多个关系都纳入到MPC的算法框架中进行实施。

 

7 以图结构为基础的知识融合建模

实际运行时,数据不断产生,信息也在不断积累。我们需要根据实时数据来融合知识图谱。知识图谱通常是离线事先制作的,人的操作经验事先插入到知识图谱中。但在实际运行中,我们需要利用实时数据进行系统实时的推理。实际装置总是存在许多约束条件,优化的主要瓶颈正是这些约束。如果没有约束,系统优化会变得相当容易。通过机器学习和人工智能的各种算法,可以将约束转化为非约束问题进行求解,最终利用实时数据和机理系统运行的知识进行融合,形成统一的算法,如图8所示。

 

8 基于BNN结构学习的知识融合的混合建模策略

流程工业非常复杂,包括冶金、电力等多个领域。这些领域有共性,即所谓的通用大模型。然而,结合具体行业又有具体的应用和设计。因此,我们需要进一步扩展技术策略,将新的技术统一纳入进来。流程工业和零散制造有时不能分开,例如炼油有时是一批一批的,其中涉及零散制造。建模和优化的矛盾与困难一直困扰着工业控制应用。现在,结合人工智能的许多技术和方法,特别是结合机理和知识,可以有效解决这些问题。


五、总结与展望

工业数据讲求对应性,即输入和输出之间的因果关系,这是有效的。因此,在工业系统中应用深度学习和深度神经网络时,需要考虑系统的横向关系。如果不加这个横向关系,学习出来的数据可能会偏离工作点,对工业系统无用。工业系统中的人工智能应用有许多特殊性和具体技术问题需要研究。通过数据到信息、信息到知识的转化,最终形成有用的知识是关键。技术只能反映当前这一时刻的系统内部关系。如何全方位了解并开好一条生产线,需要建立整体的知识图谱,并利用不同来源进一步形成实时控制作用。

在工业系统中应用人工智能的技术涉及多方面问题。进一步利用好人工智能的各种新方法非常重要。例如,MPC(模型预测控制)在工业系统应用时有许多问题需要解决。虽然深度神经网络的规模较小,无法与通用大模型相比,但其概念和技术路线确实能够推动传统工业控制技术的发展。我们还需将人机协同、人类知识和操作经验很好地结合起来。这些新方法和技术的应用将对工业人工智能和人工智能技术提出新的挑战,并进一步推动其发展。

(本文根据作者所作报告速记整理而成)