(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111623600.X
(22)申请日 2021.12.28
(71)申请人 安徽省安泰科技股份有限公司
地址 230000 安徽省合肥市高新区天达路
71号华亿科学园A1幢8楼
(72)发明人 张萍 朱卫坪 杨华 陈晓峰
马培勇 李鹏程
(74)专利代理 机构 合肥中谷知识产权代理事务
所(普通合伙) 34146
专利代理师 洪玲
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于聚类的流程工业能耗状态评估方
法
(57)摘要
本发明涉及一种基于聚类的流程工业能耗
状态评估 方法, 获取流程工业的全局生产原始数
据和与之对应的总能耗数据, 并生成样本数据
集; 根据聚类算法对流程工业的样 本数据集进行
无监督分类, 确定流程工业生产稳定工况状态的
数量; 根据流程工业生产稳定工况状态的数量将
样本数据集 分为若干个簇, 并对每个簇内的样本
数据相对应的能耗进行均值运算; 将能耗均值最
小的簇中样 本数据作为流程工业全局最优能耗;
本发明采用聚类方法对全局数据进行分析, 不需
要对工艺本身进行建模, 大大降低能耗分析的科
研人员投入量。
权利要求书2页 说明书5页 附图1页
CN 114565209 A
2022.05.31
CN 114565209 A
1.一种基于聚类的流 程工业能耗状态评估方法,其特 征在于: 包括以下步骤,
S1、 采集流程工业的生产状态数据和与之对应的能耗数据, 进行预处理后形成样本数
据集;
S2、 根据聚类算法将流 程工业的样本数据集分为若干个簇;
S3、 将每个簇内的生产状态数据对应的能耗数据进行均值运算, 将能耗均值最小的簇
中的生产状态数据作为 流程工业能耗状态的最优解。
2.根据权利要求1所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述S1中流程工业的生产状态数据包括温度、 产量、 压力、 转速中任意一种或两种以上的组
合, 所述能耗数据包括电、 天然气、 蒸汽、 煤、 水中任意 一种或两种以上的组合。
3.根据权利要求2所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述S1中采集流程工业的生产状态数据和与之对应的能耗数据进行预处理后形成样本数据
集的步骤 包括;
S11、 通过异常数据检测算法对生产状态数据进行异常数据的清洗剔除;
S12、 通过插值算法对去除异常数据的生产状态数据做插值计算, 生成初始样本数据
集;
S13、 对初始样本数据集采用降维算法进行降维, 获得降维后的样本数据集。
4.根据权利要求3所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述异常数据检测算法采用独异森 林、 Z‑score准则、 准则、 Tukey箱型图法、 幂律分布法、 一分
类向量机中的任意 一种。
5.根据权利要求3所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述插值算法采用最近邻插值、 线性插值、 双线性插值、 双三次插值、 反距离插值、 样条插值、
克里金插值、 离 散平滑插值、 趋势面 光滑插值中的任意 一种。
6.根据权利要求3所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述降维算法采用PCA、 核PCA、 LLE、 拉普拉斯特征映射、 MDS、 ISOMAP、 多层自动编码、 t ‑SNE中
的任意一种。
7.根据权利要求3所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述S2中采用的聚类算法为K ‑means聚类算法, 通过聚类算法对流程工业的样本数据集进行
分簇, 包括以下步骤;
S21、 根据聚类算法计算降维样本数据集的最佳聚类中心数量Kop, 确定最佳聚类簇数;
S22、 按照最佳聚类簇数划分降维样本数据集。
8.根据权利要求7所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述S21中根据聚类算法计算降维样本数据集的最佳聚类中心数量Kop, 包括以下步骤;
S211、 确定聚类中心数量取值范围[Kmin,Kmax], 其中, Kmin=2,
n是降维样
本集的样本数量;
S212、 对[Kmin,Kmax]内的每个正整数K设定为K ‑means的聚类中心数量, 并对每个K进行
降维样本集的K ‑means聚类 计算得到聚类结果;
S213、 针对聚类结果计算聚类有效性指标;
S214、 从聚类有效性指标中获取最小指标值对应的k 值, 设为最佳聚类中心数量Kop。权 利 要 求 书 1/2 页
2
CN 114565209 A
29.根据权利要求8所述的一种基于聚类的流程工业 能耗状态评估方法,其特征在于: 所
述S22中按照最佳聚类簇数划分降维样本数据集, 包括以下步骤;
S221、 在降维样本数据集中, 随机 选择Kop个样本作为初始聚类中心;
S222、 预设定聚类误差上限, 并对降维样本数据集进行聚类, 直至聚类中心迭代误差小
于等于误差上限, 则聚类完成;
S223、 根据初始聚类中心, 计算降维样本集所有样本 两两之间的聚类簇关系, 记为C1。
S224、 重复S2 21‑S223步骤M次, 得到 M个聚类簇关系, 记为{Ci}(i=1,M)。
S225、 对降维样本集的每个样本, 根据{Ci}(i=1,M)进行投票, 加入到投票最多的样本
所在的簇, 由此 得到最终聚类结果Cop。
10.根据权利要求9所述的一种基于聚类的流程工业能耗状态评估方法,其特征在于:
所述步骤S3中将每个簇内的生产状态数据对应的能耗数据进行均值运算的步骤包括根据
聚类结果Cop将降维样本数据集分为Kop个簇, 并将每 个簇分别计算能耗均值。权 利 要 求 书 2/2 页
3
CN 114565209 A
3
专利 一种基于聚类的流程工业能耗状态评估方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:41:36上传分享