公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111488557.0 (22)申请日 2021.12.07 (71)申请人 上海卫星 装备研究所 地址 200240 上海市闵行区华宁路251号 (72)发明人 赵文浩 邢香园 万峰 陈小弟  吴剑锋 陈伟男 王治 陈瑞启  (74)专利代理 机构 上海段和段律师事务所 31334 代理人 李源 (51)Int.Cl. G06F 40/242(2020.01) G06F 40/216(2020.01) G06F 40/289(2020.01) G06N 20/00(2019.01) G06Q 10/04(2012.01)G06Q 10/06(2012.01) (54)发明名称 基于机器学习的卫星总装工艺风险预测方 法及装置 (57)摘要 本发明提供了一种基于机器学习的卫星总 装工艺风险预测方法及装置, 包括: 获取历史工 艺卡数据库中的工序信息, 形成以工序为单元的 工艺库; 经过数据预处理得到工艺文本语料库, 根据工艺文本语料库对历史工艺数据进行挖掘, 得到工艺文本特征向量; 遍历工艺库中的所有工 序, 构造文本特征矩阵; 训练出工艺风险等级计 算模型, 并存储至模型库中; 根据待执行工序的 描述文本以及风险计算模型, 得到待执行工序的 风险预测值。 本发明通过构建基于工序文本特征 的卫星总装工艺风险计算模型, 进行工艺风险预 测, 解决了当前卫星总装工艺风险识别工作量 大、 易错漏的问题, 且有利于保证风险预测的准 确性和实效性, 进 而提高生产质量和效率。 权利要求书3页 说明书8页 附图3页 CN 114298016 A 2022.04.08 CN 114298016 A 1.一种基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所述方法包括如下 步骤: 步骤S1: 查询历史工艺 卡数据库中的工序信息, 形成以工序为单 元的工艺库; 步骤S2: 通过数据预处理得到工艺文本语料库, 根据工艺文本语料库对历史工艺数据 进行挖掘, 得到 工艺文本特 征向量; 步骤S3: 遍历工艺库中的所有工序, 构造文本特 征矩阵; 步骤S4: 基于文本特 征矩阵, 训练出工艺 风险等级计算模型, 并存 储至模型库中; 步骤S5: 根据待执行工序的描述文本以及风险计算模型, 得到待执行工序的风险预测 值。 2.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S1中的历史工艺卡中包含工艺说明、 装配对象、 零部件、 工装夹具、 辅料和 工序风险 等级; 所述工序风险等级包括低风险、 中风险、 高风险和极高风险; 所述工艺库以工序为粒 度, 包含工序的文本内容和细化的工步、 子 工步的文本内容。 3.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S2中的数据预处 理步骤包括中文分词和去除停用词; 所述中文分词是通过自然语言分词工具并结合预设的词典将工序文本内容分解为单 独的词; 所述去除停用词是根据预设的停词库剔除所述工序文本内容中的停用词。 4.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S2中获取工艺文本语料库的方法包括: 步骤S2.1: 将所有工艺文本中的词进行词频统计并按词频大小排序, 生成词云图, 了解 历史工艺文本中词的分布; 步骤S2.2: 按照预设比例或数值保留频率较高的词, 得到 工艺文本语料库。 5.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S2中得到工艺文本特征向量的步骤包括: 获取数据预处理后工序文本中每个词的 TF‑IDF数值, 对于每道工序, 统计工序中每个词出现的次数, 并与反向文档 频率相乘, 得到 的值就是该词的TF ‑IDF数值, 具体表达式为: 其中, N为当前工艺库中工序的总数, ωdt为某道工序文本d中的词t的TF ‑IDF值, tfdt为 词t在工序d中出现的频率, nt为语料库中包 含词t的工序总数; 根据每个词的TF ‑IDF数值得到所述工序文本的文本特征向量, 文本特征向量的维度是 该工序的词数, 若 文档d中包 含k个词语, 则d的文本特 征向量为: 其中, 表示文档第i(i≤k)个词的TF ‑IDF值。 6.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S3中文本特征矩阵的行数是工艺库中所有工序的数量, 列数是工艺文本语料库的维 度, 特征矩阵的样式如下:权 利 要 求 书 1/3 页 2 CN 114298016 A 2其中, h为工艺库中所有工序的数量; m为工艺文本语料库的维度; αij(i≤h,j≤m)表示词典中第j个词tj在语料库第i道工序di中的TF ‑IDF值; 由公式(1)可知, 当di中不包 含tj时, 因而 所以αij的计算公式如下: 7.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S4中得到风险等级计算模型的步骤 包括: 步骤S4.1: 将工艺库中的工序根据预设比例随机划分为训练集和测试集, 以工序文本 特征矩阵对应工序行的元 素取值为自变量, 以工序的风险级别为因变量; 步骤S4.2: 使用多种机器学习模型进行训练, 分别得各种模型下的训练集和测试集的 预测精度; 步骤S4.3: 选取测试集精度较高的算法模型, 相似精度的算法根据算法的效率进一步 选择; 步骤S4.4: 确定算法种类后, 将该算法得到的计算模型存 储至模型库中。 8.根据权利要求1所述的基于机器学习的卫星总装工艺风险预测方法, 其特征在于, 所 述步骤S5中得到待执 行工序的风险预测值的步骤 包括: 步骤S5.1: 提取所述待执行工序的文本内容, 并根据工艺文本语料库对所述目标工序 进行文本挖掘, 得到目标工序的文本特 征向量; 步骤S5.2: 将工序的文本特 征向量的维度扩展至与工艺文本语料库的维度相等; 步骤S5.3: 将所述工序的文本特征向量带入模型库中存储的风 险计算模型进行计算, 得到所述待执 行工序的风险预测值。 9.一种基于机器学习的卫星总装工艺风险预测装置, 其特征在于, 所述装置应用如权 利要求1‑8任一项所述的基于机器学习的卫星总装工艺风险预测方法, 所述装置包括第一 处理模块M1、 第二处 理模块M2、 第三处 理模块M3、 第四处 理模块M4和第五处 理模块M5; 第一处理模块M1: 用于查询历史工艺卡数据库中的工序信息, 形成以工序为单元的工 艺库; 第二处理模块M2: 用于通过数据预处理得到工艺文本语料库, 根据工艺文本语料库对 历史工艺数据进行挖掘, 得到 工艺文本特 征向量; 第三处理模块M3: 用于遍历工艺库中的所有工序, 构造文本特 征矩阵; 第四处理模块M4: 用于基于文本特征矩阵, 训练出工艺风险等级计算模型, 并存储至模 型库中; 第五处理模块M5: 用于根据待执行工序的描述文本以及风险计算模型, 得到待执行工权 利 要 求 书 2/3 页 3 CN 114298016 A 3

.PDF文档 专利 基于机器学习的卫星总装工艺风险预测方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于机器学习的卫星总装工艺风险预测方法及装置 第 1 页 专利 基于机器学习的卫星总装工艺风险预测方法及装置 第 2 页 专利 基于机器学习的卫星总装工艺风险预测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:07:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。