公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111639565.0 (22)申请日 2021.12.2 9 (71)申请人 福建亿力电力科技有限责任公司 地址 350000 福建省福州市 鼓楼区铜盘路 软件大道89号软件园B区14 号 (72)发明人 郭素芹 倪少峰 陈坤 梁海涛  林瑞安 吴高杰 罗康润  (74)专利代理 机构 厦门市首创君 合专利事务所 有限公司 3 5204 代理人 连耀忠 (51)Int.Cl. G06V 30/40(2022.01) G06V 30/19(2022.01) G06K 9/62(2022.01) G06F 16/35(2019.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/00(2012.01) (54)发明名称 一种基于双模型融合的供应商资质审核方 法和审核 装置 (57)摘要 本发明提出一种基于双模型融合的供应商 资质审核方法, 包括: 建立用于目标检测算法 Light‑BidDet的数据集D1, 以及用于中英文字符 识别算法E2E‑BidOcr的数据集D2, 并将两个 数据 集按照5:1的比例划分成训练集和验证集; 对 Light‑BidDet模型和E2E ‑BidOcr模型, 在数据集 D1和数据集D2的训练集上进行有 监督训练, 并在 验证集上进行验证, 得到训练好的Light ‑BidDet 模型和E2 E‑BidOcr模型; 用训练好的目标检测算 法Light‑BidDet模型对标书文件指定区域的定 位检测, 再采用训练好的端到端中英文字符识别 算法E2E‑BidOcr对标书文件中所需识别区域的 字符进行识别, 得到识别结果; 建立模板匹配规 则和资质能力核实算法, 对 得到的识别结果进行 供应商资质能力审核判断; 本发 明方法能够有效 克服现有的人工审核方式的不足和缺陷。 权利要求书2页 说明书6页 附图3页 CN 114299520 A 2022.04.08 CN 114299520 A 1.一种基于双模型融合的供应商资质审核方法, 其特 征在于, 包括: 建立用于目标检测算法Light ‑BidDet的数据集D1, 以及用于中英文字符识别算法E2E ‑ BidOcr的数据集D2, 并将两个数据集按照5:1的比例划分成训练集和验证集; 对Light‑BidDet模型和E2E ‑BidOcr模型, 在数据集D1和数据集D2的训练集上进行有监 督训练, 并在验证集上进行验证, 得到训练好的L ight‑BidDet模型和E2E ‑BidOcr模型; 用训练好的目标检测算法Li ght‑BidDet模型对标书文件指定区域的定位检测, 再采用 训练好的端到端中英文字符识别算法E2E ‑BidOcr对标书文件中所需识别区域的字符进行 识别, 得到识别结果; 建立模板匹配规则和资质能力核实算法, 对得到的识别结果进行供应商资质能力审核 判断。 2.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法, 其特征在 于, 所述Light ‑BidDet模型包括: 用于特征提取的骨干网络Mobile ‑ViT, 双向融合的特征信 息融合网络BiFPN, 以及输出类别与检测框的检测头 Head; 所述骨干网络 Mobile‑ViT包括卷积块、 Mobi leNet模块、 Mobi leViT模块; 所述双向融合的特征信息融合网络BiFPN为: 在特征金字塔网络增加上下文信息融合 及跨层连接路径; 所述输出类别与检测框的检测头 Head包括类别预测分支和检测框回归分支。 3.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法, 其特征在 于, 所述E2E‑BidOcr模型包括卷积层、 循环层和转录层; 卷积层通过构建卷积神经网络对目标检测算法Light ‑BidDet模型得到的检测结果图 像进行特征提取, 得到一系列卷积特 征图并转换成特 征序列; 循环层利用双向的长短期记忆人工神经网络对特征序列进行预测, 对序列中的每个特 征向量进行 学习, 并输出 预测字符标签的分布; 转录层用于把循环层输出的预测字符标签的分布进一 步转换成最终的字符串输出。 4.根据权利要求1所述的一种基于基于双模型融合的供应商资质审核方法, 其特征在 于, 对Light ‑BidDet模型和E2E ‑BidOcr模型, 在数据集D1和数据集D2的训练集上进行有监 督训练, 并在验证集上进行验证, 其中在验证集上进行验证具体为: Light‑BidDet利用IoU=0.5时的平均精确度AP50作为验证指标, 当在数据集D1的验证 集上AP50≥90%时, L ight‑BidDet训练完成的模型记为 合格; E2E‑BidOcr采用文字行级别准确率作为评价指标, 当在数据集D2的验证集上Accuracy ≥90%时, E2E ‑BidOcr训练完成的模型记为 合格。 5.根据权利要求1所述的一种基于双模型融合的供应商资质审核方法, 其特征在于, 建 立模板匹配规则和资质能力核实算法, 对得到的识别结果进行供应商资质能力审核判断, 具体为: 建立标书模板匹配库; 利用ERNIE ‑Gram模型构建文本语义匹配任务, 所述ERNIE ‑Gram模型利用模糊匹配规则 判断待检测文本与标书 文本匹配库中的文本进行相似度检测; 统计语义相似文本所占比例, 并进一步根据 所占比例的值对供应商资质能力的核实结权 利 要 求 书 1/2 页 2 CN 114299520 A 2果进行判断。 6.根据权利要求5所述的一种基于双模型融合的供应商资质审核方法, 其特征在于, 所 述进一步根据所占比例的值对供应商资质能力的核实结果进行判断, 具体为: 当所占比例≥0.9时认定当前 所判断的供应商符合资质要求; 当0.8≤所占比例<0.9时认定当前所判断的供应商具备候补资格, 需进一步完善和递 交标书文件中的相关材 料; 当所占比例<0.8时认定当前 所判断的供应商不符合资质要求。 7.一种基于双模型融合的供应商资质审核装置, 其特 征在于, 包括: 数据集建立模块: 建立用于目标检测算法Light ‑BidDet的数据集D1, 以及用于中英文 字符识别 算法E2E‑BidOcr的数据集D2, 并将两个数据集按照5:1的比例划分成训练集和 验 证集; 模型训练模块: 对Light ‑BidDet模型和E2E ‑BidOcr模型, 在数据集D1和数据集D2的训 练集上进行有监督训练, 并在验证集上进行验证, 得到训练好的Light ‑BidDet模型和E2E ‑ BidOcr模型; 模型运算模块: 用训练好的目标检测算法Li ght‑BidDet模型对标书文件指定区域的定 位检测, 再采用训练好的端到端中英文字 符识别算法E2E ‑BidOcr对 标书文件中所需识别区 域的字符进行识别, 得到识别结果; 资质能力判断模块: 建立模板匹配规则和资质能力核实算法, 对得到的识别结果进行 供应商资质能力审核判断。 8.根据权利要求7所述的一种基于双模型融合的供应商资质审核装置, 其特征在于, 还 包括: 自动输入及预处理模块, 用于调取投标系统中已经上传的标书文件, 并将标书文件的 格式转换与图片切分, 再进行图片灰度化处 理与大小尺寸调整操作; 数据库模块, 用于存 储标书模板匹配库以及最终的资质能力审核结果; 结果显示与交互模块, 用于输出资质能力判断模块的最终结果, 同时调取历史数据和 中间算法识别的过程数据, 实现人工 输入标书 文件。权 利 要 求 书 2/2 页 3 CN 114299520 A 3

.PDF文档 专利 一种基于双模型融合的供应商资质审核方法和审核装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于双模型融合的供应商资质审核方法和审核装置 第 1 页 专利 一种基于双模型融合的供应商资质审核方法和审核装置 第 2 页 专利 一种基于双模型融合的供应商资质审核方法和审核装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:40:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。