公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111446909.6 (22)申请日 2021.11.30 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 徐军 魏承东 徐建明  (74)专利代理 机构 北京博浩百 睿知识产权代理 有限责任公司 1 1134 代理人 宫传芝 (51)Int.Cl. G06Q 40/00(2012.01) G06Q 10/04(2012.01) G06N 20/00(2019.01) (54)发明名称 估值表处理方法、 装置、 电子设备及计算机 可读存储介质 (57)摘要 本公开提供了一种估值表处理方法、 装置、 电子设备及计算机可读存储介质, 涉及人工智能 领域, 尤其涉及大数据领域。 具体实现方案为: 获 取待解析的估值表; 对所述估值表进行特征提 取, 得到估值表特征; 基于 所述估值表特征, 预测 所述估值表所对应的目标托管行; 基于托管行与 估值表解析模板之间的对应关系, 确定与所述目 标托管行对应的目标估值表解析模板; 基于所述 目标估值表 解析模板对所述估值表进行解析, 得 到估值表解析 结果。 权利要求书3页 说明书11页 附图4页 CN 114187081 A 2022.03.15 CN 114187081 A 1.一种估值表处 理方法, 包括: 获取待解析的估值表; 对所述估值表进行 特征提取, 得到估值表特 征; 基于所述估值表特 征, 预测所述估值表所对应的目标托管 行; 基于托管行与估值表解析模板之间的对应关系, 确定与 所述目标托管行对应的目标估 值表解析模板, 其中, 所述 托管行与估值表解析模板之间的对应关系包括多对一的关系; 基于所述目标估值表解析模板对所述估值表进行解析, 得到估值表解析 结果。 2.根据权利要求1所述的方法, 其中, 所述基于所述估值表特征, 预测所述估值表所对 应的目标托管 行包括: 将所述估值表特征输入预测模型中, 得到所述预测模型输出的与所述估值表所对应的 目标托管行, 其中, 所述预测模型采用多组样本数据训练得到, 所述多组样本数据包括: 样 本估值表特 征, 与该样本估值表特 征对应的托管 行。 3.根据权利要求1所述的方法, 其中, 所述对所述估值表进行特征提取, 得到估值表特 征, 包括: 对所述估值表 的主标题进行特征提取, 得到主标题特征, 以及对所述估值表的副标题 进行特征提取, 得到副标题特 征; 对所述估值表 的主标题的文本内容进行特征提取, 得到主标题文本特征, 以及对所述 估值表的副标题的文本内容进行 特征提取, 得到副标题文本特 征; 其中, 所述估值表特征包括: 所述主标题特征, 所述副标题特征, 所述主标题文本特征 和所述副标题文本特 征。 4.根据权利要求1所述的方法, 其中, 在所述基于所述目标估值表解析模板对所述估值 表进行解析, 得到估值表解析 结果之后, 还 包括: 对所述估值表解析 结果进行 校验; 在检验通过的情况 下, 将所述估值表解析 结果转换为所述估值表对应的估值数据。 5.根据权利要求1至4中任一项所述的方法, 其中, 所述方法还 包括: 按照预定周期对托管 行与估值表解析模板之间的所述对应关系进行 更新。 6.一种估值表处 理方法, 包括: 获取多组估值表数据, 其中, 所述多组估值表数据包括: 估值表, 与该估值表对应的托 管行; 分别提取 所述多组估值表数据的估值表特 征; 基于所述多组估值表数据的估值表特征进行机器训练, 得到预测模型, 其中, 所述预测 模型用于对待解析 的估值表进行预测, 得到目标托管行, 所述 目标托管行用于基于托管行 与估值表解析模板之 间的对应关系, 确定对应的估值表解析模板, 其中, 所述托管行与估值 表解析模板之间的对应关系包括多对一的关系。 7.根据权利要求6所述的方法, 其中, 所述估值表特征包括: 所述估值表的主标题对应 的主标题特征, 所述估值表的副标题对应的副标题特征, 所述估值表的主标题文本对应的 主标题文本特 征和所述估值表的副标题文本对应的副标题文本特 征。 8.一种估值表处 理装置, 包括: 第一获取模块, 用于获取待解析的估值表;权 利 要 求 书 1/3 页 2 CN 114187081 A 2第一提取模块, 用于对所述估值表进行 特征提取, 得到估值表特 征; 预测模块, 用于基于所述估值表特 征, 预测所述估值表所对应的目标托管 行; 确定模块, 用于基于托管行与估值表解析模板之间的对应关系, 确定与所述目标托管 行对应的目标估值表解析模板, 其中, 所述托管行与估值表解析模板之间的对应关系包括 多对一的关系; 解析模块, 用于基于所述目标估值表解析模板对所述估值表进行解析, 得到估值表解 析结果。 9.根据权利要求8所述的装置, 其中, 所述预测模块包括: 处理单元, 用于将所述估值表特征输入预测模型中, 得到所述预测模型输出的与所述 估值表所对应的目标托管行, 其中, 所述预测模型采用多组样本数据训练得到, 所述多组样 本数据包括: 样本估值表特 征, 与该样本估值表特 征对应的托管 行。 10.根据权利要求8所述的装置, 其中, 所述第一 提取模块包括: 第一提取单元, 用于对所述估值表的主标题进行特征提取, 得到主标题特征, 以及对所 述估值表的副标题进行 特征提取, 得到副标题特 征; 第二提取单元, 用于对所述估值表的主标题的文本内容进行特征提取, 得到主标题文 本特征, 以及对所述估值表的副标题的文本内容进行 特征提取, 得到副标题文本特 征; 其中, 所述估值表特征包括: 所述主标题特征, 所述副标题特征, 所述主标题文本特征 和所述副标题文本特 征。 11.根据权利要求8所述的装置, 其中, 还 包括: 校验模块, 用于在所述基于所述目标估值表解析模板对所述估值表进行解析, 得到估 值表解析 结果之后, 对所述估值表解析 结果进行 校验; 转换模块, 用于在检验通过的情况下, 将所述估值表解析结果转换为所述估值表对应 的估值数据。 12.根据权利要求8至1 1中任一项所述的装置, 其中, 所述装置还 包括: 更新模块, 用于按照预定周期对托管行与估值表解析模板之间的所述对应关系进行更 新。 13.一种估值表处 理装置, 包括: 第二获取模块, 用于获取多组估值表数据, 其中, 所述多组估值表数据包括: 估值表, 与 该估值表对应的托管 行; 第二提取模块, 用于分别提取 所述多组估值表数据的估值表特 征; 训练模块, 用于基于所述多组估值表数据的估值表特征进行机器训练, 得到预测模型, 其中, 所述预测模型用于对待解析的估值表进行预测, 得到目标托管行, 所述目标托管行用 于基于托管行与估值表解析模板 之间的对应关系, 确定对应的估值表解析模板, 其中, 所述 托管行与估值表解析模板之间的对应关系包括多对一的关系。 14.根据权利要求13所述的装置, 其中, 所述估值表特征包括: 所述估值表的主标题对 应的主标题特征, 所述估值表的副标题对应的副标题特征, 所述估值表的主标题文本对应 的主标题文本特 征和所述估值表的副标题文本对应的副标题文本特 征。 15.一种电子设备, 包括: 至少一个处 理器; 以及权 利 要 求 书 2/3 页 3 CN 114187081 A 3

.PDF文档 专利 估值表处理方法、装置、电子设备及计算机可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 估值表处理方法、装置、电子设备及计算机可读存储介质 第 1 页 专利 估值表处理方法、装置、电子设备及计算机可读存储介质 第 2 页 专利 估值表处理方法、装置、电子设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:06:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。