公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111434434.9 (22)申请日 2021.11.29 (71)申请人 上海交通大 学 地址 200240 上海市闵行区东川路80 0号 (72)发明人 曹健 申世通 钱诗友  (74)专利代理 机构 上海汉声知识产权代理有限 公司 3123 6 代理人 胡晶 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/08(2012.01) G06K 9/62(2022.01) G06N 3/12(2006.01) (54)发明名称 基于KNN算法的航次进箱量分布情况预测方 法和系统 (57)摘要 本发明提供了一种基于KNN算法的航次进箱 量分布情况预测方法和系统, 包括: 步骤1: 对航 次特征进行编码, 并进行相似航次匹配; 步骤2: 对相似航次进行核密度估计, 并在核密度估计结 果中进行抽样; 步骤3: 对抽样数据进行核密度估 计, 得到预测结果; 步骤4: 通过遗传算法对预测 结果进行优化。 本发明能够在每日甚至每小时的 更细粒度上对航次的进箱量做出预测, 从而更好 地挖掘码头的吞吐能力, 高效地提供货运服务, 降低成本并提升水路航 运的市场竞争力。 权利要求书2页 说明书5页 附图4页 CN 114021854 A 2022.02.08 CN 114021854 A 1.一种基于KN N算法的航次进箱量分布情况 预测方法, 其特 征在于, 包括: 步骤1: 对航次特 征进行编码, 并进行相似航次匹配; 步骤2: 对相似航次进行核密度估计, 并在核密度估计结果中进行抽样; 步骤3: 对抽样数据进行核密度估计, 得到预测结果; 步骤4: 通过遗传算法对预测结果进行优化。 2.根据权利要求1所述的基于KNN算法的航次进箱量分布情况预测方法, 其特征在于, 所述步骤1包括: 使用词向量嵌入的方式对航线中文名进行编码, 使用one ‑hot编码的方式对计划泊位 号、 航线代码、 航区和开港时间进行编 码, 使得这些分类特征中不同取值间对应的距离一致 而相同取值的距离为 零; 通过计算词向量间的余弦距离来获取其方向上的相对差异, 然后对其他特征向量分别 计算欧式距离来衡量one ‑hot编码的分类特征的类别距离以及其他的数值特征的数值距 离, 最后在每个特征对应的距离上赋予对应的权重并加以求和, 用来表示航次间的距离, 取 距离最小的预设个数k个航次作为相似航次。 3.根据权利要求2所述的基于KNN算法的航次进箱量分布情况预测方法, 其特征在于, 所述步骤2包括: 使用核密度估计函数对相似航 次的进箱时间进行概率密度拟合, 得到其对应的在开港 后5*24小时内的概 率密度函数; 根据航次间的距离和被预测航 次的距离, 按预设比例从各个相似航 次的概率密度函数 中采用逆变换采样的方式进行 数据点抽样。 4.根据权利要求3所述的基于KNN算法的航次进箱量分布情况预测方法, 其特征在于, 所述步骤3包括: 使用核密度估计函数对在各个相似航 次中采样到的数据点进行核密度估计, 得到被预 测航次的概 率密度函数; 对被预测航 次的概率密度函数进行求解定积分, 获得指定时间间隔内的进箱量占总箱 量的比率, 用该比率乘以预知总箱量, 得到该时段的进箱量预测值。 5.根据权利要求1所述的基于KNN算法的航次进箱量分布情况预测方法, 其特征在于, 所述步骤4包括: 采用遗传算法对航次特征的权重进行染色体编码, 然后进行多轮交叉、 变 异、 进化, 不断优化权 重参数, 对预测结果进行优化。 6.一种基于KN N算法的航次进箱量分布情况 预测系统, 其特 征在于, 包括: 模块M1: 对航次特 征进行编码, 并进行相似航次匹配; 模块M2: 对相似航次进行核密度估计, 并在核密度估计结果中进行抽样; 模块M3: 对抽样数据进行核密度估计, 得到预测结果; 模块M4: 通过遗传算法对预测结果进行优化。 7.根据权利要求6所述的基于KNN算法的航次进箱量分布情况预测系统, 其特征在于, 所述模块M1包括: 使用词向量嵌入的方式对航线中文名进行编码, 使用one ‑hot编码的方式对计划泊位 号、 航线代码、 航区和开港时间进行编 码, 使得这些分类特征中不同取值间对应的距离一致 而相同取值的距离为 零;权 利 要 求 书 1/2 页 2 CN 114021854 A 2通过计算词向量间的余弦距离来获取其方向上的相对差异, 然后对其他特征向量分别 计算欧式距离来衡量one ‑hot编码的分类特征的类别距离以及其他的数值特征的数值距 离, 最后在每个特征对应的距离上赋予对应的权重并加以求和, 用来表示航次间的距离, 取 距离最小的预设个数k个航次作为相似航次。 8.根据权利要求7所述的基于KNN算法的航次进箱量分布情况预测系统, 其特征在于, 所述模块M2包括: 使用核密度估计函数对相似航 次的进箱时间进行概率密度拟合, 得到其对应的在开港 后5*24小时内的概 率密度函数; 根据航次间的距离和被预测航 次的距离, 按预设比例从各个相似航 次的概率密度函数 中采用逆变换采样的方式进行 数据点抽样。 9.根据权利要求8所述的基于KNN算法的航次进箱量分布情况预测系统, 其特征在于, 所述模块M 3包括: 使用核密度估计函数对在各个相似航 次中采样到的数据点进行核密度估计, 得到被预 测航次的概 率密度函数; 对被预测航 次的概率密度函数进行求解定积分, 获得指定时间间隔内的进箱量占总箱 量的比率, 用该比率乘以预知总箱量, 得到该时段的进箱量预测值。 10.根据权利要求6所述的基于KNN算法的航 次进箱量分布情况预测系统, 其特征在于, 所述模块M4包括: 采用遗传算法对航次特征的权重进 行染色体编码, 然后进 行多轮交叉、 变 异、 进化, 不断优化权 重参数, 对预测结果进行优化。权 利 要 求 书 2/2 页 3 CN 114021854 A 3

.PDF文档 专利 基于KNN算法的航次进箱量分布情况预测方法和系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于KNN算法的航次进箱量分布情况预测方法和系统 第 1 页 专利 基于KNN算法的航次进箱量分布情况预测方法和系统 第 2 页 专利 基于KNN算法的航次进箱量分布情况预测方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:06:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。