(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111641414.9
(22)申请日 2021.12.2 9
(71)申请人 中国人民解 放军火箭军工程大 学
地址 710025 陕西省西安市灞桥区同心路2
号
(72)发明人 李敏 苟瑶 时帅兵 何玉杰
邢宇航 王利涛 董清江
(74)专利代理 机构 北京高沃 律师事务所 1 1569
代理人 赵兴华
(51)Int.Cl.
G06T 3/00(2006.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/774(2022.01)G06V 10/764(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种图像转换方法及系统
(57)摘要
本发明提供了一种图像转换方法及系统, 方
法包括: 获取待转换图像; 将转换图像输入到图
像转换模型中, 得到转换后的图像; 图像转换模
型是利用训练集对初始对抗网络进行训练得到
的; 训练集包括待转换图像训练集和目标图像训
练集; 初始对抗网络包括生成网络和鉴别网络;
生成网络包括一个编码器和一个解码器。 本发明
通过对初始对抗网络进行训练得到图像转换模
型用于图像转换, 能够提高图像转换的转换精
度。
权利要求书5页 说明书16页 附图2页
CN 114331821 A
2022.04.12
CN 114331821 A
1.一种图像转换 方法, 其特 征在于, 所述方法, 包括:
获取待转换图像;
将所述转换图像输入到 图像转换模型中, 得到转换后的图像; 图像转换模型是利用训
练集对初始对抗网络进行训练得到的; 所述训练集包括待转换图像训练集和目标图像训练
集; 所述初始对抗网络包括生成网络和 鉴别网络; 所述生成网络包括一个编码器和 一个解
码器。
2.根据权利要求1所述的图像转换方法, 其特征在于, 在所述获取待转换图像之前, 还
包括:
构建初始对抗网络;
获取训练集;
以所述待转换图像训练集为输入, 以所述目标图像训练集为输出, 对所述初始对抗网
络进行训练, 得到所述图像转换模型。
3.根据权利要求2所述的图像转换方法, 其特征在于, 所述以所述待转换图像训练集为
输入, 以所述目标图像训练集为输出, 对所述初始对抗网络进 行训练, 得到所述图像转换模
型, 具体包括:
将所述待转换图像训练集输入到所述编码器中进行 特征提取, 得到特 征集;
将所述特征集输入到所述解码器中所述待转换图像训练集进行转换, 得到输出转换图
像集, 并计算 生成网络损失;
判断所述 生成网络损失是否在第一预设范围内, 得到第一判断结果;
若所述第一判断结果为否, 则更新所述编码器和所述解码器的参数并返回步骤 “将所
述待转换图像训练集输入到所述编码器中进行 特征提取, 得到特 征集”;
若所述第一判断结果为是, 则将所述输出转换图像集和所述目标图像训练集均输入所
述鉴别网络中, 并计算 鉴别网络损失;
判断所述 鉴别网络损失是否在第二预设范围内, 得到第二判断结果;
若所述第二判断结果为否, 则更新所述鉴别网络的参数并返回步骤 “将所述待转换图
像训练集输入到所述编码器中进行 特征提取, 得到特 征集”;
若所述第二判断结果 为是, 则将训练后的生成网络作为所述图像转换模型。
4.根据权利要求2所述的图像转换方法, 其特征在于, 所述以所述待转换图像训练集为
输入, 以所述目标图像训练集为输出, 对所述初始对抗网络进 行训练, 得到所述图像转换模
型, 具体包括:
将所述待转换图像训练集输入到所述编码器中进行 特征提取, 得到特 征集;
将所述特征集输入到所述解码器中所述待转换图像训练集进行转换, 得到输出转换图
像集, 并计算 生成网络损失;
将所述输出转换图像集和所述目标图像训练集均输入所述鉴别网络 中, 并计算鉴别网
络损失;
判断迭代次数 是否达到预设迭代次数阈值, 得到第三判断结果;
若所述第三判断结果为否, 则根据所述生成网络损 失和所述鉴别网络损 失, 更新所述
初始对抗网络的参数并返回步骤 “将所述待转换图像训练集输入到所述编 码器中进行特征
提取, 得到特 征集”;权 利 要 求 书 1/5 页
2
CN 114331821 A
2若所述第三判断结果 为是, 则将训练后的生成网络作为所述图像转换模型。
5.根据权利要求3或4所述的图像转换 方法, 其特 征在于,
所述生成网络损失为:
LG=LG(G,D,X,Y)+λX·LPatchNCE(G,H,X)+λY·LPatchNCE(G,H,Y);
其中, LG(G,D,X,Y)=E[l og(1‑D(G(x)))];
式中, LG表示生成网络总损失; LG(G,D,X,Y)表示生成对抗损失; LPatchNCE(G,H,X)表示第
一补丁块对比损失; LPatchNCE(G,H,Y)表示第二补丁块对比损失; λX和 λY分别表示第一系数和
第二系数; λX和 λY均为1; G(x)表示将待转 换图像训练集中的一张图像x 输入至生成网络中后
得到的转换后的图像; D(G(x))表 示向鉴别网络中输入图像 G(x)后得到的鉴别概率值; E(*)
表示*的期望值;
表示交叉熵损失函数; τ表示第一控制系数, τ为0 .07;
表示将待转换图像训练集 中图像x依次输入至l层编码器和多层感知机H
得到的特征集合l=1, ..., L; L为编码器总层数;
表示将G(x)依次输入
至l层编码器和多层感知机H得到的特征集合; 令s∈{1, …,Sl}, Sl是第l层的空间位置 数;
表示
中第l层第s个查询块的特征,
表示{zl}L中第l层第s个正样例的特征;
表示
{zl}L中第l层除s外负样例的特征; ;
表示将训练集目标域中图像y依次
输入至l层编码器和多层感知机H得到的特征集合;
表示将图像G(y)
依次输入至l层编码 器和多层感知机H得到的特征集合; G(y)表 示将目标图像集中的一张图
像y输入至生成网络中后得到的转换后的图像;
表示
中第l层第s个查询块的特征,
表示{wl}L中第l层第s个正样例的特 征;
表示{wl}L中第l层除s外负 样例的特 征;
所述鉴别网络损失为: LD=LD(G,D,X,Y)+λM·LMCL(G,D,X,Y);
其中, LD(G,D,X,Y)= ‑E[logD(y)]+E[l ogD(G(x) )];
式中, LD表示鉴别网络损失; LD(G,D,X,Y)表示鉴别网络对抗损失; LMCL(G,D,X,Y)表示多
特征对比学习损失; λM表示第三系数; D(y)表示向鉴别网络中输入图像y后得到的鉴别概率权 利 要 求 书 2/5 页
3
CN 114331821 A
3
专利 一种图像转换方法及系统
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:40:40上传分享