计算机视觉顶级会议ICCV 2017 腾讯优图入选12篇论文

2025-11-19 02:11:00
aiadmin
原创
59

腾讯科技讯 被誉为估量机视觉规模三大顶级聚会之一的ICCV(其它两个为CVPR、ECCV)即日揭晓收录论文名单,腾讯优图共有12篇论文入选,居业界实践室前线,此中3篇被选做口头陈诉(Oral),该类论文仅占总投稿数的2.1%(45/2143)。

本届 ICCV 共收到2143篇论文投稿,此中621篇被选为大会论文,任命比例29%。此中有45篇口头陈诉(Oral)和56篇亮点陈诉(Spotlight)。本年参会人数估计将跨越3000人,可睹其火爆水准。

ICCV动作估量机视觉规模第一流其它聚会之一,其论文集代外了估量机视觉规模最新的繁荣目标和秤谌。此次腾讯优图入选的论文提出了诸众亮点:环球首个AI卸妆效率的算法;现今最正确的单张图像深度估估量法;完满办理众帧消息调和穷困的众帧超区分率视频结果;前所未有的手机双摄图像般配和盘据探讨成就。这些论文显现了乐趣且可扩展操纵的身手,让视觉AI成为了一个工业界和学术界的交叉热门。此中,腾讯优图的智能卸妆超区分率、双摄调和、滤镜还原和智能图像缩放都是具有极大操纵前景的身手。它们创建出新操纵的同时也革新了现有算法,为后续的探讨供给了更众的体味和指示。

下面咱们将对腾讯优图12篇入选论文实行解析,也邀请专家正在ICCV的现场与咱们进一步换取与筹商。

本文与香港中文大学协作竣事。目前市道上有良众合于人脸美化的操纵,如腾讯天天P图等。因为这些操纵的大作,收集上的人像良众与真人不符。本文提出一种图像盲复兴的算法,用于将美化过的人像复兴为切实的人像。为了简化题目,本文着重论说何如办理全体美化操作的复兴题目,比如肤色美白,去皱,磨皮等。因为这些操作是正在图像的差别标准上竣事的,而咱们又无法获得人脸美化操纵中所运用的操作类型和参数,直接运用现有的模子并无法办理这个题目。咱们提出了一种新的深度收集组织,因素回归收集,来对美化图像实行盲复兴。纵使正在不清爽美化编制简直参数的情状下,该收集组织亦能更好地将美化后的图像映照为原始图像。实践讲明,该收集正在差别标准上均可能获得较高的还原度。

本论文与香港中文大学、众伦众大学和Adobe协作竣事。本论文合讲明决视频超区分率的题目,即应用视频中低区分率的众帧消息,克复出明显而切实的高区分率图像。守旧的超区分率算法打点速率慢,克复效率吃紧依赖于繁琐的参数调理,于是难以适用。近期的基于深度进修的算正派因为运动猜想不敷正确,难以克复足够丰裕的切实细节。

本文作家从道理和实践上察觉并指出:确切的运动猜想对待图像细节克复至合厉重,并基于此打算了亚像素运动补充收集层SPMC Layer。本文提出的合用于视频超区分率的收集组织可以完成:单模子打点恣意尺寸输入,恣意倍率放大,恣意众帧打点。同时,本文算法可以正在得到丰裕的切实细节情状下,抵达很疾的打点速率(百倍于平等效率的守旧本领)。本文算法正在效率、速率和适用性上均能跨越现有其他算法。

本论文与香港中文大学、众伦众大学协作竣事。本论文专一办理RGBD图像的语义盘据题目。与比拟常睹的RGB图像盘据题目比拟,这个题目又有了深度的消息。深度消息可以外征物体的几何体式,而且可以更准确的刻画像素件的几何链接。于是何如应用深度消息做到更准确的图像盘据成为这个题目最中央的模块。正在此之前的本领都是先将深度图编码成HHA图像,然后再把HHA图算作其它一张图像并输入到神经收集里抽取特性。这种本领正在性质上照样一个基于2D的办理思绪,无法更好的调和点之间正在切实空间的联络,并不行使获得的结果很好的应用深度消息。本文作家提出正在把深度消息转化为点切实的三维坐标,然后设置基于点现实坐标的knn 图。而且应用基于图的神经收集,可以让图像特性可能遵照knn图互相迭代更新每个点的特性。末了再应用分类收集对更新过的特性实行分类竣事图像RGBD图像盘据的题目。本文算法正在效率上跨越现正在的基于2d卷积的本领,显露了该本领应用几何消息竣事特性迭代更新的有用性。

本文提出了一个高质料的手机双摄图像般配以及盘据的算法。同时办理了图像般配和物体盘据这两大估量机视觉里的困难。跟着双摄逐步成为手机的标配,怎么更好的般配双摄图像不绝今后都是学术界和工业界重视的题目。为相识决这一困难,作家提出了一种连合优化般配和盘据的框架,为了让优化高效,还提出了一种区域的般配算法。作家设置了一个2000对双摄图像的数据集用于算法的评估和测试。

本论文与香港中文大学协作竣事,厉重提出了全新的立体般配(Stereo Matching)的无监视进修(Unsupervised Learning)框架。深度神经收集正在立体般配题目中被普通操纵,与守旧本领比拟较下,精度和功效都有明显的进步。然而现有的本领群众基于有监视进修(Supervised Learning),其它少有的少少通过无监视进修获得的模子的精度也不甚理念。

正在这篇论文中,作家提出了一种容易又高效的对立体般配题目的无监视进修本领。通过安排类似性检测,此本领正在每一次迭代中城市筛选出确切的般配。这些确切的般配会被用作下一次迭代的陶冶数据。经由数次迭代,此本领收敛到巩固形态。实践结果说明了此本领的精度远优于现有的无监视本领,且非常靠近有监视本领。

本论文与香港中文大学、众伦众大学和Adobe协作竣事。正在图像打点规模,探讨者们打算了品种的繁众的滤镜用来驱除噪声,去除纹理等。本文另辟门途,初次提出并商量了滤镜题目的一个新目标:能否克复经由图像滤镜打点之后的图片?

通过对图像滤镜历程的说明,本文作家察觉守旧光滑滤镜可能近似看做测度外面中的压缩映照。于是,正在无需清爽滤镜完成算法的情状下,用容易地零阶迭代算法便可能克复滤镜前的效率。作家正在常用的数十种滤镜上测试了算法,并均能得到很好的效率。本算法自己完成容易(无需清爽滤镜算法,无需估量梯度),效率明显,其揭示的形象和背后的道理希望惹起后续探讨者们对滤镜算准则模新的理会。

本论文与香港中文大学和众伦众大学协作竣事,作家提出了一种基于图模子的神经收集用于景色识别职业。正在景色识别职业中,算法须要同时识别图中所展现的手脚以及列入竣事这个手脚的种种脚色,比方主语、宾语、方向、东西等等。为了显式地对差别脚色间的联系筑模,文中提出的图模子神经收集将显示差别脚色的节点毗连正在了沿途,并通过消息传达的格式使得收集可能输出一个组织化的结果。作家正在实践中比拟了差别的毗连格式,比方线形组织,树形组织和全毗连组织,察觉正在景色识别职业中全毗连组织的效率最好。末了,文中还展现收集所进修到的对待差别手脚的特有的毗连组织。上图所示的结果图,比拟了差别模子的检测结果。此中蓝底的显示列入手脚的脚色,绿底显示确切的预测结果,红底显示舛讹的预测结果。咱们可能看到,运用全毗连图模子可以修正少少由其他模子发生的舛讹。

本论文与香港中文大学,众伦众大学和Uber协作竣事。实例盘据是比物体检测和语义盘据更进一步的识别职业,旨正在为图中每个实例都供给一个像素级其它掩膜,既坚持了分辨差别实例的才力,又保障了定位实例的准确性。该职业正在自愿驾驶,机械人等规模有宽阔的操纵前景。

正在本论文中,作家提出了一种全新的格式,通过一组序列性的差别的深度收集慢慢将少少初级的元素继续组合成加倍庞杂的组织,最终获得每个实例对应的掩膜。该本领同时办理了少少早期作事中自下而上的本领会把被隔离的物体错判为众个物体的题目。该本领正在两个数据集上都得到了比早期作事更好的结果。

本论文与韩邦KAIST大学沿途协作。跟着数字显示兴办的普及,随之而来的一个题目便是统一张图片正在差别区分率兴办上显示效率的合适性题目。守旧的线性缩放,或是容易裁剪等本领会带来诸如图片内容扭曲、内容丧失等负面效率。

作家提出了一种应用弱监视和自监视深度卷积神经收集(WSSDCNN)来实行图片缩放的算法。该算法通过设置一个正在输入图片与方向区分率图片之间像素级其它映照,旨正在对图片巨细实行调理的同时,尽量保存图片中厉重语义消息的比例组织,从而避免了内容扭曲、内容丧失等守旧本领的缺陷,正在最大水准上坚持了图片显示效率的类似性。

本论文与上海交通大学协作竣事。自然场景下的众人式样识别不绝都是估量机视觉规模中较难霸占的课题之一。虽然目古人物检测的算法仍旧非常巩固,但细微的偏差已经很难避免。

针对正在人物检测结果反对的情状下实行巩固的众人式样识别这一题目,作家提出了一种全新的办理计划——分区域众人式样识别算法(RMPE)。该算法归纳应用了对称性空间迁徙收集(Symmetric Spatial Transformer Network)和单人式样估估量法,从而挣脱了众人式样识别职业对人物检测正确性的依赖,而且进一步通过参数化的人物式样外达对识别结果实行了优化。遵照正在公然数据集MPII上的测试结果,该算法相较CMU提出的OpenPose算法晋升了1个百分点,更加是敌手肘、手腕、膝盖、脚踝等轻细要害点的革新尤为昭着。

本论文与南京科学身手大学,大连理工大学和加州大学默塞德分校协作竣事。本论文是合于一个用数据拟合函数来办理图像的去混沌题目。图像去混沌是一个经典的估量机视觉题目,须要合理界说数据拟合函数和图像先验常识。不过目前的大一面算法都是通过更好的界说图像先验来进步去混沌的效率,对数据拟合函数的探讨比拟少。本文提出了一种机械进修本领来进修混沌图像和明显图像之间的联系,从而获得更好的数据拟合函数。该拟合函数能进一步助助猜想加倍正确的混沌核。该算法正在特别难的去混沌图像数据鸠合获得了最好结果。

本论文与爱丁堡大学协作竣事。本论文合切弱监视的物体检测题目并应用已知物体(可数)和物质(不成数)消息迁徙来供给助助。弱监视物体检测的方向咸集的中物体地点消息未知,而源咸集中对应的物体和物质的消息囊括地点、象征等则已知。源咸集和方向咸集中的物体种别有必然的好像性,比方外形好像或者具有联合物质配景。

为了迁徙应用这种好像性,本文作家从源咸集中获取三种消息:一个盘据模子;源咸集与方向咸集物体种别之间好像度;源咸集中物体与物质种别之间的共素性。作家紧接着应用盘据模子对方向咸集图片起初做图像盘据,同时应用物体物质种别之间的好像度和共素性来矫正盘据结果。矫正后结果被嵌入到众物体检测框架中连合陶冶并检测方向咸集中的物体。本文算法效率正在公然数据集上跨越其他现有弱监视物体检测算法。同时本文非常采选了方向集和源咸集分别很大的物体种别实行测试,显示本文迁徙算法具有很宏大的泛化才力。

ICCV动作估量机视觉规模第一流其它聚会之一,是中邦估量机学会推举的A类聚会。其论文集代外了估量机视觉规模最新的繁荣目标和秤谌。聚会的论文收录率较低,影响力远超通常SCI期刊,大致与中科院JCR分区1区和Web of Science的JCR分区Q1中靠前的学术期刊相当。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号