华人一作的最佳论文,火热的3D和世界模型以及“无处不在”的何恺明们
创始人
2025-06-14 14:43:17
0

在科研领域,华人一作的最佳论文熠熠生辉,展现出华人在学术上的卓越成就。其中,火热的 3D 和世界模型更是引人瞩目,它们推动着相关领域的快速发展。而“无处不在”的何恺明们,如同璀璨星辰,在各个科研角落散发着光芒。他们凭借着深厚的学术功底和创新精神,不断突破边界,为科学进步做出了巨大贡献。无论是在理论研究还是实际应用中,他们的成果都如同一股股清泉,滋润着科学的土壤,让我们看到了华人在科研领域的无限可能和强大力量。


本文来自微信公众号:硅星人Pro (ID:gh_c0bb185caa8d),作者:Kyla 王兆洋,原文标题:《CVPR现场直击|华人一作的最佳论文,火热的3D和世界模型以及“无处不在”的何恺明们》


CVPR是一个“冷门学术会议”的时代一去不复返了。


2024年,因为大模型以及Sora等的横空出世,全球计算机视觉届三大顶会之一的CVPR涌入了破纪录的1.2万人(可以回顾一下我们去年的现场报道)。而2025年,这种火热继续,虽然关注度没有上一届那么夸张,但我们今年在现场参会的观感,以及与诸多研究者交流的感受是:


它从一个学术交流、计算机科学家聚会、新的研究idea亮相与碰撞的会议,开始转为了工业界与学术界互动、AI公司抢夺注意力和人才、更偏向实际应用及工程化的成果集中展示的AI行业大聚会。


今年的CVPR在美国田纳西州纳什维尔举办。6月11日开幕,6月13日最佳论文等官方的奖项颁奖,之后多日是各种poster展示和各类交流论坛和线下聚会。


今年CVPR上重要和有意思的事情也不少:


最佳论文给到了VGGT,这是一个最近少有的被很多人评价为“实至名归”的成果。


3D似乎正在来到彻底爆发的前夜,成为高质量论文和Demo出现的重要方向。


“世界模型”的名字越来越多的出现在各种论文、poster session和workshop里。


偏向应用和工程的,离产业界更近的研究肉眼可见的多了起来,大厂们逐渐抢夺走CVPR上更多的注意力。


去年第一次没有论文被选中的ResNet架构提出者、AI明星研究员何恺明,回归大会,除了论文和分享讲座,他也是最佳论文委员会成员之一。


而诸多年轻研究员继续在CVPR上完成着自己学术追星的计划,比如与何恺明的各种合影充满了社交媒体…


以下是我们从现场发回的一手直击。


1、最佳论文再次是华人一作,3D和世界模型大热


许多参会者是第一次来纳什维尔。当你走出这座美国中部城市的机场,你立刻就能感觉到,身边背着电脑包、拖着行李箱、戴着大会证件的人特别多,市区的酒店几乎全满,早上打车还得排队。人山人海,明显不是纳什维尔平常的节奏。


6月13日,CVPR颁发最佳论文奖,人们涌入会场,会场大厅里是各种肤色、各种语言的交汇。


根据CVPR官方的介绍,今年共有14篇论文入围最佳论文,最终5篇论文摘得奖项,包括1篇最佳论文、4篇最佳论文荣誉提名。另外还有学生最佳论文奖。



最终获得最佳论文的,是VGGT的工作——VGGT:Visual Geometry Grounded Transformer。


这是一个可以实现从多个图像数据里推出关键的3D属性的技术,比如从一些二维的图片,来得到相机参数、点云、深度图等用于3D重建的关键信息。在实现上,它用一次Transformer的典型的前馈输入和神经网络的处理操作,可以把3D的数据提取推导全部做完,也就是行业最热议的“端到端”的概念,而且据论文展示,它的速度也比传统的方法快了10多倍,可以在几秒内就完成一次复杂的任务。


它简洁而效果很好,而且,这个研究是典型的对于工业界价值极大的节点性的论文——它证明了一个方向,然后降低了一个行业应用爆发的门槛,同时,给那些有充分计算资源的大厂指明了一条充满诱惑的道路。


去年的CVPR最佳论文之一,第一作者是华人研究员。而今年这篇最佳论文的第一作者也是华人研究员。


王建元是牛津大学视觉几何组(VGG)与Meta AI的联合培养博士生,长期研究3D重建方法,聚焦于端到端几何推理框架的创新。之前,他的许多工作就被行业关注,包括去年CVPR的Highlight论文,VGGSfM(一个能从大量图像中自动重建三维场景结构和相机位姿的系统),以及PoseDiffusion(将相机位姿估计视为一个扩散Diffusion过程,通过学习多视角下条件分布的扩散模型,逐步优化相机参数)。


根据会方统计,今年大会共收到4万多名作者提交的13008份论文,再破纪录。相比去年投稿数增长13%,2872篇论文被接收,最终接收率约22.1%。



有意思的是,在一个研究竞争激烈的领域,VGGT的获奖被不少人形容是实至名归,毫无悬念。“它开创了新的阶段,代替了此前的主流方法。有点类似当初RestNet的意义。”一名研究员说。


CVPR就像是时尚行业每年定义当年流行元素的大会,它的风潮也总在变化。去年,结合语言和视觉的论文增加了两倍,扩散模型和生成模型论文增加了三倍。那些有OpenAI Sora作者参加的workshop,排队排出了明星见面会的效果。


今年Sora早已被人忘掉。但生成式AI继续火热。官方数据显示,今年接收数量最多的依然是图像与视频生成领域。


不过,可能更能体现风向标变化的是接收率。今年接收率最高的是3D相关的研究。


另外,在我们参加的workshop,以及和各路人马的交流中,明显感受到“世界模型”这个词也出现的更多了。


我们在现场和几位researcher的交流,也提到,今年生成式AI、3D视觉、多模态相关的论文和talk热度最高,世界模型和3D Gaussian Splatting反复被提起,不少session满场。


最佳论文候选中,AI大佬Yann LeCun参与的Navigation World Models,提出了一个可控的视频生成模型,用于环境导航的世界模型。


在6月11日备受关注的CVPR自动驾驶的workshop里,世界模型方向也得到很多讨论,其中作为被邀请的唯一汽车厂商,小鹏的相关研究也展示了一个从真实驾驶数据中训练出的高保真世界模型。


3D正在快速进入实际场景,世界模型也得到了类似的关注,似乎真的都开始走向应用。


1、“很多idea都开始面向产业应用”,大厂存在感继续增高


CVPR上的workshop琳琅满目。而其中越来越多的讨论里,会有更多工业界的人参与其中。会场里,像Meta、NVIDIA、Google、Apple等企业logo遍布,很多researcher也挂着这些公司工牌,企业研究人员的占比明显上升。不少技术talk和panel讨论直接围绕“从论文到产品”的话题,工业界和学术界的界限在进一步模糊。


中国公司也十分抢眼。腾讯的企鹅长鹅飘在半空中,字节、阿里都有各自的活动,宇树的展区也在准备接受“围堵”。我们趁着“堵车”前去拍了一些照片。


今年CVPR的现场氛围非常快节奏,走廊里总是有人飞快穿梭、低头看会议手册查下一个workshop在哪儿。很多人在走廊边的椅子上抱着电脑工作,咖啡区永远排着长队。Poster区尤其热闹,几乎每一张海报前都围着一圈人。


研究者们一边讲解,一边被各种提问“这个能不能商用”,“模型开源了吗”。


务实的很。


作为今年很重要研究方向,3D相关的论文和demo很多也是工业界关注的焦点。像3D Gaussian Splatting,很多demo现场直接展示出高质量、实时的3D重建效果,吸引了不少人围观。生成式AI依然是焦点,不少论文探索如何结合3D、物理世界信息提升生成效果,技术演示上也更强调实用性和效率。今年整体感觉是demo和应用性变强了,很多成果已经能直接服务工业界需求。



工业界和学术界进一步融合,是今年CVPR现场很明显的感受。从录用论文来看,偏应用、偏工程、关注实际落地效果的研究变多了,很多论文直接针对工业界需求展开,行业关注度很高。


产业界和学术界共同设置的workshop门口经常排队,比如一场“基于基础模型的开放词汇3D场景理解”的workshop,座位要提前20分钟去才有位置,人多到会议室后面的空余的地上都坐满了人。


有去年也参会的研究员对我们说,今年产业界参与感更强,企业研究和学术交流结合更紧密,CVPR“出圈”的趋势更明显了。


1、顶流何恺明们,“应该也被合照合烦了吧”


在会场到处穿梭,就可能遇到一些学术明星。CVPR也是一个学术追星的“重灾区”。


其中,何恺明一直是CVPR的顶流。他是ResNet这个计算机视觉领域的流行架构的提出者,相关论文的引用数量突破20万次,曾经多次获得CVPR最佳论文奖。


因此,当去年CVPR成为历史上最火爆的一次,却同时也是第一次没有何恺明参与的论文入选的一次CVPR时,引发了广泛的讨论。也成了当时CVPR出圈的讨论话题之一。


而今年,何恺明“回归”,他担任了最佳论文评委委员之一,在颁奖前参与了workshop,做了一个演讲。


这也让何恺明显的“无处不在”,在小红书上,有很多与何恺明合影的研究员,以及在各种角落偶遇何恺明的人们。不过对于何恺明的这场讲座,似乎很少有人在分享讲座本身的内容。


其实,除了何恺明,华人研究员在CVPR的存在感也很强,而且今年感觉越来越耀眼。


最佳论文里除了一作,另一位作者Minghao Chen来自牛津大学,同时在Meta GenAI实习。最佳论文提名里,另一个很棒的研究MegaSam,第一作者Zhengqi Li,正是去年CVPR最佳论文之一的第一作者。在最佳学生论文的荣誉提名里,浙大、北大等高校也在列。


另外,华人年轻AI科学家谢赛宁和苏昊也得到了青年学者奖。


贾扬清在2014年参与的论文Going Deeper with Convolutions(由Google的研究组提出的一种高效的卷积神经网络模型,在ImageNet分类任务中取得了优异成绩,核心在于采用了Inception模块来提高网络性能。所以经常被人称为GoogleNet),得到了时间检验奖。


知名的AI学者、Idea研究院创院理事长沈向洋也在当天开幕上做了主旨演讲。


很多研究者跟我们交流中提到,今年不只是中国的研究者,来自中国企业的论文质量也很突出,讨论度很高。产业界的存在感也很强。整体看,中国研究者无论在学术圈还是产业圈,都在CVPR上有越来越重要的影响力。


当然,这样影响力,与今天诡异的大环境相碰撞,也会有很多“时代注脚”般的画面出现。比如在poster区路过一个华为相关研究部门的展示,发现它的poster上,研究机构名字居然是后来用马克笔潦草地手写上去的。


作为一个此刻最火爆的行业,在其中的研究员们肯定不愿错过任何可能的职业机会。大家都很积极在connect,会场外附近的café、餐厅里,随处可见脖子上挂着参会证的人,三五成群讨论项目、交换名片,微信、LinkedIn加好友几乎成了标配。今年CVPR更像是一场技术和产业界紧密结合的大集市,信息流动速度很快,交流氛围也比想象中还要活跃很多。


穿梭在这些poster session和workshop的会议室,走廊里永远有人在打电话、聊项目、或者低头敲键盘。很多人干脆抱着电脑坐在走廊边的椅子上工作,会议室的门一开一合,大家行色匆匆地赶场子,生怕错过什么“爆款”讲座。


站在CVPR的会场,像是被一股看不见的力量拉到了某个舞台的中央。看着这么多人彼此争分夺秒,多少有点兴奋,也有点跟不上节奏。而这已经是常态,每个人都在FOMO中继续前进着。

相关内容

热门资讯

两部门:进一步贯彻落实新保险合... 记者6月12日从财政部了解到,财政部、国家金融监管总局近日联合印发通知,进一步加强对企业实施《企业会...
教育部认定并命名!福州多所学校... 教育部认定并命名!福州多所学校入选!这是福州教育领域的一大盛事。这些学校凭借卓越的教育质量、深厚的文...
协力整治“内卷式”竞争 企业“内卷式”竞争不仅挤压正常利润空间,还破坏产业健康发展生态。在一些市场需求增长趋缓和产能相对过剩...
北京周末遇强降雨天气 故宫再现... 北京周末遭遇强降雨天气,这一特殊天气状况让故宫再现了令人惊叹的“千龙吐水”景象。雨水倾泻而下,故宫屋...
南京获取完整版侵华日军细菌战部... 记者14日获悉,侵华日军南京大屠杀遇难同胞纪念馆已于14日拿到完整版侵华日军细菌战部队1644部队留...
王毅同伊朗外长阿拉格齐通电话 近日,王毅同伊朗外长阿拉格齐通电话。此次通话意义重大,双方就双边关系及国际地区事务深入交换意见。王毅...
商道创投网·会员动态|啵特叮咚... 《商道创投网》2025年6月14日从官方获悉:通信运营服务提供商“啵特叮咚”近日完成了由财兴基金领投...
广州培育星级专业市场 统一品牌... 中新网广州6月14日电(王华  王宇婷)2025中国·广州市场产业高质量发展大会12日举行,会上发布...
兰天集团董事长汤国华:下半年国... 编者按:在国内车市反对内卷的背景下,不少主机厂承诺对于供应商的回款账期统一至60日之内。而在流通渠道...
兰州市一地突发塌陷天然气管道受... 记者从兰州市城关区应急管理局了解到,6月14日11时20分许,兰州市城关区九州大道中段排洪沟旁约30...
跌到谷底的马路房,被年轻人疯狂... 在城市的某个角落,有一栋曾被遗忘的马路房,它仿佛跌入了谷底。岁月的洗礼让它外表斑驳,墙壁布满裂痕,仿...
以色列对伊朗军事打击刺激油价大... 新华社纽约6月13日电(记者刘亚南)由于以色列对伊朗发起军事打击引发市场对中东石油供应的担忧,国际油...
伊朗居民楼遭空袭倒塌 20名儿... 在伊朗的某一片土地上,原本宁静的居民楼遭遇了一场残酷的空袭。那一瞬间,坚固的建筑仿佛脆弱的纸壳,轰然...
旅游消费OTA的 “去流量化”... 【大力财经】直击互联网最前线:在竞争激烈的在线旅游(OTA)市场,途牛正凭借一系列“反流量逻辑”的策...
【投融资动态】得普达定向增发融... 证券之星消息,根据天眼查APP于6月11日公布的信息整理,山东得普达电机股份有限公司定向增发融资,融...
女生万象城遭挟持?杭州上城警方... 杭州市公安局上城分局官方微博6月14日发布警情通报。
伊朗遭袭后 美国为何接连表达核... 美国总统特朗普13日在社交媒体上警告伊朗,称下一波对伊朗的打击将“更残酷”,伊朗必须在被彻底摧毁前与...
伊朗外交部回应伊美谈判问题:与... 当地时间14日,在回答关于原计划15日在阿曼举行的美国和伊朗第六轮间接谈判进展情况的问题时,伊朗外交...
首次!福州大学、厦门大学招生有... 福州大学和厦门大学招生迎来大变化啦!福州大学在专业设置与培养模式上进行了创新,新增了多个热门专业,如...
印度这起空难,疑点重重 近日,印度发生的一起空难疑点重重。从事故发生的最初阶段来看,诸多细节令人费解。飞机的通讯系统在关键时...