展会信息港展会大全

旷视6号员工范浩强:高二开始实习,25岁在CVPR斩获第四个世界第一
来源:互联网   发布日期:2019-07-08   浏览:678次  

导读:郭一璞发自融科资讯中心 量子位报道公众号 QbitAI 初来乍到,这个人说话容易让人觉得 狂 。 我们将比赛结果提交上去,果不其然,是第一名的成绩。 当他说出这句话的时候,表情没有一丝波澜,仿佛一切顺理成章。 他说的是 AI 顶会 CVPR 上的一项 ......

郭一璞发自融科资讯中心

量子位报道公众号 QbitAI

初来乍到,这个人说话容易让人觉得 狂 。

我们将比赛结果提交上去,果不其然,是第一名的成绩。 当他说出这句话的时候,表情没有一丝波澜,仿佛一切顺理成章。

他说的是 AI 顶会 CVPR 上的一项挑战赛结果,全球巨头都有参与,AI 高手均同场竞技,第一名并不容易。

但如果你知道 他 叫范浩强。

一切就非常稀疏平常。

谁是范浩强?

当初那个奥赛金牌、保送清华姚班、高二加入旷视成为 6 号员工的天才少年,人称小强,一度是 AI 界的江湖传说。

曾经,他是国际信息学奥赛(IOI)金牌获奖者,保送清华姚班,高二便受唐文斌邀请加入旷视创业,在半工半读的情况下保持姚班第一名的成绩,在大一军训时期就完成了一篇 ICCV 论文,一个让清华特奖得主陈立杰都感到智商被碾压的男人。

而如今,他已经是旷视研究院带领 70 人团队的算法总监了,带着一群平均年龄比自己大得多的研究员们,在图像算法、团队培养、商业化等各方面披荆斩棘,达成突破,研究领域涵盖人脸与指纹安全,移动端影像算法,AI 计算摄影。

巨大光环之下,范浩强倒毫无自视甚高之意,打趣的说自己 本科毕业,两年工作经验,在贵司也就这样吧 。

正如清华计算机系常被称作 贵系 ,这里的 贵司 当然也是指的旷视。

靠商用算法拿到学术界冠军

在范浩强的带领下,今年的 CVPR NTIRE 真实图像降噪挑战赛,旷视以绝对优势的运行时间和最终结果拿到了 Raw-RGB 组的冠军。

图像降噪其实也是一件挺神奇的事情。 介绍起这个被称作 超画质 的技术,范浩强如同在描述一件压箱底的宝贝。

这个技术,能够将手机拍到的充满噪点的图片:

变成和人眼看上去的效果一致,完美无瑕的样子:

而这个在学术界刚刚拿到冠军的降噪算法,范浩强团队从去年春天开始,做到去年 10 月完成,目前在产业界已经实现产品化,并开始商用,旷视的客户小米、OPPO、vivo 都在自家的手机上用到了这个算法。

相比之下,拿到冠军反而是顺便的事。

范浩强说: 我们的工作当然也是基于学术界已有的基础,目前我们取得了新的进展,自然也要回馈给研究社区,以便能够让技术进一步向前发展。

手机图像降噪算法是范浩强近几年最为得意的成果,而在此之前的本科时期,他已经在人脸识别、人脸检测方向带领团队为旷视拿下三个顶会级比赛的世界第一了。

在寝室里改变世界

回想起刚刚加入旷视的 2012 年,人脸识别在业界还是 不靠谱的事 ,不少业界名人都认为,人脸识别这件事不可能靠机器自动完成,必须依赖人类的眼睛才能实现。

但还是个高二学生的范浩强却觉得,只有做 不靠谱的事 ,才有意思,才有发展的空间。他就是怀着这样的心态,成了旷视第一个 Rer (Researcher,算法研究员)。

就这样,人脸识别这件 不靠谱 的事情一做就是七年。

高中毕业之后,范浩强进入了清华天才辈出的姚期智班,开始了他的大学生涯。

在姚班的学习状态,范浩强自己说是 part time student, full time intern ,兼职读本科,全职实习生,一半时间在学习,一半时间在工作,就这样,还在四年间保持姚班第一的成绩。

而他的第一篇顶会论文,正是在大一军训期间完成的,从没写过论文的他一次投稿后,收到了这样的评价:

It is a shame that such a good method is not backed by a solid paper.

你方法这么好,文章写得这个德性,是一种耻辱。

然而最后,论文还是被 ICCV 接收。足以见得,在 2013 年,用神经网络做人脸识别是相当稀缺的东西。

也正是因为这篇论文,旷视拿下了 ICCV 2013 300 Faces in-the-Wild Challenge 人脸关键点定位的冠军,这也是旷视获得第一个技术评测世界冠军。

随后的 2014 年,又是大丰收的一年。范浩强先是为旷视拿下世界权威人脸检测公开评测集 FDDB(Face Detection Dataset and Benchmark)人脸检测赛项的第一名。

之后,又拿下了互联网图像人脸识别竞赛 LFW(Labeled Faces in the Wild)的第一名。

这项冠军来的并不容易,创业早期的旷视条件艰苦,在研究人脸识别的时候,连 GPU 集群都没有,范浩强独自一人在学校寝室,在从外部云服务租来的集群上训练,终于拿下了 LFW(Labeled Faces in the Wild)竞赛的第一名。

正在他春风得意的时候,印奇发来一封邮件,强烈要求 不要在寝室里改变世界了,下周一务必来公司一趟 。

一年内两个冠军,加上 2013 年的 ICCV,三个世界第一,让旷视在计算机视觉领域一举成名,原本 不靠谱 的人脸识别,也逐渐成为现实,应用在了各类机构、场景,以及千万人的手机上。

信仰流 leader

除了研究成果不断夺冠,在范浩强读本科的这几年,旷视也处于高速发展阶段,各种产品都开始在行业内大放异彩,也成功自研了深度学习框架 Brain++。

而在资本层面,范浩强在清华读书期间,旷视也不断受到创新工场、蚂蚁金服、启明创投等多家机构的青睐,迅速从A轮发展到C轮(如今已到D轮),成为行业领军的独角兽。

正是在这样飞速发展的背景之下,范浩强没有和大多数姚班同学那样继续深造,而是直接追随人脸识别浪潮,成为了旷视全职员工。

对范浩强本人来说,从实习高中生,到全职研究员,旷视也逐渐从初创公司走向行业独角兽。

高中觉得这是个玩的东西,是个 game;本科觉得是个 job;毕业后觉得是个 mission。在 AI 的商业化应用之路上,前方已经没有别人,现在轮到我们这群人来继续推动它的发展。

而这期间,从参与旷视的建立,到完成人脸识别的一系列工作,拿下第一桶金,成为准备影响人类科技树的人,范浩强不仅拥有了 想做的事都能做成 的信心,更具备了一种使命感。

连旷视这样的公司都被外界称作 行业头部企业 ,由此可见整个行业都需要继续被拯救。 范浩强无不戏谑地说。 以 AI 为代表的智能化技术将深刻的影响未来产业的格局,时代的浪潮已经把我们推到了这里,担子虽重,但是已经是到了想上也得上,不想上也得上的时候了。

而听到范浩强这样一个毕业两年的年轻人讲述这些宏愿的时候,你会觉得他是这个时代的风云人物,有一种舍我其谁的英雄气概。不同于那个被多番吹捧少年天才,现在的他身上流露着一种历史使命感,配上插科打诨的脱口秀式表达,会觉得仿佛在会见一个影视剧里才有的形象丰满的人物。

也正是在他毕业后的这几年,旷视本身再度突破,由 Face++旷视 升级为 MEGVII 旷视 ,围绕核心 AI 技术原创深度学习框架 Brain++,为个人设备大脑、城市大脑和供应链大脑三大核心应用场景赋能,推进人工智能及物联网技术与实体经济加速融合,实现前沿科技规模化商业落地。

在这样的发展进程下,生于 1994 年的范浩强已经是旷视这家明星公司旗下旷视研究院带 70 人团队的算法总监了。

这位旷视最年轻的总监,手下却尽是年龄比自己大的同事,范浩强想了想,才想起了一位实习生是年纪比自己小的。

并且因为 保送即创业 ,范浩强虽然从没给自己写过求职简历,却经常需要看别人的简历,面试候选人。

甚至有一次,他还不得不帮一位比自己年长十岁的候选人解答一下 人生遇到焦虑该怎么办 。

在对团队的态度上,范浩强自称 信仰流 leader,给组员以自信, 使你相信你能做到 ,和组员一起走下去。

Leader 分几种,有的是 Manager,就是管你的,有些就是跟你一起走的,我成长中遇到的基本都是后者,包括孙剑在内。

在组员们看来,他们或许觉得范浩强名声在外,是心目中的偶像;或许觉得是身边的好友,会夜里睡不着觉跑来聊天;或许觉得是一起成长的伙伴,可以一起相互帮助走下去。

而对组员们,范浩强希望能 至少以小强为 baseline(基线) ,具有一个人能把一个方向的事情做好的能力。

给范浩强以希望的,是旷视研究院强大的研发力量:数百人的团队,85% 来自国内 Top10 高校,70 个以上的奥赛金牌,前途不可限量。

实践派研究者

至于范浩强自己在技术上的 秘诀 ,恐怕要用他一直在提的一句话来概括,那就是:

Engineering is magic。

来源于马斯克的一条推特。

提及大一的 landmark 论文,范浩强总结的经验是:Engineering is magic。

很多事情也没什么神奇的,就是你把所有环节都做对了,就做了一个别人之前没做到的事情。人脸识别发展至今有魔法么?没有任何魔法,现在翻出 1990 年的 paper 肯定能找出很多本质一样的东西出来,但就是在你做的过程中,各个环节里面都有一些应该做对的事情。

手机图像降噪也一样。

Engineering is magic,想出这些点并不难,关键是要真的一张一张去亲眼多看实验数据。

而现在,范浩强对 engineering 有了更高的要求,更宏大的目标。

他说,目前自己的一块工作重心是实现算法生产的工业化体系,让数据、新算法、训练体系、测试、评估这几个部分高效有机的在一起运行,今天给需求,明天给模型, 这是我们的目标,这条路并不平坦,还在努力过程中。

另外,则是要回答 AI 有什么用的终极问题,涉及业务方向、应用场景的选择,并进行商业化。

在中国做商业化的 AI 其实是个崭新的命题,欧美很多做得很好的算法公司一做就能活 20 年,因为有着成熟完善的商业竞争环境和严格的知识产权制度,国内这方面就会差很多。要走中国特色商业化之路很难,但不妨碍我们把它做出来。现在我们做的工作是让商业化的环境变好,使得那些读完博再出来创业的同学有更好的环境。

而 engineering 的能力,范浩强也希望能 迁移学习 到其他同学身上去, 旷视需要至少 100 个小强 。

而思考这些问题的,只是一位 25 岁的小哥哥,自带一种身为领袖人物的、与年龄不相符的责任感。

演脱口秀,吸别人的猫

除了工作的时候是个大神,范浩强的另一个人设则是段子手,自称 脱口秀演员里最会写代码的,码农里最会脱口秀的 。早年,旷视每一届年会范浩强都会上台表演脱口秀。

不过,常在河边走,总有会翻车的时候。有一年旷视人数暴增,台上的他愣是忘了词。

到了第二年年会,前来指导的专业演员看了之后,评价说: 看了你去年的录像,觉得很坚强。

在专业演员的指导下,范浩强终于学会了如何镇得住过千人的大场面。

范浩强的另一个爱好则是猫。但因为害怕养死,他选择做一名 云吸猫 爱好者。

毕竟,范浩强自称 0~24 点都可能在工作 ,恐怕是没有时间铲屎的。

因此,他甚至连招聘都在想,可以优先招家里有猫的同学,这样可以方便的借机撸猫。

One More Thing

最后,范浩强给想要从事 AI 技术的年轻人一条忠告:

弄斧要去班门,做 AI 要去专业公司。

他曾经作为面试官向候选人提问如何完成一类产品,候选人反复论证,认为产品无法完成,因为需要的样本量太大。

但这类产品在旷视已经商业化了。有赖于旷视 Data++ 的功劳,数据的标注和管理都不是问题。

这个数量的样本,直接去 Data++ 提需求啊 范浩强说, 当你没有见过一个以非常高的效率做 AI 的团队和公司体系的样子的时候,你是想象不到你能做到什么的。

对于旷视而言,整个旷视研究院有多个像范浩强团队这样的研发大组,有众多集天分与努力于一身的技术人才,正是 AI 界的 班门 ,最当 弄斧 于此。

而这一点,在任何领域都是适用的。

量子位QbitAI 头条号签约作者

赞助本站

人工智能实验室

相关热词:

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港