从复旦启程,走向宇宙,又重归复旦
复旦大学实在具身智能相干院
相干员吴祖煊
活跃在东说念主工智能与具身智能相干前沿
他专注于将智谋赋予机器东说念主“形骸”
教机器“看懂”宇宙、学会“脱手”
因材施教,经心培育学科交叉东说念主才
用行动解说额外真谛真谛师者的面容
“具身智能面前还处于比拟早期的阶段”
这位90后海归后生正以温柔和立异
探索将来机器东说念主的无限可能

在“玩玩物”中,
为机器东说念主打造超等“大脑”
湾谷科技园,吴祖煊的实验室,像是一个充满渴望的小型儿童乐土。
实验台上铺满五颜六色的生果模子、组装玩物,团队最近的一个通俗责任,就是像“带小孩”雷同,教机器东说念主如何“玩转”这些玩物。


湾谷科技园内吴祖煊团队实验室
算作筹画机视觉与多模态东说念主工智能限度的后生科研东说念主员,吴祖煊的科研主义巨大且求实:一方面股东筹画机瓦解和生成视频的技能雠校;另一方面,通过这些生成的视频磨真金不怕火机器东说念主,为其赋予“读懂宇宙”的智谋,从而信得过买通杜撰宇宙与物理宇宙的桥梁。
“面前能跑步、舞蹈的机器东说念主天然炫酷,但它们大多只具备箝制体魄的‘小脑’,还远未领有能杀青复杂任务的‘大脑’。”吴祖煊指出现时具身智能的瓶颈,“要是你让机器东说念主下楼去买一杯咖啡,它需要懂得旅途蓄意、学会按电梯、致使与东说念主疏导。对它们而言,完成这一系列门径仍挑战巨大。”

如何铸造机器东说念主的超等“大脑”,恰是现时具身智能机器东说念主限度濒临的中枢挑战。要处治这个贫苦,时常需要海量的数据算作撑持。
数据汇注并不是一件容易的事。“面前具身智能限度最大的贫苦其实就是数据汇注。一百条数据,疏忽只可维持机器东说念主完成一个任务。”吴祖煊解释,传统的作念法,需要工程师手把手教育,比如演示拿水杯、擦盘子,这不仅动作数据汇注本钱腾贵,且面对不同场景、不同动作,东说念主工汇注更是耗时耗力。
面对这一窘境,吴祖煊团队别具肺肠:要是视频生成模子填塞坚强,就能够生成海量的操作视频,平直算作磨真金不怕火数据,从而替代掉繁琐的东说念主工汇注。基于此,他们自主研发了高效可控的视频生成与剪辑模子,为机器东说念主进化提供冉冉连接的数据粮食。

基于东说念主类演示视频(左)和生成模子合成机械臂视频(右),最终部署在真机上(中)
吴祖煊团队近期构建了一个旨在擢升视频生见遵循的模子。这个模子有一个充满奥妙颜色的名字——“reducio”,取自《哈利波特》演义中的魔法咒语“松开咒”,精确解说了模子对极致压缩的追求。与sora等追求巨大后果的模子不同,reducio的特质就一个字——快。通过立异编码门径,reducio能将原始视频压缩4000多倍,杀青超高压缩后果。团队论文发表时,reducio能在单张a100gpu上,用16秒生成1k分裂率的视频,这是那时全球最快的记录。
有了海量的仿真数据,如何让这些仿真数据简直地作用于物理宇宙?履行的灵感,来自吴祖煊两岁的孩子。伴随孩子玩组装玩物时,他发现,孩子能放肆拼好的柠檬积木,对机器东说念主而言却极具挑战。即即是最浅薄的“瞄准、拼合”动作,也波及雅致的触觉、力度和空间判断,这恰是现时机器智能的盲区。
看似“玩耍”的磨真金不怕火,实则是在磨真金不怕火机器东说念主的“大脑”,这关乎它们能否在工场进行精密安装,能否信得过融入东说念主类生存。吴祖煊憧憬着:“大脑”发挥的机器东说念主,有望颠覆将来的工业场景。
“中国产业链和诈骗场景极其丰富,这意味着咱们在数据资源方面领有独到上风。”吴祖煊先容,面前团队已与行业头部企业等伸开调和,采集简直产线数据。他预言,将来3-5年,机器东说念主有望在精密安装限度有所算作,信得过成为东说念主类的过劲助手。
从产业界跨向学术界,
只因可爱目田相干
chatgpt、豆包、sora……近几年,东说念主工智能(ai)无疑是科技限度最火热的要道词。应答媒体上,ai生成的视频果决劈头盖脸。
“今天东说念主工智能行业的发展,应该是统统从业者王人莫得猜想的。”从学生到科研责任者,吴祖煊十余年一直扎根于筹画机限度,专注于筹画机视觉和深度学习相干。他的团队在ai限度中获取了好多迫害性责任,产出的开源数据集、模子等,也曾悄然运行在了华为、字节进步等企业家具中。
选拔筹画机专科,深耕东说念主工智能限度,似乎是又名理工科“学霸”的法式进阶之路。但驱动吴祖煊的,并非追寻热门,而是那份自幼萌生的纯正兴味。
“我疏忽在小学三年事就开动构兵编程了,”他回忆。小学时有电脑课,跟从指示在屏幕上绘制的“小乌龟”,发蒙他插足代码宇宙。到了初中,他已开动自学制作网页,捣饱读flash动画,电脑对他而言,是一个能创造无限可能的奇妙用具。
2009年,他考入华东师范大学。2013年插足复旦大学读研,恰逢深度学习波澜兴起,他成为最早将深度学习诈骗于视频分析的相干者之一。
2018年参加海外筹画机视觉与模式识别大会(cvpr)并栽植论文
而后,他远赴好意思国马里兰大学攻读筹画机科学博士学位。时刻,他专注于动态神经汇注加快相干,芜俚来说,就是让筹画机“几分钟看完一部电影”——通过瓦解几帧画面便能快速掌持长视频内容。
他曾先后在ibm、salesforce和facebook等顶尖科技企业实习和责任。然而,产业界的环境和节拍让他感到了相干受限——经济向好时,公司快意在相干限度投资,饱读吹群众目田探索;一朝场所变化,相干限度的投资就会收缩。他渴慕的,是能长久跟班兴味,在筹画机前沿相干的无东说念主区目田行走。
于是,吴祖煊作念出了一个在旁东说念主看来有些“淘气”的决定:归国找教职,况兼只向复旦大学投出了一份简历。“没想昔日其他院校吗?”“莫得,只研讨了复旦。”问及原因,他笑着恢复:“可能纯正就是一种理性。”
这份“理性”,偶然正来自于母校赐与的包摄感。2021年,他称愿回到复旦。他在复旦找到了科研的振作,既能目田探索前沿,又能将立异的种子通过教学学生播种出去。

本年3月,复旦修复实在具身智能相干院,专注具身智能的前沿相过问诈骗落地,吴祖煊是中枢成员之一。“复旦为后生老诚提供了好多维持,包括千般基金样式、额外东说念主才维持蓄意等。在这里,咱们能够专心作念科研。”他说。
精雕细镂作念科研,
开垦具身智能的将来
吴祖煊的个东说念主主页上了了写着:“我面前正在寻找具备坚强编程智力、热衷于遐想视觉瓦解算法的学生”,邀请智力额外的学生加入他的课题组。而为了培养好“后浪”们,他也不遗余力给群众提供更好的平台。
“精雕细镂”,长久是吴祖煊践行的科研理念。他对论文的条件很高,毫不浅尝辄止。面对学生交上来的课题,要是有值得深远的处所,他就会饱读吹学生接续“挖一挖”,把论文举座质料再往上提高一个端倪。

2024年提示学生参加海外筹画机视觉与模式识别大会(cvpr)
恰是在这种理念的浸润中,吴祖煊团队的相干责任硕果累累。本年10月,筹画机视觉限度顶尖会议iccv在好意思国夏威夷举办,吴祖煊团队多篇著述经大家严格评审后被托福。
如今,吴祖煊带了多名博士生在具身智能前沿限度开展相干。几年来,每玉成少一次、每次半小时以上的一双一式组会,已成为他们课题组的传统。吴祖煊喜欢与学生深远谈论,而非经常开大型组会。在他看来,只好坐下来面对面,才能信得过听懂每个东说念主在琢磨什么、卡在那儿。这种花样让他能摸准每个学生的特性和念念路,为他们量身定制培养有蓄意。
对待基础塌实的学生,他会饱读吹他们目田相干探索;对待程度较慢的学生,他会主动推一把,协助他们蓄意相干旅途。他的办公室随时对学生掀开,只须学生有问题,随时王人能与他疏导。

“吴老诚对我的匡助很大,”行将毕业的博士生陈昊然共享,刚读博时,他在去企业劳动和作念学术之间扭捏不定,“我找吴老诚聊了好屡次,他一直指导着我、饱读吹我尝试走符合我方的科研说念路,告诉我怎么样去成为一个好的科学家。在他的影响下,我败坏笃定下来要去作念科研。”
“现实上,具身智能面前还在一个比拟早期的阶段。”吴祖煊期待,团队将来能够生成并提供更优质的数据,更精确地箝制机器东说念主并猜测动作,更能让一个模子在不同场景下撑持不同机器东说念主骨子完成多样雅致化的动作。
跟着机器东说念主的智能化水平越来越高,吴祖煊有着更巨大的联想:“下一代东说念主工智能,偶然能够像孩子雷同,跟环境进行交互学习,杀青自主学习。”而他,正像一位伴随孩子“长大成东说念主”的家长,在为机器东说念主“注入智谋”的漫漫长路上,以一颗小儿之心,刚烈不移地求索着。
组稿
校融媒体中心
翰墨
殷梦昊邓晗
图片
李婉菲
郑艺
责编
殷梦昊
上不雅号作家:复旦大学