专题论坛

世界模型专题论坛

论坛主持人

刘利刚
中国科学技术大学
个人简介:刘利刚,中国科学技术大学数学科学学院教授,国家自然基金委“杰出青年”获得者。于2001年在浙江大学获得应用数学博士学位,从事计算机图形学及CAD/CAE研究。于2023年获得首届SIGGRAPH Asia时间检验奖 (Test-of-Time Award)。任中国工业与应用数学学会几何设计与计算专业委员会 (CSIAM GDC) 主任、计算机学会计算机辅助设计与图形学专委会常务委员、国际几何建模与处理(GMP)协会指导委员会委员、亚洲图形学协会(Asiagraphics)秘书长。

观点嘉宾

黄劲

浙江大学

杜韬

清华大学

陶鑫

快手

李鸿升

香港中文大学

观点嘉宾:黄劲
报告题目:基于物理模拟的数据生成
嘉宾简介:黄劲博士,浙江大学教授,主要研究计算机图形学中几何计算以及物理模拟方面的课题,2015年获国家优秀青年基金资助。研究受国家自然科学基金、通用汽车等项目的资助。取得的成果包括数十篇国际顶级学术期刊论文,目前担任国际期刊CAGD的Associated Editor,曾担任包括ACM SIGGRAPH在内的一些著名国际学术会议的程序委员会委员,SCA、GMP等国际会议的论文共同主席。
观点嘉宾:杜韬
报告题目:Deep Learning for Physics Simulation
嘉宾简介:杜韬,清华大学交叉信息研究院助理教授,博士生导师。杜韬博士毕业于麻省理工学院计算机图形学实验室,主要研究方向为图形学中的物理仿真与计算设计。他的研究工作发表在计算机图形学和机器学习领域顶级期刊和会议(ACM TOG, SIGGRAPH North\nAmerica/Asia, ICLR, ICML, NeurIPS)上,并受到多家知名科技媒体(WIRED,MIT News, IEEE Spectrum, TechCrunch等)的关注与报道。此外,他多次担任SIGGRAPH North America/Asia技术论文程序委员会委员并多次获评NeurIPS/ICML优秀审稿人。
观点嘉宾:陶鑫
报告题目:通用视频生成模型中的世界知识
嘉宾简介:陶鑫,快手视觉生成与互动中心(KwaiVGI)专家研究员,目前负责“可灵Kling”视频生成基础模型部分的算法研发。本科毕业于上海交通大学,博士毕业于香港中文大学,师从贾佳亚教授,研究方向主要包括图像视频修复和视觉生成。发表视觉论文30余篇,引用4000余次。
观点嘉宾:李鸿升
报告题目:Lumina-mGPT : 基于(多模态)自回归模型的任意分辨率图片生成
嘉宾简介:李鸿升,现任香港中文大学多媒体实验室副教授,上海人工智能实验室顾问科学家,上海交通大学、中国科学技术大学兼职博士生导师。2006年获华东理工大学自动化学士学位,2012年获得美国理海大学计算机科学博士学位。他在计算机视觉、机器学习、医学图像处理顶级期刊和会议上(TPAMI、CVPR、ICCV、ECCV、NeurlPS、ICLR、MICCAI、IPMI等)发表论文180余篇,获得了2020年IEEE电路与系统协会杰出青年作者奖、2022-2023年AI 2000人工智能最具影响力学者提名奖、2022-2023年全球前2%顶尖科学家、2021年香港中文大学青年学者杰出研究成就奖等奖项。2016年带领团队参加ImageNet 2016国际挑战赛,赢得了视频物体检测项目第一名。他担任国际顶级学术会议NeurIPS 2021-2023、CVPR 2023、ICCV 2023、ICML 2023-2024、ACM MM 2024领域主席,AAAI 2022高级程序委员,国际期刊IEEE Transactions on Circuits and Systems for Video Technology、Neurocomputing的副编辑。

具身智能专题论坛

论坛主持人

谭平
香港科技大学
个人简介:谭平,香港科技大学电子与计算机工程系教授。曾担任阿里巴巴达摩院XR实验室负责人,人工智能实验室计算机视觉首席科学家,加拿大西门菲莎大学(SFU)、新加坡国立大学(NUS)副教授。他的研究领域是计算机视觉和图形学。他于2012在CVPR大会上获得Young Researcher Award提名奖,2014年获得加拿大自然科学基金DAS奖。他曾担任计算机视觉领域两大期刊TPAMI、IJCV的副主编,并长期担任CVPR、ICCV、ECCV、SIGGRAPH、IROS等计算机视觉、图形学、机器人领域顶会的领域主席。

观点嘉宾

罗平

香港大学

弋力

清华大学

顾家远

上海科技大学

梁俊卫

香港科技大学(广州)

观点嘉宾:罗平
报告题目:基于多模态大模型的具身智能
嘉宾简介:罗平,香港大学计算机科学系副教授,港大-上海人工智能实验室联合研究所执行主任,香港大学数据科学研究院副院长。2014 年获香港中文大学信息工程系博士,师从汤晓鸥教授。发表TPAMI、ICML、ICLR、NeurIPS、CVPR 等国际会议及期刊论文100余篇,谷歌学术引用55000+。曾获2015 AAAI Easily Accessible Paper 、2022 Computational Visual Media Journal年度最佳论文提名,2022 ACL 杰出论文,2023世界人工智能大会优秀青年论文,ICCV 2023最佳论文候选。获 2020《麻省理工科技评论》亚太区 35 岁以下创新者(MIT TR35)。曾指导 20+位博士生,其中多人获重要奖项如 Nvidia Fellowship, Baidu Fellowship, WAIC 云帆奖等。
观点嘉宾:弋力
报告题目:视频驱动的灵巧手通用操作学习
嘉宾简介:弋力博士现任清华大学交叉信息研究院助理教授。他在斯坦福大学取得博士学位,导师为美国三院院士Leonidas J. Guibas教授,毕业后在谷歌研究院任研究科学家。他近期的研究聚焦于三维视觉与具身智能,他的研究目标是赋予机器人理解并与三维世界交互的能力。他在计算机顶级会议期刊上已发表论文六十余篇,引用数两万余次,代表作品包括ShapeNet Part,SyncSpecCNN,PointNet++等,大大影响了三维深度学习这一领域的出现与发展。此外他还多次担任CVPR、IJCAI、NeurIPS等人工智能领域顶会的领域主席。
观点嘉宾:顾家远
报告题目:服务于具身智能的数字孪生
嘉宾简介:顾家远,上海科技大学信息科学与技术学院助理教授,博士生导师。博士毕业于加州大学圣地亚哥分校(UCSD),师从苏昊教授。2018年本科毕业于北京大学信息科学技学院智能科学系。研究方向为具身智能,聚焦于服务于具身智能的三维视觉和可泛化的机器人决策模型,在计算机视觉、机器学习、机器人等国际顶级学会会议(CVPR,NeurIPS,ICLR,ICRA等)上均有发表。参与的项目Open X-Embodiement获得了ICRA 2024的Best Paper Award。同时,他也担任相关领域会议的审稿人,并在RSS,ECCV,CVPR等学术会议上组织过相关的研讨会和教程。
观点嘉宾:梁俊卫
报告题目:Towards General Service Embodied AI
嘉宾简介:梁俊卫,香港科技大学(广州)人工智能学域助理教授/副研究员/博士生导师,创立并领导智能感知与预测实验室,卡内基梅隆大学计算机博士,曾获得百度奖学金(全球10名),雅虎奖学金,世界人工智能大会明日之星云帆奖,研究工作曾被包括美国华盛顿邮报、纽约时报以及机器之心等媒体报道。研究内容包括计算机视觉与具身智能,近五年内于CVPR、TPAMI、NeurIPS等国际顶级期刊会议发表论文30余篇,谷歌学术引用量1500余次, h-index 17,组织举办顶级会议CVPR 2023、2024的Precognition Workshop;主持国自然青年基金、两项广州市科技局课题、两项校级课题、美团机器人研究院、华为课题等近两百万元的科研项目,并参与科技部国家重点研发计划。

2023年议题回顾:3D-AIGC

论坛主持人

韩晓光
香港中文大学(深圳)
个人简介:韩晓光博士,现任香港中文大学(深圳)理工学院助理教授,校长青年学者。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文近100篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。多次担任CVPR、NeurIPS以及ECCV等领域主席,同时也是IEEE TVCG 的编委。他的工作曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet),曾两次入选CVPR最佳论文列表。

观点嘉宾

曹炎培

VAST

刘天添

太极图形

姚遥

南京大学

龙霄潇

香港科技大学

张启煊

影眸

观点嘉宾:曹炎培
报告题目:三维内容生成中的神经网络架构探索
嘉宾简介:曹炎培,2009-2013年,于清华大学计算机科学与技术系本科学习,获多次校级奖项。2013-2018年,继续攻读博士学位,师从胡事民院士,专注计算机图形学与三维视觉,期间赴德国RWTH Aachen University交流,获Pacific Graphics 2014最佳论文奖。 在三维数字化、几何建模、生成式AI及真实感渲染等方面的研究成果,多次在SIGGRAPH、CVPR等顶级会议和期刊发表,累计引用1200余次。共同创立3D生成式AI开源项目threestudio,荣获2023年度CCF优秀项目奖。 2017-2019年间作为创业公司Owlii的创始团队成员及CTO,开发高精度实时动态3D重建、压缩与传输系统,并成功应用于CES、SIGGRAPH等国际展会及天猫双十一等大型活动(Owlii公司于2019年被快手收购)。2019-2021年,快手Y-tech高级研究员,开发低成本视觉动作捕捉系统、4D人脸几何和材质重建lightstage的软硬件系统,跨平台服务快手App等业务。2021-2023年,腾讯AI Lab和PCG ARC Lab专家研究员(T12)、三维方向负责人,负责三维数字化和三维生成方向的研究。2023年-今,VAST公司首席科学家。
观点嘉宾:刘天添
报告题目:Meshy 在 3D 生成任务上的探索与进展
嘉宾简介:刘天添,太极图形首席研究科学家,于宾夕法尼亚大学大学获取博士学位并曾任职微软亚洲研究院网络图形组副研究员。刘天添博士于2021年加入太极图形,负责管理公司研发小组,参与太极编程语言新特性的研发,主导了 MeshTaichi,DiffTaichi 2.0 等工作,目前负责公司的 3D AIGC 项目 meshy.ai 的开发。他的研究兴趣主要是实时物理仿真与几何处理、高性能数值方法、高性能编程、可微编程等,其相关工作多发表于计算机图形学期刊中,其中被顶级期刊 ACM Transactions on Graphics 收录十余篇。
观点嘉宾:姚遥
报告题目:可拓展三维生成:数据、数据与数据
嘉宾简介:姚遥,南京大学智能科学与技术学院准聘副教授、博士生导师,国家级人才计划青年项目入选者。曾任Altizure创始团队核心成员,后随公司收购加入苹果,任苹果公司高级研究员。2015年于南京大学获学士学位,2019年于香港科技大学获博士学位(博士导师:权龙教授)。主要研究方向为三维重建、可微渲染及三维内容生成,代表性工作包括MVSNet系列工作、NeILF系列工作以及Direct3D系列工作,曾获2020年国际模式识别大会最佳学生论文奖。现作为项目负责人承担国家自然科学基金优秀青年科学基金(海外)项目、国家自然科学基金委专项项目(元宇宙专项)以及科技部重点研发计划课题。
观点嘉宾:龙霄潇
报告题目:闭源潮流下 三维基座模型路在何方
嘉宾简介:龙霄潇,香港科技大学博士后。2023年博士毕业于香港大学,2018年本科毕业于浙江大学。主要研究方向为3D内容生成、神经渲染、3D曲面建模、基于图像的深度/法向估计、基于图像的3D重建。在TPAMI、CVPR、ICLR、ICCV、ECCV等顶会顶刊发表论文二十余篇。主要有Craftsman3D、Wonder3D、SyncDreamer、SparseNeuS、GeoWizard、GaussianPro等3D AIGC、重建、渲染工作。
观点嘉宾:张启煊
报告题目:3D生成离3D行业仅差的最后十万八千里
嘉宾简介:张启煊,影眸科技CTO,上海科技大学在读。推出Rodin Gen-1、ChatAvatar等3D生成工具,十余项工作被SIGGRAPH接收,曾获SIGGRAPH最佳论文提名两项。
©2024 GAMES