主题 | Data Intelligence Group

# 主题

Generate Anything: Learning to Generate Things and Stuff

# 主讲人

国家级青年人才唐浩

# 报告摘要

在图像到图像的转换问题中，我们的目标是将图像从一个域转换到另一个域。计算机视觉、图形和图像处理中的许多问题都可以表述为图像到图像的转换任务，包括语义图像合成、风格转换、着色、草图到照片等。这些图像到图像的转换问题的扩展涉及有助于实现可控转换的额外指导。指导通常反映用户指定的所需视觉效果或约束。此任务有许多应用场景，例如人机交互、娱乐、虚拟现实和数据增强。然而,这项任务具有挑战性,因为它需要对输入域和输出域之间的图像映射有高级语义理解。在本次演讲中，我将介绍如何使机器能够根据不同的指导形式(例如面部标志、分割图或人体骨骼)生成人脸、手、身体和自然场景的图像。我还将谈论我未来的研究计划,即结合文本、音频、图像、视频和3D对象等多模态来构建“AI生成系统”。

# 嘉宾简介

唐浩，国际级青年人才。美国卡耐基梅隆大学(CMU)机器人研究所的博士后研究员。在此之前，他在瑞士苏黎世联邦理工学院(ETHZurich)计算机视觉实验室(CVL)的担任博士后研究员,师从Luc Van Gool教授。他于2021年在意大利特伦托大学博士毕业,师从Nicu Sebe教授。在此之前，他于2016年获得北京大学硕士学位。在攻读博士学位期间，唐浩博士先后在英国牛津大学(Philip Torr教授)、阿联酋的IAI研究院进行了学术访问和实习。唐浩博士主要专注干计算机视觉、机器学习、多媒体以及科学领域的人工智能研究。在博士和博士后研究期间，他针对图像合成和多模态合成等领域，开发了一系列创新技术。他在国际顶级会议和期刊上发表了100多篇论文，包括CVPR、ECCV、ICCVNeurIPS、ICLR、ICML、TPAMI、IJCV等。他的研究工作获得了多项荣誉，其中包括ACMMM 2018最佳论文提名奖(提名率仅为4/757)。

[Slides & Video]