活动报名 | 无限视觉生成模型NUWA-Infinity，可生成超3万像素清明上河图

本期为青源LIVE第49期线上直播活动，参与直播互动有惊喜????！此前，微软亚洲研究院提出了多模态模型 NUWA，它可以基于给定的文本、视觉或多模态输入生成图像或视频，并支持多种视觉艺术作品创建任务，包括文本到图像或视频的生成、图像补全、视频预测等。近日，微软亚洲研究院公开发表了新的研究成果：NUWA 的升级版——无限视觉生成模型 NUWA-Infinity，让视觉艺术创作趋于“无限流”，可生成

智源社区

1206人浏览 · 2022-09-12 16:03:05

智源社区 · 2022-09-12 16:03:05 发布

本期为青源LIVE第49期线上直播活动，参与直播互动有惊喜🎁！

此前，微软亚洲研究院提出了多模态模型 NUWA，它可以基于给定的文本、视觉或多模态输入生成图像或视频，并支持多种视觉艺术作品创建任务，包括文本到图像或视频的生成、图像补全、视频预测等。近日，微软亚洲研究院公开发表了新的研究成果：NUWA 的升级版——无限视觉生成模型 NUWA-Infinity，让视觉艺术创作趋于“无限流”，可生成任意大小的高分辨率图像或长时间视频。本期青源LIVE49期邀请了微软亚洲研究院高级研究员吴晨飞详细解析NUWA-Infinity。

主讲人：吴晨飞，北京邮电大学计算机博士，现任微软亚洲研究院高级研究员，研究方向包括跨模态理解和跨模态生成。目前主要关注高质量可控图像和视频生成。

报告主题：NUWA-Infinity（女娲无限版）

报告摘要：本次分享介绍 NUWA-Infinity（女娲无限版），它可以生成任意大小的超高分辨率图像和视频。我们提出了一种全局自回归嵌套局部自回归的生成机制，通过全局自回归建模视觉块之间的依赖关系，和局部自回归建模视觉词之间的依赖关系。这种设计使得NUWA-Infinity能够生成全局一致且局部细节的高质量图像和视频。本次将展示NUWA-Infinity的强大的生成能力，包括生成长度超过30000像素的清明上河图或者超过1080p的超高清视频。

活动时间：9月14日（周三）15：30

活动形式：线上直播，扫描下方二维码报名