本期为青源LIVE第49期线上直播活动,参与直播互动有惊喜🎁

d5d48f7de423e2564926bbb2688f2bb3.png

此前,微软亚洲研究院提出了多模态模型 NUWA,它可以基于给定的文本、视觉或多模态输入生成图像或视频,并支持多种视觉艺术作品创建任务,包括文本到图像或视频的生成、图像补全、视频预测等。近日,微软亚洲研究院公开发表了新的研究成果:NUWA 的升级版——无限视觉生成模型 NUWA-Infinity,让视觉艺术创作趋于“无限流”,可生成任意大小的高分辨率图像或长时间视频。本期青源LIVE49期邀请了微软亚洲研究院高级研究员吴晨飞详细解析NUWA-Infinity。

357dd1e02aacb13af3dfd11a09142985.jpeg

主讲人:吴晨飞,北京邮电大学计算机博士,现任微软亚洲研究院高级研究员,研究方向包括跨模态理解和跨模态生成。目前主要关注高质量可控图像和视频生成。

报告主题:NUWA-Infinity(女娲无限版)

报告摘要:本次分享介绍 NUWA-Infinity(女娲无限版),它可以生成任意大小的超高分辨率图像和视频。 我们提出了一种全局自回归嵌套局部自回归的生成机制,通过全局自回归建模视觉块之间的依赖关系,和局部自回归建模视觉词之间的依赖关系。这种设计使得NUWA-Infinity能够生成全局一致且局部细节的高质量图像和视频。本次将展示NUWA-Infinity的强大的生成能力,包括生成长度超过30000像素的清明上河图或者超过1080p的超高清视频。

活动时间:9月14日(周三)15:30

活动形式:线上直播,扫描下方二维码报名

8ab47fe4a3486cf508c0fa974265d78b.png

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐