Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点-北冰洋礼仪网

当前位置：首页 > 行业

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

来源：站长之家发布时间：2023-04-20 18:07:11

【资料图】

编程客栈（）4月20日消息:Nvidia公布了其基于Stable Diffusion 模型开发的文本转视频模型—— Nvidia Video LDM。Nvidia通过对现有模型的微调，大大减少了生成视频的过程和时间。

该模型增加了一个时间维度，可以在多个帧上实现时间对齐的图像合成。该团队训练了一个视频模型，以512x1024像素的分辨率生成几分钟的汽车行驶视频，在大多数基准测试中达到SOTA。

注：图片来自Nvidia Video LDM项目截图

除了这个与自动驾驶研究特别相关的演示之外，研究人员还展示了如何将现有的Standroidable Diffusion 型转换为视频模型。

该团队在微调步骤中用视频数据短时间训练Stable Diffusion，然后在网络中每个现有空间层后面添加额外的时间层，并用视频数据对其进行训练。此外，该团队还训练了时间稳定的放大器，以根据文本提示生成1，280x2，048分辨率的视频。

以 Stable Diffusion 作为视频模型的基础，团队无需从头开始训练新模型，可以从现有的能力和方法中获益。例如，尽管使用的 WebVid-10M 数据集仅包含真实世界的视gHflZh频，基于底编程层的Stable Diffusion模型，该模型也可以生成艺术视频。所有视频的长度都在3.8到4.7秒之间——具体取决于帧速率。

研究团队还该展示如何使用 Dreambooth 对视频模型进行个性化设置。，生成包含不属于原始训练数据的对象的视频。这为内容创作者开辟了新的可能性，他们可以使用 DreamBooth 进行视频创作。

注:Dreambooth 是对整个神经网络所有层权重进行调整，会将输入的图像训练进 Stable Diffusion 模型，它的本质是先复制了源模型，在源模型的基础上做了微调（fine编程客栈tunning）并独立形成了一个新模型。

Nvidia Video LDM项目页面上有更多示例，不过该模型目前尚未对外开放。

项目网址:https://research.nvidia.com/labs/toronto-ai/VideoLDM/

关键词：

一月一度招聘会为用人单位与求职人员搭建“双向选择”平台

大宗商品需求放缓引发抛售澳大利亚矿商股价大幅下跌

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

行业

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

南阳市淅川县西簧乡初中召开师德师风暨安全工作推进会_当前速讯

【全球速看料】房企化债倒计时：9000亿债务压顶，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股涉资约20.24万港元

焦点速讯：遴选考试面试技巧：带你走进言语题目的秘密

刘强东回归烧了三把火想抢回被拼多多“劫走”的用户

血污夜之仪式名刀获得方式攻略世界今日讯

新华视点｜中国经济走稳向好——解读一季度经济数据亮点

校、园携手，成都三十八幼行知园区科学助力“幼小衔接”

桂林旅游4月20日盘中跌幅达5%

世界热议:《“十四五”中医药文化弘扬工程实施方案》公布

雷神加速器怎么修复lsp 怎么修复lsp:天天即时

中国华融起诉德宝地产前CEO袁乐生要求偿还2.84亿美元

大行评级 | 高盛：料汇控首季基本税前盈利同比升50% 维持“买入”评级天天热点评

世界聚焦：汶川县气象台发布雷电黄色预警信号【III级/较重】

环球精选！怀孕期间孕妇感冒咳嗽怎么办?_怀孕时孕妇感冒咳嗽了怎么办

每日讯息!NBA季后赛，太阳为何逆转快船？球迷给出答案，且大局已定

热推荐：问道小熊在哪个区_问道小熊

融创房地产：免去两名董事职务|重点聚焦

全球观热点：“冰篮”场地4小时切换、综合耗水量降低20％……这些大运会场馆充满高科技

实时焦点：西安铁道职业学校怎么样啊_西安铁道职业学校怎么样

水滴公司最新股权曝光：CEO沈鹏持股25.2%拥72.1%投票权_世界快看点

古人“高考”可比现在疯狂多了，看看古人为了高中都是怎么做的，沾沾喜气！|天天热讯

世界最资讯丨英科再生：2022年度净利润约2.31亿元，同比下降3.76%

多主力现身龙虎榜，焦点科技涨停（04-19）

一月一度招聘会为用人单位与求职人员搭建“双向选择”平台

大宗商品需求放缓引发抛售澳大利亚矿商股价大幅下跌

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

南阳市淅川县西簧乡初中召开师德师风暨安全工作推进会_当前速讯

【全球速看料】房企化债倒计时：9000亿债务压顶，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股涉资约20.24万港元

焦点速讯：遴选考试面试技巧：带你走进言语题目的秘密

Nvidia公布新文本转视频模型 基于Stable Diffusion开发！ 全球观焦点

Nvidia公布新文本转视频模型 基于Stable Diffusion开发！ 全球观焦点

南阳市淅川县西簧乡初中召开师德师风暨安全工作推进会_当前速讯

【全球速看料】房企化债倒计时：9000亿债务压顶 ，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股 涉资约20.24万港元

焦点速讯：遴选考试面试技巧：带你走进言语题目的秘密

刘强东回归烧了三把火 想抢回被拼多多“劫走”的用户

血污夜之仪式名刀获得方式攻略 世界今日讯

新华视点｜中国经济走稳向好——解读一季度经济数据亮点

校、园携手，成都三十八幼行知园区科学助力“幼小衔接”

桂林旅游4月20日盘中跌幅达5%

世界热议:《“十四五”中医药文化弘扬工程实施方案》公布

雷神加速器怎么修复lsp 怎么修复lsp:天天即时

中国华融起诉德宝地产前CEO袁乐生 要求偿还2.84亿美元

大行评级 | 高盛：料汇控首季基本税前盈利同比升50% 维持“买入”评级 天天热点评

世界聚焦：汶川县气象台发布雷电黄色预警信号【III级/较重】

环球精选！怀孕期间孕妇感冒咳嗽怎么办?_怀孕时孕妇感冒咳嗽了怎么办

每日讯息!NBA季后赛，太阳为何逆转快船？球迷给出答案，且大局已定

热推荐：问道小熊在哪个区_问道小熊

融创房地产：免去两名董事职务|重点聚焦

全球观热点：“冰篮”场地4小时切换、综合耗水量降低20％……这些大运会场馆充满高科技

实时焦点：西安铁道职业学校怎么样啊_西安铁道职业学校怎么样

水滴公司最新股权曝光：CEO沈鹏持股25.2%拥72.1%投票权_世界快看点

古人“高考”可比现在疯狂多了，看看古人为了高中都是怎么做的，沾沾喜气！|天天热讯

世界最资讯丨英科再生：2022年度净利润约2.31亿元，同比下降3.76%

多主力现身龙虎榜，焦点科技涨停（04-19）

一月一度招聘会为用人单位与求职人员搭建“双向选择”平台

大宗商品需求放缓引发抛售 澳大利亚矿商股价大幅下跌

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年 进口规模首次突破万亿元

Nvidia公布新文本转视频模型 基于Stable Diffusion开发！ 全球观焦点

南阳市淅川县西簧乡初中召开师德师风暨安全工作推进会_当前速讯

【全球速看料】房企化债倒计时：9000亿债务压顶 ，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股 涉资约20.24万港元

焦点速讯：遴选考试面试技巧：带你走进言语题目的秘密

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

【全球速看料】房企化债倒计时：9000亿债务压顶，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股涉资约20.24万港元

刘强东回归烧了三把火想抢回被拼多多“劫走”的用户

血污夜之仪式名刀获得方式攻略世界今日讯

中国华融起诉德宝地产前CEO袁乐生要求偿还2.84亿美元

大行评级 | 高盛：料汇控首季基本税前盈利同比升50% 维持“买入”评级天天热点评

大宗商品需求放缓引发抛售澳大利亚矿商股价大幅下跌

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

Nvidia公布新文本转视频模型基于Stable Diffusion开发！全球观焦点

【全球速看料】房企化债倒计时：9000亿债务压顶，金融街单次融资175亿，金科继续违约

和谐汽车(03836.HK)回购22.4万股涉资约20.24万港元