Discuz! Board

搜索
熱搜: 活動 交友 discuz
查看: 4|回復: 0

里我们要先引入

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-4-8 14:14:53 | 顯示全部樓層 |閱讀模式
来解决计算成本高昂的问题。 这 “len  潜这一概念它是一种 “ 降维  或者说是 “ 压缩意在用更少的信息去表达信息的本质。我们列举一个不恰当但好理解的例子这就好像我们用一个三视图就能保存记录一个简单的立体物体的结构而非一定要保存这个立体本身。 enI 为此开发了一个视频压缩网络把视频先降维到潜空间然后再去拿这些压缩过的视频数据去生成he这样就能使输入的信息变少有效减小rnfrer 架构带来的计算量压力.如此一来大部分问题就都解决了enI 成功地把文生视频模型套进了其在


过去取得巨大成功的大语言模型的范式里所以效果想不好都难。除此之外enI 在训练上的路线选择也稍有不同。他们选择了 “ 原始尺寸、时长  训练而非业内常用的 “ 把视频截取成预设标准尺寸、时长 亚美尼亚 手机号码 后再训练。这样的训练给 r 带来了诸多好处 ①生成的视频能更好地自定义时长 ②生成的视频能够更好地自定义视频尺寸 ③视频会有更好的取景和构图 前两点很好理解第三点 enI 给出了范例他们做了一个截取尺寸视频训练和原始尺寸视频训练的模型对比 左侧为截取尺寸视频训练后模型生成的视频右




侧为原始尺寸视频训练后模型生成的视频 另外为了文生视频能够更好地理解用户的意图达到更好的生成效果enI 也在 r 模型上加入了一些巧思。首先训练 r 这样的文生视频模型需要大量含有文本说明的视频素材所以 enI 利用自家 LL·E 的 re-inin 功能给训练用的视频素材都加上了高质量文本描述他们表示这样可以提高输出视频的整体质量。除了训练端在输入端他们也动了脑筋用户输入的提示词并非直接交给r 进行生成的enI 利用了  的能力在用户给 r 输入提示词的时候 会先将用户输入的提示词进行精准的详尽扩写然后再将扩写后的提示词交给 r这样能更好地让 r 遵循提示词来生成更精准的视频。好了到这里我们对 r 模型为什么看起来更强的简要解析就结束了。从整体

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇

GMT+8, 2024-11-29 04:31 , Processed in 0.689827 second(s), 21 queries .

抗攻擊 by GameHost X3.4

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |