日本 男同 Sora强敌!Meta最强千里浸式AI媒体模子来了,300亿参数模子解救Movie Gen视频
本文作家:李丹日本 男同
开始:硬AI
OpenAI的Sora迎来强敌,Meta推出堪称最先进的媒体基础模子Movie Gen。
Meta称,Movie Gen是公司“针对媒体的阻扰性生成式AI酌量”,它囊括了图像、视频和音频等模态,用户只需输入文本,就不错制作自界说的视频和声息、剪辑现存视频,以及将个东谈主图像转化为私有的视频。Movie Gen实行这些任务的表当今东谈主类评估中优于业内近似模子。
Meta先容,Movie Gen是“最先进、千里浸式效果最好的故事论述模子套件”,综合了公司第一波生成式AI媒体酌量的Make-A-Scene 系列模子,即可创建图像、音频、视频和 3D 动画的模子,以及跟着扩散模子出现而针对Llama Image 基础模子进行的第二波酌量模子,即可达成更高质料图像和视频生成以及图像剪辑的模子。
文生视频最长16秒 130亿参数音频生成模子 东谈主工评测视频生成对Sora净胜率8.2Meta概述,Movie Gen 具有四种功能:视频生成、个性化视频生成、精准视频剪辑、音频生成。
关于视频生成,Meta先容,用户只有提供一个文本的提醒词,Movie Gen就不错诳骗针对文本转图像和文本转视频进行了优化的汇注模子,创建高清的高质料图像和视频。Movie Gen的视频模子有300亿参数,这个转化模子能以每秒16帧的速率生成最长16秒的视频。
Meta称,发现这些模子不错推理物体的瓦解、拍摄主体与物体之间的相互作用,以及相机的瓦解,况兼不错学习各式成见了解有哪些合理的瓦解,因此,它们成为同类中最先进的模子。在先容该功能时,Meta展示了多个10秒长度的视频短片,包括一只像萌翻网络的弹跳猪“Moo Deng”那样的小河马游来游去。
华尔街见闻瞩目到,单从生成视频的最大长度看,Movie Gen还不敌本年2月OpenAI发布的Sora。Sora令业界轰动的少量是,不错创建长达60秒的文生视频。不外,比较Meta客岁11月官宣的视频模子Emu Video,Movie Gen如实跨越不小。Emu Video只不错每秒16帧的速率生成最长4秒的视频。
除了胜利文生视频,Movie Gen还有出色的个性化视频制作材干。Meta先容,其膨胀了前述基础模子,解救生成个性化视频。用户不错提供某个东谈主的图像日本 男同,配合文本的提醒词,让Move Gen生成的视频包含参考图像中的东谈主物,以及稳妥文本提醒的视觉细节。Meta称,在创建保留东谈主类身份和当作的个性化视频方面,其模子获得了最先进的效果。
Meta展示的一个视频自满,用户不错提供一个女孩的像片,输入笔墨“别称身穿粉色马甲的女DJ播放唱片,她身旁有一只猎豹”,然后就生成了以像片中女孩为形象的DJ打碟,以及一只猎豹奉陪。
在精准视频剪辑方面,Meta称,Movie Gen继承了吞并基础模子的剪辑变体模子,在用户输入视频和文本提醒词后,精如实行任务,生成所需的输出。它将视频生成与高等图像剪辑相联结,实行局部剪辑,举例添加、删除或替换元素,以及诸如布景或方法修改的全局改造。与需要专科技巧或缺少生成精准度的传统器具不同,Movie Gen 保留了原始实验,仅针对有关像素剪辑。
女同a片Meta提供的示例之一是,用户输入,让企鹅穿上有英国女王维多利亚在位期间衣饰作风的服装,Movie Gen生成的企鹅穿上了带蕾丝的红色女裙。
关于音频生成,Meta称,测验了一个130亿参数的音频生成模子,该模子不错收受视频和可选的文本提醒词,生成长达 45 秒的高质料高保真音频,包括环境音、拟声息效(Foley)和乐器布景音乐,统共这些都与视频实验同步。此外,Meta引入了一种音频膨胀本领,不错为纵情长度的视频生成连贯的音频,在音频质料、视频到音频对皆和文本到音频对皆方面总体上达成了最先进的性能。
Meta提供的一个例子是,生成在吉他音乐的伴奏下,全地形车(ATV)引擎轰鸣加快的声息,还有一个例子是,管弦乐声中有树叶沙沙作响和树枝撅断的声息。
Meta还展示了针对以上四种材干进行的A/B对比测试东谈主工评估范畴,下图自满的净正巧胜率代表,比较Sora等竞品模子,东谈主类评估者更喜爱Movie Gen模子生成的范畴。在胜利生成视频这个功能方面,Movie Gen比较Sora的净胜率达到8.2。
基于授权和公开可用数据测验 未明确何时发布 扎克伯格称来岁上线InstagramMovie Gen 是基于哪些信息进行测验的?Meta 的声明莫得诠释具体细节,仅仅说:“咱们基于授权和公开可用的数据集对这些模子进行了测验。”
有驳倒指出,对生成式 AI 器具而言,测验数据的开始以及从网上持取哪些数据合理仍然是有争议的问题,而且公众很少知谈使用哪些文本、视频或音频片断创建了任何大模子。
还有驳倒称,Meta说测验用的数据集是“专有/生意明锐”的,未提供细节,那么只可推测,数据包括许多Instagram 和 Facebook 平台的视频,加上一些Meta协作伙伴的实验,以过火他许多未得到充分保护的实验、也即是所谓的“公开可用”实验。
关于发布时候,Meta本周五并未明确Movie Gen何时面向众人推出,仅仅暗昧地说“可能过去发布”。本年2月OpenAI官宣Sora后迄今还未着实向公众通达使用,也并未泄露任何决议将要发布的日历。
不外,Meta CEO扎克伯格称,Movie Gen来岁会上线Meta旗下的酬酢媒体Instagram。他在个东谈主Instagram账号发布了一段Movie Gen生成的视频,自满他在用腿部推举机,跟着他启动熏陶,布景发生了变化。先是自满,他在一家霓虹灯照射的过去作风健身房熏陶,然后变为,他穿戴角斗士盔甲熏陶,接着变为他股东一台烽火的纯金机器,临了变为,他用腿部推举一盒鸡块,周围是一派薯条。
扎克伯格配上笔墨称,Meta新的 MovieGen AI 模子不错制作和剪辑视频,每天都是真金不怕火腿的日子。该模子将于来岁登陆 Instagram。
在酬酢媒体X,Meta官宣并演示Movie Gen的帖子底下,一些点赞高的驳倒自满,网友也曾在催促Meta精良发布该模子,有网友问,不知谈全球有莫得契机来试试它。
本文来自微信公众号“硬AI”,关心更多AI前沿资讯请移步这里
风险提醒及免责条件 阛阓有风险,投资需严慎。本文不组成个东谈主投资提出,也未议论到个别用户零散的投资盘算、财务情状或需要。用户应试虑本文中的任何意见、不雅点或论断是否稳妥其特定情状。据此投资,包袱得意。