【48812】免费AI“神器”系列第14弹:Sora竞品可生成2分钟视频;谷歌Vlogger能让图画说话

  AnyV2V 是一款无需练习,即插即用的 AI 视频修正结构,该结构由滑铁卢大学、Vector Institute 和 Harmony.AI 团队共同开发,旨在协助用户简化视频创造流程,进步视频制造功率。

  产品功用:AnyV2V 不只支撑对源视频进行深度修正与修正,还能依照输入文本提示,主题或风格等,生成对应新视频。

  详细来看,AnyV2V 将视频修正简化为了两个首要过程:首要,AnyV2V 可以刺进任何现有的图画修正东西,然后支撑多个视频修正使命。其次,AnyV2V 可以刺进任何现有的图画视频模型,履行 DDIM 回转和中心特征注入,然后坚持与源视频的外观和运动一致性。

  此外, AnyV2V 还能支撑视频修正使命,包含根据参阅的风格转化、主题驱动修正和身份处理。

  产品信息:Vlogger 是谷歌推出的一款图生视频技能结构,该结构是根据 MENTOR 数据库练习而来,数据库中包含超越 80 万名人物肖像,以及累计超越 2200 小时的影片,使得 VLOGGER 可以生成不一样的种族、不同年纪、不同穿戴、不同姿态的人物视频。

  产品功用:用户只需上传一张人物图片+音频文件,就能完成让人物开口说话,生成一段人像与音频完美贴合且流通的视频,并能做到视频中人物面部表情及肢体动作都适当天然且生动。

  团队成员表明,和业界此前的同类办法比较,VLOGGER 最大的优势体现在不需要对每个人进行练习、也不依赖于面部检测和裁剪,并且生成的视频很完好(既包含面部和唇部,也包含肢体动作)等等。此外,Vlogger 还具有视频修正和翻译等使用,可以让人物闭嘴、闭眼,乃至进行视频翻译。

  产品信息:Hotshot - ACT 1 是一款由 Hotshot Research 开发的文本生成视频模型,该模型根据大规模高分辨率文本视频语料库练习,重视空间对齐、时刻对齐和审美质量,旨在为视频创造者供给高质量的视频创造体会。

  产品功用:用户只需输入文本描绘,即可生成动画风格的视频。一起能根据本身需求挑选不同的宽高比和分辨率输出,定制化自己的视频内容。

  产品信息:Motion-I2V 是一款 AI 视频生成模型,可以根据一张静态图片生成连接且可操控的视频。

  产品功用:能完成图画到视频的主动转化,可以将静态图画主动转化成连接的动态视频,经过模仿图画中目标的天然运动,使静态图画动起来。一起支撑用户准确操控视频中的运动轨道和运动区域,使得生成的视频不只流通连接,并且用户都可以经过简略的操作操控视频内容。

  此外,根据其先进的运动增强和时刻注意力技能,无需额定的练习样本,Motion-I2V 就能完成视频风格转化,比如从实际风格转化成漫画风格。

其他人还喜欢