【48812】免费AI“神器”系列第14弹：Sora竞品可生成2分钟视频；谷歌Vlogger能让图画说话_视频会议_华体会手机网页版登录

【48812】免费AI“神器”系列第14弹：Sora竞品可生成2分钟视频；谷歌Vlogger能让图画说话

AnyV2V 是一款无需练习，即插即用的 AI 视频修正结构，该结构由滑铁卢大学、Vector Institute 和 Harmony.AI 团队共同开发，旨在协助用户简化视频创造流程，进步视频制造功率。

产品功用：AnyV2V 不只支撑对源视频进行深度修正与修正，还能依照输入文本提示，主题或风格等，生成对应新视频。

详细来看，AnyV2V 将视频修正简化为了两个首要过程：首要，AnyV2V 可以刺进任何现有的图画修正东西，然后支撑多个视频修正使命。其次，AnyV2V 可以刺进任何现有的图画视频模型，履行 DDIM 回转和中心特征注入，然后坚持与源视频的外观和运动一致性。

此外， AnyV2V 还能支撑视频修正使命，包含根据参阅的风格转化、主题驱动修正和身份处理。

产品信息：Vlogger 是谷歌推出的一款图生视频技能结构，该结构是根据 MENTOR 数据库练习而来，数据库中包含超越 80 万名人物肖像，以及累计超越 2200 小时的影片，使得 VLOGGER 可以生成不一样的种族、不同年纪、不同穿戴、不同姿态的人物视频。

产品功用：用户只需上传一张人物图片＋音频文件，就能完成让人物开口说话，生成一段人像与音频完美贴合且流通的视频，并能做到视频中人物面部表情及肢体动作都适当天然且生动。

团队成员表明，和业界此前的同类办法比较，VLOGGER 最大的优势体现在不需要对每个人进行练习、也不依赖于面部检测和裁剪，并且生成的视频很完好（既包含面部和唇部，也包含肢体动作）等等。此外，Vlogger 还具有视频修正和翻译等使用，可以让人物闭嘴、闭眼，乃至进行视频翻译。

产品信息：Hotshot - ACT 1 是一款由 Hotshot Research 开发的文本生成视频模型，该模型根据大规模高分辨率文本视频语料库练习，重视空间对齐、时刻对齐和审美质量，旨在为视频创造者供给高质量的视频创造体会。

产品功用：用户只需输入文本描绘，即可生成动画风格的视频。一起能根据本身需求挑选不同的宽高比和分辨率输出，定制化自己的视频内容。

产品信息：Motion-I2V 是一款 AI 视频生成模型，可以根据一张静态图片生成连接且可操控的视频。

产品功用：能完成图画到视频的主动转化，可以将静态图画主动转化成连接的动态视频，经过模仿图画中目标的天然运动，使静态图画动起来。一起支撑用户准确操控视频中的运动轨道和运动区域，使得生成的视频不只流通连接，并且用户都可以经过简略的操作操控视频内容。

此外，根据其先进的运动增强和时刻注意力技能，无需额定的练习样本，Motion-I2V 就能完成视频风格转化，比如从实际风格转化成漫画风格。