生数科技与清华携手推出视频大模型Vidu，引领视频生成技术革新-格隆汇

生数科技与清华携手推出视频大模型Vidu，引领视频生成技术革新

04-30 16:43

6,268

不同的视角，不一样的世界。

在人工智能领域，视频生成技术一直被视为前沿科技的重要一环。近日，生数科技与清华大学联手，在中关村论坛未来人工智能先锋论坛上，正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这一创新成果的推出，标志着中国在全球视频生成技术竞赛中取得了显著突破。

Vidu视频大模型的独特之处在于其采用了生数科技团队原创的Diffusion与Transformer融合的架构U-ViT。这一架构融合了深度学习领域中的两种关键技术，使得模型在视频生成方面展现出前所未有的能力。通过U-ViT架构，Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容，这一指标在国际同类产品中表现优异。

值得注意的是，Vidu视频大模型在视频生成效果上也实现了显著提升。模型能够模拟真实物理世界的运动规律，生成细节复杂的场景，如光影效果、人物表情等，都达到了高度逼真的程度。此外，Vidu还具备丰富的想象力，能够生成超越现实世界的虚构画面，为视频创作提供了更广阔的空间。

多镜头语言的运用也是Vidu的一大亮点。它能够生成复杂的动态镜头，包括长镜头、追焦、转场等效果，使得视频内容更加丰富和有趣。同时，Vidu还保持着高度的时间和空间一致性，使得16秒的视频内容在视觉上流畅连贯，给观众带来极佳的观赏体验。

值得一提的是，Vidu视频大模型还融入了中国特色元素，如熊猫、龙等，使得生成的视频内容更具本土文化气息。这一特点不仅展示了生数科技与清华大学在技术创新上的实力，也体现了中国企业在人工智能领域的文化自信。

生数科技作为人工智能领域的佼佼者，一直致力于推动技术创新和应用落地。通过与清华大学的深度合作，生数科技成功将前沿的科研成果转化为实际应用，为中国人工智能产业的发展注入了新的活力。

展望未来，随着视频生成技术的不断发展和完善，Vidu视频大模型有望在影视制作、广告营销、虚拟现实等多个领域发挥重要作用。生数科技与清华大学也将继续加大研发力度，推动视频生成技术的创新和应用，为人类创造更加丰富多彩的视觉体验。（数据支持：天眼查）

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

生数科技与清华携手推出视频大模型Vidu，引领视频生成技术革新

相关阅读

评论