生数科技与清华携手推出视频大模型Vidu,引领视频生成技术革新

不同的视角,不一样的世界。

在人工智能领域,视频生成技术一直被视为前沿科技的重要一环。近日,生数科技与清华大学联手,在中关村论坛未来人工智能先锋论坛上,正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这一创新成果的推出,标志着中国在全球视频生成技术竞赛中取得了显著突破。

Vidu视频大模型的独特之处在于其采用了生数科技团队原创的Diffusion与Transformer融合的架构U-ViT。这一架构融合了深度学习领域中的两种关键技术,使得模型在视频生成方面展现出前所未有的能力。通过U-ViT架构,Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容,这一指标在国际同类产品中表现优异。

值得注意的是,Vidu视频大模型在视频生成效果上也实现了显著提升。模型能够模拟真实物理世界的运动规律,生成细节复杂的场景,如光影效果、人物表情等,都达到了高度逼真的程度。此外,Vidu还具备丰富的想象力,能够生成超越现实世界的虚构画面,为视频创作提供了更广阔的空间。

多镜头语言的运用也是Vidu的一大亮点。它能够生成复杂的动态镜头,包括长镜头、追焦、转场等效果,使得视频内容更加丰富和有趣。同时,Vidu还保持着高度的时间和空间一致性,使得16秒的视频内容在视觉上流畅连贯,给观众带来极佳的观赏体验。

值得一提的是,Vidu视频大模型还融入了中国特色元素,如熊猫、龙等,使得生成的视频内容更具本土文化气息。这一特点不仅展示了生数科技与清华大学在技术创新上的实力,也体现了中国企业在人工智能领域的文化自信。

生数科技作为人工智能领域的佼佼者,一直致力于推动技术创新和应用落地。通过与清华大学的深度合作,生数科技成功将前沿的科研成果转化为实际应用,为中国人工智能产业的发展注入了新的活力。

展望未来,随着视频生成技术的不断发展和完善,Vidu视频大模型有望在影视制作、广告营销、虚拟现实等多个领域发挥重要作用。生数科技与清华大学也将继续加大研发力度,推动视频生成技术的创新和应用,为人类创造更加丰富多彩的视觉体验。(数据支持:天眼查)

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论