快手大模型首次集体亮相，用AI重塑内容与商业生态-格隆汇

7月6日，在2024世界人工智能大会期间，快手举办了以“新AI·新应用·新生态”为主题的大模型论坛，会上，快手大模型首次集体亮相，视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。

继图生视频、视频续写功能发布之后，可灵在一个月内迎来了第三次重大升级，网页端（https://klingai.kuaishou.com）也正式上线。

在本次论坛上，可灵推出更加清晰的高画质版，以及首尾帧控制、镜头控制等新功能，同时，创作者单次生成的文生视频时长增加至10秒。图像生成大模型可图则宣布正式开源，这一举措旨在激发行业活力，共建一个更为繁荣的文生图大模型社区生态。

一直以来，AI技术创新都是推动快手发展的驱动力，不仅覆盖内容生产、理解、推荐等多个层面，也持续推进着快手商业生态的智能化经营水平。快手高级副总裁、主站业务与社区科学线负责人盖坤表示，快手未来将继续加大在AI领域的投入，大力推动技术创新，“坚定地为用户做最好的AI技术”。

快手大模型首次集体亮相，用AI重塑内容理解、分发与生产环节

盖坤介绍，快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵，覆盖内容理解、分发、生成等多个层面，并深度服务快手的商业生态场景。其中，快手的推荐大模型SIM，凭借十万亿参数的规模，成为全球领先的推荐系统之一，其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长，显著提升用户粘性和活跃度。

“坚定大模型技术投入与创新，坚持在真场景中挖掘真价值，满足用户的真需求”。快手副总裁、大模型团队负责人张迪表示，将用大模型技术重塑快手业务，通过“升级理解、创新互动、探索生成”，在内容生产方面，打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验；在内容消费领域，升级快手的内容理解和分发体系，提升用户的消费体验。

据「TMT星球」了解，基于快意大模型构建的视频脚本生成，直播实时脚本生成、广告线索客服，叠加数字人技术，助力商业化广告主低成本生成高品质的视频和直播内容，提升线索转化效率。快手的AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑，展示了大模型在商业场景中的巨大潜力。

快手商业化外循环和AI商业产品负责人刘逍透露，半年来，有近2万商家在快手平台借助大模型能力实现智能化经营，获得不菲回报。相比今年1月，今年6月的AIGC月活跃客户数增长了8倍，月GMV规模提升了64倍，平台AIGC广告收入规模提升了12倍。刘逍表示，磁力开创、女娲数字人、π数字员工等“新生意”工具将持续为商家深度赋能，“我们将继续深化AI技术在商业化中的应用，不断创新和发展，为客户创造更多价值。”

可灵AI推出Web端，上线首尾帧控制、镜头控制等新功能

继图生视频、视频续写功能发布之后，可灵AI在一个月内迎来了第三次重大升级，网页端也将正式上线。在本次论坛上，快手宣布，可灵AI基础模型再度升级，推出更加清晰的高画质版，以及首尾帧控制、镜头控制等全新编辑能力，同时，创作者单次生成的文生视频时长增加至10s，是业内对用户开放使用可实现的最长时长。

作为全球首个真正用户可用的视频生成大模型，可灵于6月6日正式发布文生视频功能，随后又于CVPR会议期间推出了图生视频、视频续写等多项新功能，支持用户最长生成约3分钟视频。可灵以真实世界物理规则为基准，生成的视频展现出了电影级别的画质与动态效果，甚至能够模拟大幅度的物理运动，打破了传统视频生成技术的局限。这一突破性成果，不仅在国内收获了用户的广泛好评，更在海外引起了巨大反响，引发了全球对中国AI技术发展速度的广泛关注与讨论。

盖坤介绍，截至目前，已有超过50万用户申请可灵的内测资格，视频生成数量达700万。用户通过“可灵”创造的“老照片复活”等作品，因为触动人心的力量火爆全网。快手也将继续致力于提升模型基础质量，增强画质清晰度，并引入更多创新功能，以满足用户多样化需求。

快手视觉生成与互动中心负责人万鹏飞表示，可灵AI大模型最新发布的版本中，可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级，可单次生成更高清更可控的10s及更长的视频。

值得关注的是，国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》预告片还在会议期间惊艳亮相，可灵为该剧提供深度技术支持。AIGC技术的迅猛发展，为短剧产业注入了全新的活力。张迪指出，利用AI技术可大幅度提高短剧生产、制作和运营的效率，“可能半年以前，大家都没法想象真正用AIGC来制作电影，（现在它）来了！”

此外，为了进一步激发AI爱好者们的创作热情，快手还在论坛上正式发起“灵”感迸发——首届可灵AI x 快影视频创作大赛，联动六大顶尖院校，总奖金池超30万元。大赛还特别推出“可灵AI x 星芒短剧”创作者孵化计划，各专题一等奖获得者将受邀加入创作者扶持计划，有机会获得重磅流量及现金奖励、与行业专家进行面对面交流。

可图正式开源，将共建更繁荣的文生图大模型生态

在图像生成大模型领域，快手的可图同样处于行业领先水平，拥有多项核心优势，诸如强大的复杂语义理解能力、摄影级的画面质感、多条件的可控风格化生成等。在权威机构智源研究院的测评中，可图以75.23分位居文生图大模型领域全球第二水平。

盖坤介绍，可图大模型集成了快手在大语言模型领域的深厚积累，通过数十亿中文语料的训练，成为最懂中文的文生图模型，其综合性能超越了SDXL/SD3等开源模型以及Midjourney等闭源模型，树立了中文场景下图像生成的新标杆。本次论坛上，快手宣布可图将正式开源，这一举措旨在激发行业活力，共建一个更为繁荣的文生图大模型社区生态。

会上，中国计算机学会（CCF）还宣布与快手携手，共同成立“CCF-快手大模型探索者基金”，并同步开启基金申请通道。该基金计划于年内推出12个研究项目，课题最高可获30万元支持，旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求，聚焦新一代大模型的关键技术研发。

面向未来，盖坤表示，快手将继续加大在AI领域的投入，大力推动技术创新，“坚定地为用户做最好的AI技术”。

快手大模型首次集体亮相，用AI重塑内容与商业生态

相关阅读

评论