智谱OpenDay「大有可玩」:30秒将任意文字生成视频,一起来 「玩」

互联网
2024
07/26
15:29
分享
评论

Sora毫无疑问带来AI大模型的全新玩法,大模型可基于任意文字生成视频,这也是这个“大家庭”若干努力(包括Runway的Gen系列、微软的Nuwa、Meta的Emu、谷歌的Phenaki/VideoPoet、CogVideo等)的一个全新高度。今天,这个大家庭迎来一个新伙伴清影(Ying)。只要你有好的创意(几个字到几百个字),再加上一点点耐心(30秒),清影(Ying)就能生成1440x960清晰度的高精度视频。

即日起,清影上线清言App,面向所有用户开放。输入一段文字后(俗称Prompt),用户可以选择自己想要生成的风格,包括卡通3D、黑白、油画、电影感等,配上清影自带的音乐,就生成了充满AI想象力的视频片段。大模型能真正让用户用上,才更加「大有可玩」。

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,AI就能让凝练在旧时光中的照片灵动起来。

清影(Ying)API 也同步上线大模型开放平台bigmodel,企业和开发者通过调用API的方式,体验和使用文生视频以及图生视频的模型能力。

新型DiT模型架构,更高效地压缩视频信息,以及更充分地融合文本和视频内容,让清影在复杂指令遵从能力、内容连贯性、大幅的画面调度上具有一定独到之处。我们来看看首批获得测试资格的创作者们生成的视频,enjoy。

在生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。”在智谱 Open Day 上,智谱AI CEO 张鹏表示:“随着算法、数据不断迭代,相信Scaling Law将继续发挥强有力作用。”

“本次清影(Ying)底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。我们将继续努力迭代,在后续版本中,陆续推出更高分辨率、更长时长的生成视频功能。”

清影(Ying)的研发得到北京市的大力支持。其中,智谱清影的算力支持来自于北京亦庄人工智能公共算力平台,北京亦庄聚焦建设全域人工智能之城,建设北京人工智能数据训练基地,围绕“大模型+大数据+大算力”,夯实人工智能产业基础底座。目前,5000P高性能智能算力已投入使用,打造了集高质量数据、高性能算力、国产软硬件适配、模型评测、行业应用等一体化服务体系,不断助力人工智能技术迭代创新,以场景为牵引推动大模型垂直领域深度应用。

当前,北京正在打造人工智能产业高地,为智谱AI开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。此时此刻,智谱清影在北京亦庄算力集群诞生,未来也将应用实践于北京亦庄广阔的高精尖产业集群,形成大模型赋能实体经济的新应用、新业态、新模式。

bilibili也作为合作伙伴也参与了清影的技术研发过程,并致力于探索未来可能的应用场景。同时,合作伙伴华策影视参与了模型共建。

说了这么多......到底怎么玩?智谱清言PC/APP上,点击「清影智能体」功能,就可以直接玩了。全民AIGC,轻松将脑中蹦出的灵感,转化成艺术视频创作。

快来清影一下吧。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3