主营整站优化代理,实嘉奥,加盟等中小企业综合信息化服务的全服务链.是一家朝气蓬勃、专注、创新的传统互联网和移动互联网高新技术研发企业,是国内外聚合营销与管理解决方案服务商.
无情的迭代机器作者丨高珮莙远古猎人王涵因为一次雷电患上了“马丁症”,每隔24小时,他的意识就会穿越到不同人的身体里。为了找回和保护女儿,他在两千年的时间里不断穿越,当过将军、富翁、宇航员,却始终无法停留。一只被基因改造的流浪狗“李”,在霓虹闪烁的都市孤独地生存,始终无法走出过去被背叛的噩梦。直到遇到一位同样是实验体的小女孩,收获了爱与温情,并为了她勇敢地对抗邪恶组织。这些充满科幻和奇幻色彩的故事,来自6月25日在北京举行首映礼的AI单元故事集《新世界加载中》,由7个各自独立的剧集故事组成,时长共180分钟。《新世界加载中》首映礼现场雪豹财经社在首映礼当天观看了其中三部剧集。以看惯了大银幕和爆款剧的挑剔眼光来看,它当然并非无可挑剔:一些非关键人物的动作稍显僵硬,对口型的准确性有待提升,部分情节的逻辑略显跳跃,以及片长限制导致的背景和情感铺垫不够完整。但如果考虑到这部短片集的核心“创作者”——可灵AI,是一个正式发布才一年的“孩子”,它在某些方面的表现的确可圈可点,甚至堪称惊艳。比如,水流的波动和动物毛发的纹理质感真实自然,长镜头下的人物表情变化细腻,在一段二维动漫风格的连续打斗戏中,动作衔接连续流畅。《新世界加载中》海报这也是可灵AI产品及运营负责人李杨和《新世界加载中》总导演、异类Outliers创始人陈翔宇的一致判断:AI生成视频距离高水准的大银幕制作还有距离,但用AI工具创作的不同题材的作品,已经开始渗透到人们的日常生活中。从2024年年底开始,一系列由AI“魔改”的宠物视频在各大社交平台上爆火,狗狗跳舞、猫猫做饭成为被津津乐道的谈资。一些短剧导演开始用AI制作打斗、战争、大空镜等画面,极大地节约了成本和时间。陈翔宇透露,AI制作动画的工时约为传统制作方式的1/3,成本则不到1/2。未来它将在广告、游戏、影视等更大的行业扮演什么样的角色?目前还没有明确的答案,但一些共识已经形成:AI也许会带来颠覆性的改变,那将是一个有巨大潜力的市场。《新世界加载中》的片名,显然就是这样一个有意而为之的巧妙双关。“《新世界加载中》是我们和可灵发出的第一声信号。”陈翔宇说。2024年6月6日,快手的视频生成大模型可灵AI正式上线,只比OpenAI的Sora晚了不到4个月。据快手CEO程一笑介绍,该项目从当年年初就开始内部孵化。过去一年来,可灵AI快速迭代了22次,与此同时,国内外巨头们也在加速入场,如今已呈现百花齐放的行业格局。Meta在去年10月首次推出Movie Gen,阿里的通义万相在今年1月升级推出万相2.1视频生成模型,字节跳动的即梦AI在3月完成著作权登记。5月,谷歌Veo 3在 Google I/O 开发者大会上正式发布,凭借音画一体化生成的功能引发外界关注。在 Artificial Analysis 视频生成榜单中,可灵系列与谷歌Veo系列分别占据文生视频、图生视频的全球前二;东方证券将二者技术实力归类为T0梯队,特别是在稳定性、运动表现等维度的表现。截至目前,可灵AI全球用户规模突破2200万,拥有超1万名开发者和企业用户。今年一季度,可灵AI营收超过1.5亿元,其中来自P端(Prosumer,产消者,兼具生产与消费双重角色的主体)订阅用户的贡献近70%。只不过,在新世界到来之前,技术的迭代提升、创作者生态的搭建、商业化路径的探索,都还是需要持续攻克的难关。首映礼当日,可灵AI产品及运营负责人李杨和《新世界加载中》总导演陈翔宇在一场媒体群访中分享了他们的感受和思考,雪豹财经社受邀参加了交流环节,以下是对话节选(内容经摘编):左一为陈翔宇、左二为李杨不看过程酷炫,要看交付结果Q:今年可灵在技术上有哪些突破?李杨:从去年到现在,可灵AI一直扎实地做基础模型,围绕几个重要的点有很大提升:一是语义遵从,让模型更听话;二是运动表现,包括运动的速度、质量、美感、自然度、是否符合物理规律。2.1模型的运动表现非常好,创作者挑战了很多高速运动和极致的互动表现,效果还不错。依托可灵2.1模型生成的视频Q:可灵AI全球用户量突破2200万,专业创作者占比如何?李杨:有一定专业创作能力的用户占比还是非常高的。今天的AI创作不是一键生成,没有那么简单,如何写Prompt、如何调和生成自己脑海中的效果,都非常考验专业性和韧性。Q:可灵AI是如何考虑下一阶段产品形态的?李杨:行业里有很多Agent或工作流,总体还不太成熟,用户更多地看到炫酷的过程,而不是真正完整的可用结果。可灵做产品的核心出发点还是看交付结果。基于这样的导向,接下来会有更多产品形态,也会基于已有的模型和功能做更多探索。我们不会贸然去follow一些听起来很时髦的、概念性的产品,还是扎实解决用户真实的问题。Q:未来商业化有多大的想象空间,今年有什么目标?李杨:我们已经看到AI在短剧制作行业的一些可能性,它本身又是近几年增速最快的内容类型,如果不断提升工具的专业能力和行业渗透率,还是有比较大空间的。最近经常有一些短剧导演跟我说,之前他们拍宫廷剧得去横店蹭镜头,最近都用可灵AI生成大空镜以及打斗和战争场面,这是一个很有力的帮助。目前可灵AI服务相对专业的P端人群,未来想要有更大规模,一定会做破圈这件事。这要求有更好的基模、更简单的产品形态和更明确的价值导向、场景导向,让普通用户也能用起来。可灵AI平台上已经有一些特效模板,比如冲浪,C端用户可以用它做一些新奇、有趣的内容创作。我们确实有一些商业化目标,但目前这些数字更多地还是印证市场和用户需求的可能性,单纯说数字没什么意义,因为行业还在早期阶段。Q:有一种说法是,现阶段各个模型在功能上都没有什么短板,拼的是长板,可灵的长板是什么?李杨:我不觉得今天模型没有短板,短板挺多的,各种各样,还没有到达“短板不重要、长板足够长”的状态。视频画面和表达是多元素构成的,包括语义遵从、运动表现等,要做一个六边形战士,各个方面都要好。可灵AI起步很早并快速迭代,创作者普遍认为它综合表现很好。可灵AI非常擅长写实风格的表达,也看到一些评价说可灵运动上限最高,因为做动态视频,运动非常核心,可灵在这一块有优势。Q:对未来有什么样的预期?李杨:坦率地说,不管是可灵还是其他视频模型,大家起跑速度和起点不一样,但都在同一个大范围内。未来还有非常多要做,包括模型的基础表达、稳定性、可控性,达到某一个点之后才会长出更多产品形态,这是前提。我希望未来AI创作这件事情尽可能再简单一点。我经常开玩笑说,我们这个产品有时挺反人性的,创作者在电脑上打开无数个页面,跑无数张图,不断地抽卡,其实挺痛苦的。希望基础模型能力更扎实,多模态能力更好地融入到产品当中,用户可以用一种更简单的方式表达自己的想法。可灵是无情的迭代机器Q:谷歌Veo 3发布之后,音频生成同步能力、场景理解及结合YouTube的视频数据比较占优势,可灵会从哪些方面进行追赶?李杨:谷歌Veo 3是非常不错的模型,可以实现文本生成视频带音效,展现了非常强的技术能力。但另一方面,它也带来了一个问题:不可控或不可保持一致性的东西又多了一个,叫音色。可灵AI依然坚持初心,希望首先把基础模型做好。视频模型虽然发展很快,但还是有很大优化空间,包括运动模糊、边缘模糊、群像人脸崩坏、稳定性等问题,也包括AI音效的能力,这些基础能力我们在不断优化。好的数据一定对模型有价值,Veo 3用YouTube的数据,就像找到了“数据石油”。但模型迭代除了算力、数据、算法以外,更重要的还是要尽早跟用户有交互,了解用户有什么需求,尽早迭代和上线用户需要的功能。Q:字节说即梦收费是全行业最低,你们会调价吗?李杨:从行业趋势看,每过一段时间,推理成本会大幅下降。从市场来看,未来不管是可灵AI还是其他模型,用户的使用成本都会逐步降低,这是大趋势,而且可灵会做得更激进一点。可灵最新发布的2.1标准版和专业版Pro,性价比非常高,5秒视频3.5元,合0.7元每秒,而友商普遍在1元每秒甚至更高。我们还是希望把好的技术、产品带给用户。Q:各模型厂商都为P端用户提供技术、资金、宣发等支持,可灵的优势在哪里?李杨:可灵AI从发布第一天起,就非常关注创作者的反馈和交互。除了资金、技术、宣发支持以外,我们还在去年7月第一个上线了未来合伙人计划的模型平台,希望帮助创作者找到更多商业化的机会,也能够帮IP和品牌广告主匹配更合适、更有创作能力的创作者。因为只有创作者活得好,我们才能够共同建立一个更好的生态。可灵AI运营团队跟超级创作者也保持了非常紧密的配合,在圈子里认可度比较高,产品和模型迭代离不开创作者的反馈。Q:可灵AI在行业中处于什么样的位置?李杨:大模型是一个“高危”行业,非常卷,恨不得一觉睡起来就又有大模型颠覆你。但可灵AI从去年到现在一直保持Tire 1水平,一直在第一梯队。虽然现在其他家模型在陆续发布和迭代,都很不错,但我们综合实力非常强,而且是无情的迭代机器,还会不断优化。Q:今年的模型迭代走向了一个平稳和你追我赶的阶段,这种状态会持续多久,转折点会在哪里?李杨:这是一个正向的信号,因为行业在技术上没有什么绝对的秘密,只是时间窗口问题。大家关注和认可这个赛道,愿意投资源、投人力,是重要信号。各家都希望自产品有优势,可以找到一个自己擅长的风格,不断优化,在这个风格上有比较好的表现,也是聪明的打法。但可灵AI的判断是,如果基础模型不够强大,定向优化能解决的问题有限。我们最终希望可灵AI成为大家内容创作的新基建,能够囊括更多风格和类型。AIGC的商业化还不健全Q:在创办异类Outliers时,你对AI影视市场化前景有什么样的判断?目前公司的商业化是否达到了预期?陈翔宇:我自己是比较热血的状态。聚合一群人、找到志同道合的伙伴,这是异类Outliers成立的初心,对AI的了解是在过程中发生的。当时有一个合伙人是在CMU(卡内基·梅隆大学)学习人工智能的。我们从底层开始一点点了解架构,结合传统制作的一些经验,慢慢找到了一个路径。当看到一枚写实人物素材的那一刻,我觉得新时代就要来了。整个AIGC行业都面临商业化问题,不仅是我们团队。短剧、中剧、动画都有很好的土壤,但AIGC商业化并不健全,我们也在探索过程中。《新世界加载中》总导演、异类Outliers创始人陈翔宇Q:目前还没有明确的路径?陈翔宇:有路径,做好内容就是最好的路径。Q:AI生成视频降本增效的情况如何?陈翔宇:分不同的评判标准。我们始终认为好内容是不可量产的,AI产出的作品也不可能和实拍百分之百相似,能够达到70%或更高,这是我们尝试达成的目标。如果以50%或30%的时间、15%~40%的成本,能达到70%的效果,就是有价值的,因为不同产品面对不同的市场。在这个过程中,需要的人员减少,产量更大,这都是降本增效。Q:与传统制作方式相比,AI可以让哪种内容类型最大幅度地降低成本?为什么?陈翔宇:肯定是科幻。科幻、魔幻、有大场面的奇观,正常情况下要么是三维去做,要么取一个很大的景,需要耗费巨大的成本,AI生成的成本只有几十分之一。现实主义短片实拍成本没那么高,而且写实风格会面临一个问题:观众很熟悉肉眼观察到的世界,AI制作有很小的一点差别,观众都能感受到,脱离我们构建的沉浸感。Q:AI能帮助降低多少时间和资金成本?陈翔宇:风格、角色量和场景不同,都会影响整体制作时长。但总体来说一定是提效的,大概相当于传统制作动画时长的1/3。资金成本在不同项目中也会不同。拍写实的成本不会特别高,大场景或科幻类型会大一些。目前通常是传统制作成本的1/2往下。Q:技术、内容、IP、资金、发行、宣发等,哪个环节的支持对创作者更重要?陈翔宇:这是一个偏整体向的问题。行业整体还处于启蒙阶段,很多有才华的创作者只是一腔热血,如果没有合适的商业生态,那创作者到底应该如何存活下去?可灵AI一直在做这件事,我们也在做一些新的尝试和探索,包括IP打造,近期上线的短片也在市面上有不错的反响。这是整个行业要面对的事情,希望能有更好的未来。封面来源丨《新世界加载中》海报