快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。
据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。
3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)登陆图生视频(Image to Video)赛道榜首。
值得注意的是,本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景等在内的多维度复杂创意,直接高效地传达给AI。
基于MVL理念,可灵AI推出多模态编辑功能。MMW将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。
基于MVL这一全新交互方式,快手副总裁、可灵AI负责人张迪发布全新的可灵2.0大师版,这一版本全面升级视频及图像创作可控生成与编辑能力,并上线全新的多模态视频编辑功能。
此外,可图2.0文生图能力也全面升级,包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格等。
0 条