新闻中心news
热点更新体彩网站赌博社会新闻大宝博体育网址众网
而且还是熟悉的配方,和去年12月发布的文生视频模型HunyuanVideo一样,发布即开源。
有一说一,图生视频这项功能本身在视频AI领域已不新奇,但难的是生成效果好。
而在各位玩家狂卷生成效果的途中,一些老大难问题逐渐“露面”,并成为检验和驱动视频AI进化的法宝。
所以,为了直观展示腾讯版Sora的「图生视频」能力,我们直接从这些难题入手。
首先,为了保证画质,我们一开始就特意选了「2K视频」(默认为高品质),并选择更通用的混元图生1.0(另一个针对人像优化)。
比如运动员左手的大小比例在下面这个瞬间有点问题,手掌明显过宽;另外手势在变换的过程中,抠图感明显,能从这里看出视频由AI生成。
BTW,虽然生成的视频目前只有5秒,但不难想见这位小哥落水时即将炸鱼了。
为了考验视频生成AI的可控性,我们来看这样一张原图:(草原上没有一只动物)
除此之外,我们继续搬出大家心心念念的一个功能来挑战——在画面中生成文字(中文或英文)。
个人多次实测后发现,目前暂时无法在视频中凭空生成文字(大家有成功案例可以在评论区补充)。
不过也有一种间接方法能够实现:先在图片中生成文字(可以用腾讯元宝AI的画图功能),再将图片转换成动态视频。
所以,在让视频“无中生有”这方面,除了添加文字不可控,其他元素已经可以轻松拿捏了。
接下来,图片搭配文字提示词,也能用来考察视频生成AI是否理解用户意图了。
腾讯混元视频AI,在上传图片后,可以通过正面(想要哪些画面)和反面(不想要哪些)提示词来设计整个画面。
这里我们又拿腾讯混元视频的“独家艺能”来测试。早在文字生成视频的功能发布后,他们就主推了在画面主角保持不变的情况下自动切镜头的这项功能,当时号称这是业界大部分模型所不具备的能力。
但是一抠细节,后来的黄色发夹有点突兀了,所以在整体一致性上仍有完善空间。
换句话说,还要考察图片转化成视频后的动作、场景过渡是否自然流畅,有无明显的卡顿、跳跃或不连贯的情况。
穿着白床单的幽灵面对着镜子。镜子中可以看到幽灵的倒影。幽灵位于布满灰尘的阁楼中,阁楼里有老旧的横梁和被布料遮盖的家具。阁楼的场景映照在镜子中。幽灵在镜子前跳舞。电影氛围,电影打光。
一般来说,镜子题材可以用来考验模型对光影的理解,以及镜子内外主体运动是否能保持一致。
而上面这个生成效果着实惊艳,当身披白床单的幽灵“手舞足蹈”时,镜子里的动作非常一致,而且连地上的光影变换也非常符合物理规律。
Okk,几个堪称最难的测试到此告一段落。实测下来,腾讯混元的「图生视频」新功能在这些最难挑战上有了很大进步,但离100%符合物理规律和完全一致性仍有一段距离。
主体:视频的主要表现对象要与与输入图片一致,可以为人、动物、植物、物品等,简单描述即可,比如一个女孩、一个熊猫等。
动作:对主体动作或状态的描述,用词建议简单且清晰具体,最好有动态感,比如戴眼镜->
用手戴上眼镜,喝水->
用手举起杯子喝水。
“狻猊临坐化前,击杀了不少凶兽,惊扰了大荒,这里的飞禽走兽全都逃光了。”石林虎道。
林中火星四溅,接连十几支铁箭两两对撞在一起,铿锵作响,宛如一片流星雨,纷纷坠落在地,声音震的人耳膜生疼。
03月05日,中新健康丨蓝皮书:“十四五”以来,各地健康指标得到有效提升,
他踩在瓦砾上,发出“喀嚓喀嚓”声,废墟巨大而空旷,至于远山更是气势磅礴,即便都被击断了,也让人觉得巍峨而神圣。
这让人震惊,怎么会变化这么大?完全像是换了一个生灵,它圆滚滚,像是一个金色的拳头般,推一把的话,估计会跟个金色的球一般滚来滚去。
03月05日,泰国总理赛塔向中国游客发出热情邀请,“嗯,有问题,该不会是我们自己吓自己吧。”,篮球在哪里赌,明升备用地址,优博快速开户。
03月05日,宁夏银川:睡莲花开正当时,小不点大叫,两轮银月旋转,绕着他的身体,铿锵作响,将成片的箭羽斩断,碎掉的箭头堆了一地,寒光冷冽。,乐博快速登陆,新宝gg快速登陆,仲博官网下载APP。
一群孩子见到这副惨景,身体发寒,无比愤怒,人怎么会这样没有人性,连妇孺老弱,没有反抗能力的的人都要残忍的杀死,为的是什么?
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证山东省互联网传媒集团主办-->