北京时间2月16日凌晨,OpenAI宣布推出一个名为Sora的文本转视频(Text-to-Video)模型。
Sora能够根据用户输入的文本指令,创建出具有高度真实感和细节丰富的视频内容,时长可达一分钟,并且在生成过程中能模拟物理世界中的运动和场景细节。
例如,它可以生成一位特定装扮的人物在特定环境下的活动视频,视频中的视觉效果、人物动态、背景细节等均能达到非常高的质量水平,甚至包括面部毛孔和瑕疵在内的细节也能清晰可见。
Sora生成的视频片段,甚至还可以运镜,即切换远景、近景、其他角度等。
这有多绝呢?
以前也有AI文本转视频模型,比如Runway,但是Runway公测版本视频时长也仅为4秒,网页版最长也仅支持18秒的视频生成,视角也较为单一,不能运镜。
从发布的视频来看,Sora的生成效果比起Runway等其他AI文本转视频模型好多了,简直是不给别人活路。加之Sora是由ChatGPT母公司OpenAI发布的,它一经发布就引起了空前讨论。
尽管Sora目前在模拟复杂物理现象时仍存在瑕疵,但其生成的视频具有相当高的连贯性和优秀的效果,这依旧很不错了。假以时日算力跟上,学习程度加深,它可以创建出更加令人信服的场景和动作序列,更复杂,更逼真,时长也更长——一分钟还是有些不过瘾。
看到这有没有想到什么?
Sora继续进化下去,如今的短视频,乃至大制作的好莱坞电影,都有可能不用拍了,统统AI生成即可。这么下去,好莱坞岂不是要关门了?
别说,去年好莱坞从业人员就受到了生成式AI的挑战,只不过当时冲击的还是编剧,仅限于文字创意领域。许多编剧担心自己辛辛苦苦写出的剧本则变成AI训练的材料,自己的工作反倒被训练好的AI抢了,只会被雇用去改写那些AI写出来的剧本草稿。
所以去年好莱坞编剧就希望影视公司能出台具体的规则来限制生成式AI的使用。
这种讨论放到现在看甚至都有点滑稽,因为别说剧本创作了,这么下去其他环节,如道具、灯光、剪辑等工作都有可能被取代。好莱坞擅长的大制作,比如搭建场景、摄影指导、服化道等等,都是很烧钱的,以后说不定都能AI生成了,相关人员就得面临失业了。
还别说,AI生成的动物越来越逼真,以至于好莱坞对真实狮子的需求越来越少了,只剩下两只还在工作了——也好,不用害怕这些猛兽暴起把工作人员给吃了。
当然,要是换个角度想想,Sora的发布标志着在文本生成视频领域的重大突破,它不仅极大地拓展了创作可能性,也为视频制作行业、广告业、游戏开发等领域带来了革命性的变化,有望显著提高内容生产的效率。
以前想要拍摄大制作电影,场景、道具、服装、化妆、动作指导、摄影、灯光等等,都需要共同调配,运行流畅,成本极高,这就需要导演具备项目管理才能,顺利完成项目还要压制成本。
如今这些统统不需要了,以后有了AI生成,只需要你的想法,就能做出好莱坞大片,一个人就是一支队伍。这对空有想法创意,却没有资金,还有电影梦的人来说,简直是美梦成真。
在Sora前,就有很多AI生成内容降低成本的案例了。
然而AI生成内容可能会有一些法律问题。
比如之前爆火的游戏《幻兽帕鲁》,据称开发效率极高。然而有玩家质疑,游戏中的幻兽形象有可能是用AI洗稿宝可梦形象。吃瓜群众甚至都在等着任天堂法务部的相关行动了。
AI生成内容目前还是新生事物,如何在鼓励创新和减少侵权上找到一个平衡点,是业界关注的重要问题。
说到这里,还是讲一个很早以前的故事吧。
2005年,某位知名导演的电影上映,却被一位怪才通过各种剪辑手段,剪成了一部恶搞的短片。因为进过剪辑、解构形成的新短片更加有趣,发到网上就迅速火爆。很多网民认为知名导演的这部电影很烂,但被恶搞后的短片却很精彩。
见自己的电影被恶搞,该知名导演怒不可遏,甚至放话“人不能到这个地步”,说要剪辑自己电影爆火的人侵权。
十多年过去了,我们再看当年的争议,都显得有些滑稽——现在视频网站上到处都有恶搞、重新剪辑、三分钟讲解电影的视频,随手一打开就是“注意看,这个男人叫小帅”,铺天盖地,大家早就适应了。
也许过不了几年,我们也会很快适应铺天盖地都是AI生成的内容,版权问题也会得到解决。
而且AI生成有好处,低成本,破坏小——又得说到刚才那部知名导演的电影了,在拍摄过程中,该剧组破坏了香格里拉的生态环境。如果以后是AI生成视频,应该不会造成类似破坏。
最后提一句,那位剪辑怪才、网络恶搞视频的鼻祖,有一位一起拍视频的小伙伴,后来成为了《流浪地球》系列电影的编剧。
所以有才华的人不要怕,早晚会有自己发光发亮的时刻,如果AI能生成更好的效果,显然更有利于创意更多、更深刻的人。