K8·凯发科技：etexttovideo一站式3D生成两种技术都有哪些不同？2024生成软件测评-K8凯发

K8·凯发科技：etexttovideo一站式3D生成两种技术都有哪些不同？2024生成软件测评

发布日期：2024-07-18　　浏览次数：

　　现在回过头来看，才发现，AI的发展速度真是远超我们的想象啊，去年年底还在说，AI的尽头是视频，今年年凯发国际官网初，AIGC视频应用就开始爆发式的出现，sora、runway、有言这些都是各自视频生成领域的代表。

　　以前觉得，AI顶多可以写写诗，作作画，现在AI已经开始刻画现实了，甚至能实现直接产出视频了。

　　sora、runway等文生视频产品：只需要输入一段文字内容，就可以根据文字的描述生成一段视频，像这样的工具，目前可能用在创意上会比较合适。（PS.sora目前还只有DEMO，不知道落地的产品体验如何）

　　有言：AIGC一站式生成3D视频，相对于前面这种文生视频来说，有言是在创意性和可控性上面做了一个折中处理，在3D视频的制作过程中，有很多步骤可以改变视频最终的生成效果，让视频变得独一无二；同时又有很多定制的模板、场景、形象，让视频生成的过程稳定可控。

　　那么，以sora、runway、pika为代表的这种文生视频路径上，和有言这种一站式生成3D视频的路径上，究竟哪一种，会成为未来的视频生产力工具呢？

　　文生视频技术确实梦幻，但是还面临着很多障碍，这种创意类的文生视频靠prompt生成的技术路径导致内容可控性不足、可编辑性低。而有言作为AIGC一站式生成3D视频的平台，可以很大程度上解决这些问题。

　　从文生图的技术就可以看出来，AI在视觉内容生成上，目前还是有很多问题的，比如文生图的时候，手部细节一直很难做的真实，不是人物有六根手指，就是扭曲变形，况且，目前文生文大模型说胡话的问题还没有得到解决。

　　所以到了文生视频这一步，估计要面临的问题会更多，生成图片还好说，一次给多个版本就好了，但是视频本来生成需要的算力就大，一次生成多个，更是对算力的一种浪费。

　　sora的视频样片确实很让人震撼，但是如果没办法稳定生成这种质量的视频，并且解决一些BUG，sora目前可能还是没办法广泛应用。

　　现在的文生图视频，在编辑上都有很大的受限，到了文生视频，更是如此，如果没有好的指令，想要生成一个符合预期的视频，难度更是倍增。

　　想要修改视频里面的某一些片段，只能一次一次的生成，没有办法把元素做单独的修改，而且现在现在实现符合现实物理规律的文生视频技术也没有大的突破，很多视频生成之后，和物理规律不符合，也会出现撕裂感。

　　除非未来针对AIGC生成视频的编辑工具出现，不然想要实现文生视频，还是有挺大的难度。

　　虽然目前sora应用还没有落地，也没有公布定价，但是可想而知，未来的定价肯定不是普通人可以承担的。

　　在文生视频技术的背后，都是算力支撑下的神经网络训练，之前我试过用微软的Auzer做定制语音的训练，训练一个人声，就需要接近40美元的成本，折算下来人民币差不多接近300。

　　到了视频生成这件事情上，成本估计只会更高，除非未来算力得到突破，不然sora的文生视频在短时间内很难平民化。

　　也正是因为上面这种种因素的限制，所以我才会觉得，像有言这种定制化一站式生成3D视频的生成路径，才会更加可靠，落地速度也越快。

　　现实情况也确实如此，有言已经能够实现面向企业、个人应用，而sora目前还停留在概念阶段，从实际的使用来看，有言的优势也很明显，可以让小白也快速实现视频制作。

　　要知道，有言做的可不只是单纯的3D场景、虚拟形象的视频成本，在视频3D镜头的切换、素材、场景的灯光、人物的肢体动作等关键要素上，有言也同样做了许多训练。

　　有言最终形成的视频效果就是，准确性高，差不多已经可以做到对真实物理世界的还原。

　　由于这些内容都已经是有言经过预训练的，在操作门槛上，也更加的平民化，不想文生图，还需要专业的指令语言来生成画面，有言的指令都已经内嵌成了点击操作。

　　就比如在镜头的切换这一块，都标注好了镜头切换的类型，例如“全景-正面-固定”“全景-俯冲-开场”‘全景-缓拉-结尾’等等。最终实现的效果就是，对这些镜头的切换，只需要轻松的点击就可以实现。

　　而且因为这些场景切换可以放在视频的任意一个瞬间，视频的可操作性就很强，可以根据自己的需求，来定制视频的画面。

　　至少在个人自媒体视频内容制作、商业内容发布这两块，有着广阔的市场前景。个人自媒体制作，对应的就是横版的口播视频，基本上现在的真人口播视频，主要也就是两个元素。

　　一个是人物的出镜，另外一个是背景环境，然后中间再穿插一点视频素材，就可以应用在泛社会类话题、好物推荐领域了。但是对于传统的口播视频来说，搭建场景可是一件很麻烦的事情。而有言不需要拍摄，也就不需要搭建场景，只需要在站内进行相应的设计。而它的选择面也更广，可以让一个人物配合许多不同的场景，来适应不同的话题。

　　而商业视频领域，更适合各类的线上发布会，基本上都是背后一个超大屏幕，再加上一个主讲人，只要不做线D视频效果和线上发布会几乎没有什么差别，而且成本也更低，更好控制。

　　有言除了可以直接生成视频素材之外，在视频的编辑、后期处理上，也实现了更多的功能板块。

　　大家都知道sora目前还没有产品化，不太清楚它的最终形态以及应用，而有言生成的视频就已经是可以直接发布的视频的，在有言的功能板块里，还有许多的后期模板。

　　例如开场画面、音效、字幕模板等等，在视频生成结束后，可以直接在有言里面进行后期的包装，而不需要再次借助其他视频剪辑工具做包装，字幕也都是自动生成的，

　　因为有言的模板在一开始就是面向企业，只是最近才开始面向大众，所以有言的素材相对剪映这些平台，也要更加丰富、精致一些。

　　就目前而言，在两种技术路径上，sora更加专注技术前瞻，而有言则是专注落地，其实对于大多数的普通人来说，有言可能是更加适合我们的，操作门槛低、落地也更快，有言强调的就是降低门槛，让每个人都可以实现3D视频的制作。

　　sora这类文生视频则是更加适合专业创作者，在没有合适素材的时候，可以生成视频来弥补素材的不足，现阶段，普通人肯定是用有言，更能提升生产效率。

标签：2024 3D动画制作

上一篇：3D动画制作软件AutodeskMotionBuilder2
下一篇：“硬核”筑梦！3D动画演示中国空间站建造历程

K8凯发(中国)天生赢家·一触即发

News凯发动态

K8·凯发科技：etexttovideo一站式3D生成两种技术都有哪些不同？2024生成软件测评

K8凯发(中国)天生赢家·一触即发

News凯发动态

K8·凯发科技：etexttovideo一站式3D生成两种技术都有哪些不同？2024生成软件测评

13865589623