彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证

彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

123 2025-01-07 18:06

剪辑部发自凹非寺

量子位 | 公众号 QbitAI

奥特曼说，Sora代表了视频生成大模子的GPT-1时刻。

从开年到当今，国表里、初创独角兽到互联网大厂，都纷纷干与视频生成领域，带来一个个极新模子的同期，视频、影视行业也随之发生剧变。

不可否定，当下的视频生成模子还遭逢诸多问题，比如对空间、对物理律例的相识，咱们都期待着视频生成的GPT-3.5/4时刻到来。

在国内，有这么一家从加快磨砺开赴的初创公司，正在为此致力于。

它等于潞晨科技，独创东说念主尤洋博士毕业于UC伯克利，后赴新加坡国立大学担任校长后生评释。

本年潞晨科技在加快谈判领域以外，缔造视频生成模子VideoOcean，为行业带来更具性价比的选拔。

在MEET 2025现场，尤洋博士也向咱们共享这一年关于视频生成领域的相识与理解。

MEET 2025智能往时大会是由量子位主理的行业峰会，20余位产业代表与会参议。线下参会不雅众1000+，线上直播不雅众320万+，赢得了主流媒体的凡俗体恤与报说念。

中枢不雅点梳理视频生成模子应该结束精良化文本限制、淘气机位/淘气角度、变装一致性、格调定制化3年后大约就能迎来视频生成的GPT-3.5/GPT-4时刻视频生成大模子的一个径直愚弄价值等于冲破现实的限制，极大裁减果真场景复现难度。

（为更好呈现尤洋的不雅点，量子位在不更动本旨的基础上作念了如下梳理）

3年后或是视频大模子的GPT-3.5时刻

今天绝顶兴盛来到量子位大会，绝顶兴盛和群众相通，今天讲一下咱们在视频大模子领域作念的一些使命。

领先是我和我的创业公司潞晨科技的先容。我从UC伯克利毕业到新加坡国立大学任教，很庆幸创办了潞晨科技。

咱们之前是作念算力优化的。2018年谷歌打造了天下上第一个千卡集群TPU Pod，那时天下上最大的模子依然BERT。咱们匡助谷歌，将（那时）天下上最大模子的磨砺时刻从3天压缩到76分钟。

也很庆幸，旧年华为盘古大模子的一个使命亦然咱们一王人来作念的，并赢得了ACL最好论文。咱们的本领匡助华为盘古大模子在磨砺中更高效。微软、英伟达等公司团队也使用了咱们的本领作念一些散布式磨砺，咱们但愿让大模子磨砺更快、本钱更低。

步入今天的话题，来要点先容一下视频生成大模子。

咱们打造了一个居品叫Video Ocean，当今正处在测试阶段。先来先容一下居品，背面再探讨我认为视频大模子将会如何发展。

领先，我认为视频大模子第一个蹙迫的方面是，它应该能够结束精良化的文本限制。

其实咱们今天都在用AI去生成大模子了，咱们详情但愿它能够精确反应出思要的东西。但很缺憾，比如当今用文生图APP去生成图一霎，依然会发现好多图片实践无法作念到精确限制，是以我认为这方面还有很大的发展空间。

在Video Ocean模子磨砺经由中，咱们作念了一些初步探索。一个相比好的例子，咱们能够精确地提供一些描摹，戴着墨镜，长的胡茬的欧洲男东说念主。不言而谕这个视频内部如实是咱们思要的阿谁嗅觉，蓝天、海岸、沙滩、背光、单手握相机、玄色T恤，也有对着镜头语言。

我认为AI视频大模子往时3年可能最蹙迫的依然结束视频大模子的Scaling Law。

这个经由不需要绝顶炫酷的居品才气，最蹙迫的是把它的模子与现实天下的贯穿才气作念到极致。我认为最终形态等于东说念主们说一段话、给一段描摹，它能精确地把描摹以视频的阵势展示出来。

是以我认为往时3年，AI视频大模子就像山姆·奥特曼说的那样，今天是Video的GPT-1时刻，可能3年后到视频大模子的GPT-3.5、GPT-4时刻。

这里展示一下Video Ocean的Demo，目下咱们作念到了这么的水平。

潞晨科技

，赞687

第二点是往时视频大模子若何能够结束淘气机位、淘气角度。

当今拍电影、拍记录片可以拿入辖下手机、录像机束缚地晃，思如何晃就如何晃，这么是对镜头有果真限制的。往时AI视频大模子，领先应该作念到这少量，相同的描摹，换一下角度、换一个镜头，它的形象是不应该更动的，它等于相同一个物体。

更进一步讲，往时AI视频大模子还能颠覆好多行业。比如当今看足球、看篮球赛，咱们看到的镜头是现场编导给咱们看的镜头。他给咱们看前景、近景。

往时能不可依靠AI视频大模子，东说念主来限制镜头，决定思要看哪，异常于在开通场里可以一霎迁移，迁移到老师席、终末一瞥、第一瞥。淘气机位、淘气角度的限制。我认为往时AI视频大模子在这方面也瑕瑜常环节的，天然天然Video Ocean当今作念了一些尝试，初步散伙依然可以的。

我认为第三点蹙迫的是变装一致性。

因为作念出AI视频大模子，彩娱乐最终详情是需要产生营收、结束变现的。谁会恬逸为这个付费，比如告白使命室、告白商、电商博主、影视行业。要是潜入这些行业的话，一个环节点是变装一致性。

比如一个居品的告白，详情重新到尾这个视频中的穿戴、鞋、车，形貌不可有太大变化，物体变装保握一致性。

拍一部电影，从发轫到散伙，主演的形貌、环节碎裂的形貌详情也不可变化，在这方面Video Ocean也作念一些很好的探索。

再一个是格调的定制化。咱们知说念当今演员东说念主工本钱瑕瑜常贵的，说念具本钱也很高。

往时3年之内，要是AI视频大模子遍及发展，我嗅觉会有一种需求，比如一个导演可以让一个演员在游池塘里拍一段戏，然后拿到素材通过AI将它转成泰坦尼克场景下的游水，转成阿凡达场景下的游水，这种才气反而是AI最擅长的。赋予电影感、艺术感的画面。

总之大模子一个径直的愚弄价值等于冲破现实的限制，能够极大裁减果真场景复现的难度。

可能之前群众听过一个段子，好莱坞导演思制造一个爆炸镜头，他算了一下预算，第一种有打算是盖一个城堡把它炸掉，第二个有打算是用谈判机模拟这个画面。本钱算下来之后，发现这两种有打算的本钱都很高，那时用谈判机模拟的本钱更高，当今AI等于要大幅裁减大模子关于生成电影的本钱。

要是这少量结束后，咱们可以不受状态、天气等外部成分的限制，并减少对果真演员的依赖。这倒不是抢演员的饭碗，因为一些环节镜头瑕瑜常危机的，比如演员跳飞机、跳楼，演员去搭救行将引爆的炸弹之类，这种镜头往时只需要演员的身份和肖像权，AI可以把这么的镜头作念好，是以对电影行业能够极大作念到降本增效。

正如昆仑万维方汉淳厚刚才说的，天然咱们的谈判资源有限，然而咱们发现通过更好的算法优化如实能够训出更好的散伙，比如Meta使用6000多个GPU磨砺30B的模子，最近咱们会在一个月内发一个10B版的模子，咱们仅用了256卡。

Video Ocean前身是咱们团队先打造了一个Open-Sora的开源居品，这个开源居品是透彻免费的，在Github上，散伙绝顶可以，比如好意思国独角兽Lambda labs作念了一个火爆的愚弄数字乐高，其实这个数字乐高档于基于Open-Sora作念的。

本年年头Sora出来之后，多样短视频巨头都对视频大模子这一块相比怜爱，比如中国的快手、抖音，好意思国等于Instagram、TikTok、SnapChat，这可以看到SnapChat的视频模子也在早些时候发布了，叫Snap Video，这是它的官方论文，他们就援用了咱们磨砺视频大模子的本领，是以说这些本领也匡助一些巨头果真把视频大模子训得更快，精度更高，智能进程更高。

谢谢群众！

点击https://video.luchentech.com可体验Video Ocean更多详备才气

— 完 —

当天，搜狐官方发布的时尚盛典海报中，马丽被放在了前排靠左的位置，汪峰则在右侧，而中间“C位”却被流量小生任嘉伦占据，连、蒋欣这样的大咖也成了陪衬被安排在了后方位置，这让各家粉丝暴雷。

侯耀华说得很模糊，只是说要帮杨议解决师承问题，可他要帮杨议拜到哪位相声前辈的门下，什么时候，在哪里办，侯耀华是守口如瓶，只字未提。

量子位 QbitAI · 头条号签约

体恤咱们彩娱乐招商加盟，第一时刻获知前沿科技动态

加盟招商娱乐悠扬潞晨

推荐资讯

彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

彩娱乐招商加盟向佐为太太郭碧婷庆生, 4岁儿子在爱里长大的

彩娱乐招商加盟李泽湘携带的XbotPark创业公司, 又有

彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可

彩娱乐招商加盟 潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

彩娱乐招商加盟 向佐为太太郭碧婷庆生, 4岁儿子在爱里长大的

彩娱乐招商加盟 李泽湘携带的XbotPark创业公司, 又有

彩娱乐招商加盟 潞晨尤洋：视频生成的GPT-4时刻，3年后可

彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

彩娱乐招商加盟向佐为太太郭碧婷庆生, 4岁儿子在爱里长大的

彩娱乐招商加盟李泽湘携带的XbotPark创业公司, 又有

彩娱乐招商加盟潞晨尤洋：视频生成的GPT-4时刻，3年后可