OpenAI被偷家,谷歌Veo 2反超Sora
佚名
2024-12-18 09:04:17
0

谷歌被盗怎么找回__谷歌被盗

视频生成领先 OpenAI 了?

今天是个好日子,至少谷歌这么想。几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:

其中,Veo 2 可说是直接引爆了整个社交网络。从早期用户发布的生成结果以及反馈来看,Veo 2 的生成质量明显超过了当前最佳的 Sora 等模型。一问世便是当世第一,似乎完全可以嚣张地喊一声:「还有谁?」

谷歌被盗怎么找回_谷歌被盗_

谷歌 CEO Sundar Pichai 介绍 Veo 2 的推文

据介绍,Veo 2 可以创建 2 分钟以上长度的 4k 分辨率视频,也能理解提示词中的相机控制指令(比如广角镜头、POV 和无人机镜头),还能重建出符合真实世界的物理交互和人脸表情。

但也必须指出,目前这只是一个理论上的优势。在谷歌的实验性视频制作工具 VideoFX 中,Veo 2 目前只提供分辨率上限为 720p、长度为 8 秒的视频生成服务。(而目前的 Sora 可以制作高达 1080p、20 秒长的视频。)

尽管如此,Veo 2 现有的表现已经足够惊艳了其表现是如此之好,以至于一心推介自家 Grok 的马斯克也跑来赞美了一句。

谷歌被盗_谷歌被盗怎么找回_

为了佐证 Veo 2 确实优秀,谷歌还做了一个基于人类评估者的对比评估,简单来说就是让人类评估者看不同模型基于同一提示词生成的视频,然后判断自己更喜欢哪一个视频。他们对比了 Meta Movie Gen、可灵 1.5、Minimax 和 Sora Turbo。参与者观看了 1003 条提示词及相应视频。

在整体偏好上,Veo 2 的优势非常明显,被另一个对比模型胜过的概率不超过 33%。

_谷歌被盗怎么找回_谷歌被盗

而在指令遵从度上,Veo 2 的表现依旧强势。

_谷歌被盗怎么找回_谷歌被盗

令人意外的反倒是 Sora Turbo,其整体偏好和指令遵从表现是这几个模型里面最差的。Sora 要想「挽回面子」,可能还得看以后的满血版了。

Veo 2 表现惊艳

话不多说,看看 Veo 2 的表现,我们或许就能理解为什么它在大众评审中能够压倒性地战胜之前的明星视频生成模型。

首先是对物理世界的理解力大大提高。如果不说是 AI 生成的,水下的波纹、光影,狗狗潜水时的动作协调性,都让人感觉如此真实,仿佛眼前的一切都是手持相机拍出来的,简直分不出来。

_谷歌被盗_谷歌被盗怎么找回

虽然仪表盘上的字不是完美,但我们可以看到,方向盘向左转的时候,整体画面也有一个左移,之后镜头向上从车窗摇到街道。

谷歌被盗_谷歌被盗怎么找回_

做到这种和主画面保持强一致性的摇镜头,其实非常难,每个细节都需要精确控制,确保镜头移动时画面中的物体位置和运动协调一致。

只有提升对真实世界物理运动规律的理解,才能做到这点,而 Veo 2 在这方面表现得尤为出色。

除此之外,Veo 2 的另一个亮点就是它生成的人类表情更加真实。

拿相似的 prompt 去测试其他模型,想实现这种自然又细腻的陶醉微表情,不失真、不鬼畜,试过才知道有多难。

谷歌被盗怎么找回_谷歌被盗_

还有,这画面简直就像从纪录片里截取的一幕。镜头里,一个养蜂的男人在蜂群中忙碌,Veo 2 在生成这一场景时,真的是突破了不少难关。

谷歌被盗怎么找回__谷歌被盗

蜜蜂群体飞行不仅要表现出自然的协调感,还得和背景、光影无缝对接,避免出现卡顿或不自然的分布。但 Veo 2 把这些复杂的细节都处理得恰到好处,蜂群飞舞的每一刻都像是活生生的,「AI 味」已经很淡了。

DeepMind 表示,虽然视频模型经常出现「幻觉」,展示不必要的细节(例如多余的手指或额外的物体),但 Veo 2 产生这些细节的频率较低,模型的输出更加逼真。当然,作为一款 SOTA 视频生成模型,光能生成拟真视频可不够。从官方以及网友分享的生成结果看,Veo 2 在生成幻想和动画内容方面的表现也同样非常出色。 提示词:A meeting of a lion, a bear and a giraffe, all of them wearing suits. Photorealistic, cinematic. 来自 X @hhm

_谷歌被盗_谷歌被盗怎么找回

_谷歌被盗_谷歌被盗怎么找回

_谷歌被盗怎么找回_谷歌被盗

提示词:a sitcom tv show about potatoes,来自谷歌研究科学家 @babaeizadeh

Veo 2 还让创作者可以轻松实现以前需要复杂后期才能完成的视觉效果。比如,它可以让这个运动的立方体稳定地切换材质,这个画面让人来做,看起来就很难,换 AI 来做,其实一点也没变简单。

_谷歌被盗怎么找回_谷歌被盗

Veo 2不仅要解决实时追踪的问题,确保在物体快速移动时也能精准捕捉位置和形态,仅需 Prompt 就能置换材质。最厉害的是,它能保证在多次连续变换过程中画面始终流畅自然,不会出现抖动或错位。

Veo 2 的功能已经被加入到 Google Labs 视频生成工具 VideoFX 中,并扩大了可访问的用户数量。谷歌表示,计划明年将 Veo 2 扩展到 YouTube Shorts 和其他产品上。

谷歌被盗怎么找回__谷歌被盗

提示词:A broccoli wearing a leather jacket and carrot wearing a tank top having a steak dinner,来自谷歌研究科学家 @RubenEVillegas

不过 Veo 2 现在还未正式开放,需要填表排队,等待正式上线。

OpenAI 连开直播 12 天,虽然赚足了流量,但从开播至今干货越来越少,可谓噱头大于实质。

而之前谷歌一直被 OpenAI 狙击,这次终于迎头反击。

雪上加霜的是,OpenAI Sora 的项目负责人 Tim Brooks 也在两个月前选择了跳槽至 DeepMind。

谷歌被盗__谷歌被盗怎么找回

按照目前双方技术迭代的速度和质量来看,或许就像网友们所预测的:「谷歌明年就会把 OpenAI 甩得连尾气都吃不上了」。

谷歌被盗怎么找回_谷歌被盗_

_谷歌被盗怎么找回_谷歌被盗

参考内容:

相关内容

2024年爱尔兰贝尔法斯特...
2024年爱尔兰贝尔法斯特国际餐饮及酒店业展览会,数百家来自餐饮服...
2025-04-29 08:12:26
2025年5月13 - 1...
今年5月,重庆将迎来一场盛大的装备制造业盛会——2025第25届立...
2025-04-09 09:16:50
上海博览中心:多类型展会云...
上海博览中心的展览确实是个宝库,在这里,你可以一睹科技、艺术、时尚...
2025-03-28 22:06:06
OpenAI CEO阿尔特...
OpenAI CEO阿尔特曼最新思考:AI普惠与AGI的挑战,微软...
2025-02-11 08:01:02
谷歌Pixel 9a即将在...
Pixel 9a预计将搭载Tensor G4处理器
2025-02-11 08:00:56
古尔曼:苹果正加速推进家用...
古尔曼:苹果正加速推进家用机器人项目,近期已加大招聘规模,招聘,林...
2025-02-10 23:00:59

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...