AI智能体元年真来了?这次中国与OpenAI站在同一起跑线
佚名
2025-01-28 22:00:43
0

才刚刚1月,OpenAI就正式宣布进军AI智能体领域,中国公司智谱也推出新一版的GLM-PC 1.1。从回答问题到执行任务,AI智能体元年真的来了?

当地时间1月23日,美国人工智能公司OpenAI正式推出首款AI智能体Operator(意为操作员),这是OpenAI的首个AI智能体。Operator号称能够模拟人类操作浏览器完成购物、订餐、论文整理等操作,通过融合视觉识别与高级推理的CUA模型实现复杂步骤规划。

点击查看大图

具体的工作流程上,Operator会根据需求捕获屏幕画面,再将其添加到模型上下文,并通过GPT-4o的视觉能力准确理解界面内容,再依靠强化学习的推理能力制定下一步计划,最后使用虚拟鼠标和键盘,精确执行点击、滚动或输入的界面操作,直到任务完成或需要用户输入。

OpenAI创始人奥特曼介绍称,目前Operator将以每月200美元的订阅费,率先面向美国ChatGPT Pro用户开放测试。

而就在同一天,中国公司智谱AI也对外发布了去年12月公布的AI智能体GLM-PC 1.0的升级版 —— GLM-PC1.1,本次更新优化多种任务流程,甚至被业内人士称为“2.0也不为过”。智谱的 GLM-PC 不仅能自动处理文件、发送定制化微信内容,还通过借鉴人类的左右脑分工,以“左脑逻辑+右脑感知”的双引擎架构实现多模态交互,甚至生成代码与视频内容,展现超越文本生成的操作层突破。

其中,智谱公众号文章还实机演示了在淘宝中一键加购辣条等产品、截取小红书春节档图片转发微信群聊并询问观看意愿、以及给这个群聊的成员每人单独小窗发送一段2025年新春祝福语和AI自动生成的蛇年主题图片。

点击查看大图

新春祝福甚至可以按照每人名字定制发送。智谱AI

智谱介绍,新版 GLM-PC背后是智谱自主研发的多模态模型 CogAgent 与代码模型 CodeGeex 的深度融合。以代码形式指挥工作流程和工具调用,并强化了深度思考模式下的规划、推理、反思能力,从而能够稳定高效地应对复杂场景与任务。实际执行时,GLM-PC 能感知多层环境反馈,协助反思,以有效自我纠正与优化。

当前,通用人工智能技术已进入OpenAI所分类的L3级(智能体)阶段,核心竞争围绕各家企业模型的自主操作能力展开。

除了OpenAI和智谱,谷歌、微软、Anthropic以及国内等众多AI公司也都相继推出类似产品。上海人工智能产业研究院院长朱兆颖此前就曾预测,AI智能体将是生成式AI的下一个前沿,预计2025年市场规模将达100亿美元以上,2025年将成为AI智能体大放异彩的应用元年。

相关内容

AI智能体元年真来了?这次...
才刚刚1月,OpenAI就正式宣布进军AI智能体领域,中国公司智谱...
2025-01-28 22:00:43

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...