DeepSeek推理模型预览版上线,解密o1推理过程
佚名
2024-11-27 22:00:57
0

IT之家 11 月 20 日消息,DeepSeek 宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 OpenAI o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等评测中,超越了 GPT-4o 等知名模型。

推理解码谜题_推理解密题目及答案_

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

推理解密题目及答案_推理解码谜题_

▲ 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关

IT之家注意到,DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。

官方称正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。

相关内容

2026上海环保展有啥亮点...
人工智能技术  开启环保新方向慕尼黑博览集团于1966年创立IFA...
2025-12-22 19:34:17
珠海航展和成都糖酒会,如何...
大家好,厉叔的这篇文章主要阐述了珠海航展和成都的糖酒会是如何带动城...
2025-12-22 19:33:09
天津广告印刷办公展、新疆展...
信息展会推荐榜在当今数字化时代,信息展会是获取行业动态和前沿技术的...
2025-12-22 19:08:30
展会宣传用短视频?这些专业...
在当今数字化时代,短视频已成为企业宣传和推广的重要工具。尤其是在展...
2025-12-20 19:08:42
2026年德国展会Faku...
Fakuma是全球最重要的塑料加工专业贸易博览会之一,被誉为“塑料...
2025-12-19 19:56:37
2025年中国会展业年会在...
会展BEN 2025年12月18日 08:15 北京本文转自“智海...
2025-12-19 19:08:50

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...