DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
有鱼爱电影 2025-09-18 11:10 1 浏览 0 评论
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。
DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。
在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。
DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。
DeepSeek还透露,为了防止基准测试数据污染,对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。
开源之后,R1在Hugging Face下载量破1090万次,成为全球最受欢迎的开源推理模型。
DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究者。DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。
在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。
今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。
作为全球首个通过同行评审的主流大语言模型,《自然》期刊不但将该篇论文作为封面论文,还在评论报道文章中用了“里程碑式论文揭示 DeepSeek AI 模型的秘密”、“创造历史”表达赞赏和肯定,此次论文发表标志着中国在大模型基础研究领域取得重要突破。
在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。
8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。
据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。
DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。
相关推荐
- 中航基金:《行动方案》推动人工智能应用重构基金公司投研核心竞争力
-
专题:北京公募基金高质量发展系列活动新时代、新基金、新价值 编者按:在“新时代·新基金·新价值——北京公募基金高质量发展在行动”主题引领下,中航基金积极响应北京证监局与北京证券业协会的号召,深入...
-
- 17岁男子杀害前女友,我32岁至今未婚却爱上个17岁的女孩,我到底要继续吗?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于17岁男子杀害前女友的问题,于是小编就整理了2个相关介绍17岁男子杀害前女友的解答,让我们一起看看吧。我32岁至今未婚却爱上个17岁的女孩,我到底要继续吗?首先,我觉得喜欢一个人是没错的,...
-
2025-09-18 12:40 有鱼爱电影
-
- 辽宁防空警报,收到公安局提醒短信意味着什么?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于辽宁防空警报的问题,于是小编就整理了2个相关介绍辽宁防空警报的解答,让我们一起看看吧。收到公安局提醒短信意味着什么?如果是你在报警和立案后收到公安机关的短信通知则是正常的,如果你并没有报警...
-
2025-09-18 12:40 有鱼爱电影
-
- 黄金白银小幅高开,连涨四周后回落,黄金现在是“抄底”的好时候吗?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于黄金白银小幅高开的问题,于是小编就整理了1个相关介绍黄金白银小幅高开的解答,让我们一起看看吧。连涨四周后回落,黄金现在是“抄底”的好时候吗?奇奇王告诉你,黄金近期的操作就是低吸,到达支撑位...
-
2025-09-18 12:10 有鱼爱电影
- 银华基金:前瞻布局绿色新“蓝海”,践行ESG责任担当
-
专题:北京公募基金高质量发展系列活动新时代、新基金、新价值 日前,北京证券业协会携手北京公募基金管理人、基金销售机构、基金评价机构,共同启动“北京公募基金高质量发展系列活动”。此次活动以“...
-
- 国泰海通:维持同程旅行增持评级 目标价27.88港元
-
国泰海通发布研报称,维持同程旅行(00780)增持评级。考虑OTA行业竞争格局依然稳定,且公司通过补贴效率提升等方式维持利润率稳步提升,维持公司25/26/27年经调整归母净利润至33.11/38.47/44.02亿元人民币(下同)。...
-
2025-09-18 11:45 有鱼爱电影
-
- 柠檬涨价雪王缺货,广东香水柠檬为何缺货?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于柠檬涨价雪王缺货的问题,于是小编就整理了1个相关介绍柠檬涨价雪王缺货的解答,让我们一起看看吧。广东香水柠檬为何缺货?柠檬是我们生活中非常常见的一种水果,我们不会单独食用,可以用来制作水果茶...
-
2025-09-18 11:40 有鱼爱电影
-
- 百度盘中大涨超5%创2年新高,月内累涨54%
-
9月18日消息,延续近期强势,百度集团-SW(9888.HK)盘中再度大涨超5%,报138港元,股价创2023年9月以来新高,百度集团月内已累涨超54%。截至发稿,百度涨5.04%,报价137.6港元,成交额逾21亿港元。 消息...
-
2025-09-18 11:20 有鱼爱电影
-
- 荣昌生物盘中涨超8% 泰它西普gMG中国Ⅲ期临床研究入选2025 AANEM口头报告
-
荣昌生物(09995)盘中涨超8%,截至发稿,股价上涨3.20%,现报109.60港元,成交额2.90亿港元。 9月18日,荣昌生物宣布,由公司自主研发的全球首创BLyS/APRIL双靶点融合蛋白创新药泰它西普(RC18,商品名:...
-
2025-09-18 11:15 有鱼爱电影
-
- 班主任被举报装监控,老师在教室里装摄像头,自己监视学生,这种做法对吗?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于班主任被举报装监控的问题,于是小编就整理了2个相关介绍班主任被举报装监控的解答,让我们一起看看吧。老师在教室里装摄像头,自己监视学生,这种做法对吗?老师在教室里装摄像头。自己监视学生,这种...
-
2025-09-18 11:10 有鱼爱电影
- DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
-
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登...
-
- 美国枪击警察3死2伤,怎么样看待美国枪支泛滥成灾,每年造成3万多人死于枪击事件呢?
-
大家好,今天小编关注到一个比较有意思的话题,就是关于美国枪击警察3死2伤的问题,于是小编就整理了1个相关介绍美国枪击警察3死2伤的解答,让我们一起看看吧。怎么样看待美国枪支泛滥成灾,每年造成3万多人死于枪击事件呢?我是萨沙,我来回答。这都是...
-
2025-09-18 10:40 有鱼爱电影
你 发表评论:
欢迎- 一周热门
- 最近发表
- 最新留言