AI圈暗流涌动:Llama4来了,DeepSeekR2和GPT-5也不远
Meta发布Llama 4系列,强调多模态和超长上下文窗口,部分模型将开源。OpenAI确认O3和O4-mini即将上线,GPT-5推迟发布但将免费。DeepSeek与清华发布新论文,提出SPCT方法和元奖励模型,显著提升推理扩展性能。
本周全球被关税议题占据头条,但科技界的目光却聚焦在AI领域的密集动作上。
周末,Meta深夜突袭发布Llama 4系列,号称“原生多模态+千万级上下文窗口”,并首次披露单卡H100可运行的轻量化版本。此前OpenAI则宣布O3和O4-mini模型即将在几周内上线,同时确认GPT-5因技术整合和算力部署问题推迟数月。
DeepSeek则与清华大学的研究团队本周联合发布了一篇关于推理时Scaling的新论文,提出了一种名为自我原则点评调优的学习方法,并构建了DeepSeek-GRM系列模型。结合元奖励模型实现推理时扩展,性能接近671B大模型,暗示DeepSeek R2临近。
Meta强势推出Llama 4
多模态与超长上下文成亮点
周六,Meta正式发布了Llama 4系列模型,Llama 4全系采用混合专家架构,并实现了原生多模态训练,彻底告别了Llama 3纯文本模型的时代。此次发布的模型包括:
Llama 4 Scout;
Llama 4 Maverick;
以及强大的 Llama 4 Behemoth 预览。
此次公布的Llama 4 Maverick 和 Llama 4 Scout 将是开源软件。然而,Llama 4 的新许可证对使用有一定限制,例如月活用户超 7 亿的公司需申请特殊许可,且使用时需遵守多项品牌和归属要求。
前kaggle总裁,fast AI 创始人Jeremy Howard表示,虽然感谢开源,但Llama 4 Scout 和 Maverick 都是大型 MoE 模型,即使量化后也无法在消费级 GPU 上运行,这对开源社区的可及性来说是个不小的损失
Meta强调,Llama 4 Scout 和 Llama 4 Maverick 是其“迄今为止最 先进的型号”,也是“同类产品中多模态性最 好的版本”。
Scout亮点
:速度极快,原生支持多模态,拥有业界领 先的 1000 万+ Token 多模态上下文窗口,并且能在单张 H100 GPU 上运行(Int4 量化后)
Maverick性能
:在多个主流基准测试中击败了 GPT-4o 和 Gemini 2.0 Flash,推理和编码能力与新发布的 DeepSeek v3 相当,但激活参数量不到后者一半
X网友也对Scout模型的性能感到震惊,尤其是其在单GPU上运行并支持超长上下文窗口的能力。
最令人瞩目的是Llama 4 Behemoth。目前Behemoth仍处训练中,不过Meta将其定位为“世界上最智能的 LLM 之一”。这个拥有288B激活参数和2万亿总参数量的“巨兽”,在32000块GPU上训练了30万亿多模态Token,展现了Meta在AI领域的雄厚实力。
有X网友指出了Behemoth训练的性能潜力,强调了它在阶段就已经表现出超越多个最 高 级模型的能力,例如Claude 3.7 和Gemini 2.0 Pro。
还有X网友调侃了 Meta 的“烧钱”策略,同时对 Llama 4 的参数规模表示惊讶。
此前《The Information》周五报道称,在投资者向大型科技公司施压,要求其展示投资回报的情况下,Meta 计划今年投入高达650 亿美元来扩展其 AI 基础设施。
Open AI确认O3和O4-mini即将上线
GPT-5免费策略引轰动
在Llama 4发布的同时,OpenAI首席执行官Sam Altman则在社交媒体上确认,O3和O4-mini将在未来几周内发布,而GPT-5则将在未来几个月与公众见面。
尽管没有更多关于o3和o4mini的细节内容,但是Altman表示,OpenAI在很多方面真正改进了o3模型,一定会让用户大为满意。
实际上GPT-5的功能和发布时间才是市场关注的重点。据Altman透露,GPT-5将整合语音、Canvas、搜索、Deep Research等多项功能,成为OpenAI统一模型战略的核心。
这意味着GPT-5将不再是一个单一的模型,而是一个集成了多种工具和功能的综合系统。通过这种整合,GPT-5将能够自主使用工具,判断何时需要深入思考、何时可以快速响应,从而胜任各类复杂任务。OpenAI的这一举措旨在简化内部模型和产品体系,让AI真正实现随开随用的便捷性。
更令人兴奋的是,GPT-5将对免费用户开放无限使用权限,而付费用户则能体验到更高智力水平的版本。此前,奥特曼在和硅谷知名分析师Ben Thompson的深度对谈中,表示因为DeepSeek 的影响, GPT-5将考虑让用户免费使用。
不过对于GPT-5的发布时间反复推迟,有网友做出了下面这个时间表来调侃。
DeepSeek携手清华发布新论文
DeepSeek与清华大学的研究团队本周联合发布了一篇关于推理时Scaling的新论文,提出了一种名为自我原则点评调优的学习方法,并构建了DeepSeek-GRM系列模型。这一方法通过在线强化学习(RL)动态生成评判原则和点评内容,显著提升了通用奖励建模(RM)在推理阶段的可扩展性,并引入元奖励模型(meta RM)进一步优化扩展性能。

SPCT方法的核心在于将“原则”从传统的理解过程转变为奖励生成的一部分,使模型能够根据输入问题及其回答内容动态生成高质量的原则和点评。这种方法包括两个阶段:
拒绝式微调作为冷启动阶段,帮助模型适应不同输入类型;
基于规则的在线强化学习则进一步优化生成内容,提升奖励质量和推理扩展性。
为了优化投票过程,研究团队引入了元奖励模型。该模型通过判断生成原则和评论的正确性,过滤掉低质量样本,从而提升最终输出的准确性和可靠性。
实验结果显示,DeepSeek-GRM-27B在多个RM基准测试中显著优于现有方法和模型,尤其是在推理时扩展性方面表现出色。通过增加推理计算资源,DeepSeek-GRM-27B展现了强大的性能提升潜力,证明了推理阶段扩展策略的优势。
这一成果不仅推动了通用奖励建模的发展,也为AI模型在复杂任务中的应用提供了新的技术路径,甚至可能在DeepSeek R2上能看到该成果的展示。
有海外论坛网友调侃道,DeepSeek一贯是“论文后发模型”的节奏,竞争对手Llama-4可能因此受压。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:顾晓芸
最新阅读
-
“深交所·创享荟”打造资本市场服务国企改革新典范
9月27日,深交所举办第九期“创享荟”国企专业化整合专场活动。“创享荟”是深交所着力打造的具有深市特色的市场服务品牌,目前已围绕热点主题举办了多期专场活动,影响力和吸引力不断增强。 深交所相关负...
-
微软在GitHub上线开发工具包,助力开发者使用Rust语言编写Wind
,微软Azure首席技术官MarkRussinovich日前在X平台发文,公开微软最近宣布“扩大采用Rust语言的成果”,微软同时还在GitHub中发布了一系列开发工具包,让开发者可以使用Rust语言...
-
擦亮“金融为民”底色光大银行多维发力谱写“人民金融”新篇章
像这样面向听障人士的手语服务模式,光大银行已持续运行了四年。四年来,光大银行通过收集听障客群金融业务需求及沟通痛点,让金融服务更贴近听障人士的日常生活。而这,只是光大银行践行“金融为民”初心,努力提供...
-
云南信托联合多家金融机构进乡村开展金融知识普及教育
近日,为帮助广大农村群众进一步提升金融素养及金融风险防范意识,助力打造诚信、健康、安全、和谐的金融环境,在云南省农村信用社联合社、昆明市农村信用社联合社及昆明市西山区农村信用合作联社的共同协调组织下,...
-
“领头羊”计划走进广州番禺,超59家企业具备上市潜力
南方财经全媒体记者翁榕涛实习生曾日丽广州报道 9月26日下午,广州企业上市“领头羊”行动计划“番禺行动”启动仪式在番禺节能科技园交流中心举行。 据南方财经全媒体记者了解,今年7月以来,广州市地方金...
-
算力牛股中际旭创股价“反攻”800G能否助三季度业绩惯性增长?
21世纪经济报道记者雷晨实习生原婷婷北京报道 近期受国内外AI利好消息驱动,二级市场上,中际旭创股价重新抬头,9月26日、9月27日连续上涨。截至9月27日收盘,公司股价报收于114.07元/股,收...
-
索尼申请外置小型触摸屏专利,可“架在”PS5手柄上远程游玩游戏
,据外媒gamerant报道,索尼近日注册了一项新专利,从文件内容上来看,这项专利主要显示,外加可以使用一个“触摸屏”连接DualSense手柄,来游玩PS5游戏。 图源索尼 索尼于此前正式公布了...
-
国庆黄金周运输今日启动,长三角铁路预计发送超250万人次
国庆黄金周运输启动。 9月27日,澎湃新闻记者从中国铁路上海局集团有限公司获悉,今天是铁路国庆黄金周运输首日,长三角铁路预计发送旅客逾250万人次,较2019年同期多发送60余万人次,增幅超三成。 ...
-
阿里拟分拆菜鸟在港上市菜鸟子公司已申请上百项物流专利
9月26日,阿里巴巴港交所公告,拟通过以菜鸟股份于香港联交所主板独立上市的方式分拆菜鸟。拟议分拆完成后,阿里巴巴将继续持有菜鸟50%以上的股份,菜鸟将仍为其子公司。 天眼查App显示,菜鸟网络科技有...
-
分析机构:中国消费者平均需要119%月薪,才可购买苹果iPhone15P
,苹果公司本月发布了iPhone15系列手机,其中iPhone15ProMax国行起售价为9999元人民币,分析机构WorldofStatistics日前分享了相关统计数据,概述了全球各国家地区消费者...