下载app

扫码下载

扫码关注

新华报业网  > 首页 > 正文
AI周爆|斯坦福团队最新报告称中美AI模型性能差距显著缩小,微信首个AI助手上线

本周AI领域动态频出。斯坦福大学HAI发布《2025人工智能指数报告》,公布全球AI贡献度排名,指出中美顶尖模型性能差距显著缩小;OpenAI宣布停止GPT-4.5 API服务并推出新模型;快手可灵2.0视频生成模型升级亮相;微信首个AI助手“元宝”正式上线。

全球企业/机构的AI贡献度排名出炉,阿里巴巴排名全球第三

4月8日,由全球著名华人人工智能学者李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI),发布了《2025 年人工智能指数报告》(Artificial Intelligence Index Report 2025)。自2017年首度发布以来,其多维度的评估框架和跨年度的数据追踪,已成为全球学术界和产业界观察AI技术演进的重要参照。

报告根据论文引用率、技术领先度、是否规模化使用,将61个模型纳入2024年度全球“重要模型”。其中美国贡献40个,中国贡献15个,美、中两国的“重要模型”占全球总数的90.2%。

从具体机构分布来看,谷歌与OpenAI各占7席并列榜首,阿里巴巴以6个入选模型紧随其后,排名全球第三,中国第一。

此外,中美顶尖模型之间的性能差距正在缩小,而这一转变背后的关键助推力量,是以阿里Qwen、深度求索DeepSeek为代表的飞速发展的中国开源模型体系。

2023年,顶尖美国模型显著优于中国同类产品。而到2024年,这一优势已不复存在。2023年底,在MMLU、MMMU、MATH和HumanEval等基准测试中,性能差距分别为17.5%、13.5%、24.3%和31.6%。到2024年底,这些差距大幅缩小至0.3%、8.1%、1.6%和3.7%。在业界权威的“大模型竞技场”(LMSYS Chatbot Arena)评测榜单上,中美大模型的差距分值缩小至30分以内。

OpenAI宣布将停止通过API提供GPT-4.5模型

4月15日,OpenAI宣布将很快停止通过其应用程序接口(API)提供其迄今为止规模最大的人工智能模型GPT-4.5,该模型于今年2月下旬刚刚发布。

OpenAI表示,开发者可以继续通过API使用GPT-4.5直至7月14日。在此之后,开发者将需要转向使用OpenAI产品目录中的其他模型。该公司同时于今日推出了新的GPT-4.1模型,并将其定位为GPT-4.5的首选替代品。

“GPT-4.1在关键领域的表现与GPT-4.5相当,甚至有所改进,而且成本要低得多。”OpenAI的一位发言人表示,“我们将淘汰GPT-4.5,以优先构建未来的模型。”

不过,此次调整仅限于API层面。GPT-4.5并不会从ChatGPT平台移除,付费用户仍可以研究预览版的形式继续使用该模型。

此外,本周OpenAI还发布了多款产品,全面提升编程、推理与多模态处理能力。4月14日,推出GPT-4.1系列(含Mini和Nano版),其最大亮点是支持100万token的上下文处理能力,是GPT-4o的8倍,这也是OpenAI首次发布长窗口模型。这一突破使得模型能够处理超长文本,适用于法律、金融、编程等领域的复杂任务。4月16日,发布推理模型o3与o4-mini,首次实现“图像思考”,可处理图表、草图等视觉任务,并能独立使用ChatGPT工具。

快手可灵发布2.0版本

4月15日,快手旗下的可灵AI发布可灵2.0视频生成模型及可图2.0图像生成模型。

据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)登上图生视频(Image to Video)赛道榜首。

值得注意的是,本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景等在内的多维度复杂创意,直接高效地传达给AI。

海外科技媒体The Rundown AI评价称,随着字节跳动的Seaweed模型和现在的可灵2.0模型,中国公司继续在AI视频生成方面取得快速进展。早期反响表明,可灵2.0正在迅速缩小和Veo、Sora等模型的质量差距。

微信首个AI助手上线

4月16日,微信首个 AI 助手悄悄上线,用户在微信搜索“元宝”,即可找到“聊天”入口。官方介绍显示,微信中的“元宝”是腾讯元宝App入驻微信的AI助手,搭载了混元和DeepSeek双模引擎,可以一键解析公众号文章和任何图片和文档。据测试,目前微信中的“元宝”只能解析公众号、文档和图片,不支持视频和音频。另外,它具备联网功能,可以获取最新的消息,在面对复杂问题时,也可以自动触发思考模式。

英伟达宣布将在美国本土首次全面生产AI超级计算机

4月14日,英伟达宣布将联合多家制造伙伴,在美国设计并建设工厂,将首次在美国本土全面生产其人工智能超级计算机和Blackwell系列AI芯片。

英伟达CEO黄仁勋在声明中表示,公司与台积电(TSMC)、富士康、纬创(Wistron)、安靠(Amkor)和矽品(SPIL)等合作伙伴共同启动生产计划。

其中,Blackwell芯片已在台积电位于亚利桑那州凤凰城的新工厂投产,而AI超级计算机组装线则落地得克萨斯州——富士康负责休斯敦工厂,纬创负责达拉斯工厂,两厂预计未来12至15个月内实现大规模量产。

新华日报·交汇点记者 杨易臻 蔡姝雯 张宣

责编:程晓琳
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间