阿里开源新一代通义千问模型Qwen3

快讯  |  来源: 第一财经  |  2025-04-29 16:13:45

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

千问3总参数量235B,激活仅需22B。阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型面向手机端,8B可在电脑和汽车端侧部署应用等。

声明:文章内容为作者独立观点,不代表物流指闻立场。凡来源为“物流指闻”的内容,其版权均属指闻科技(杭州)有限公司所有,转载时请务必注明作者姓名及“来源:物流指闻”。未经许可,禁止进行转载、摘编、引用等任何使用,我们将保留追责权利。

更多深度策划、最新资讯、行业报告、现场视频,欢迎在微信中搜索“物流指闻”,或用微信扫描二维码,添加关注,将行业收录指尖。

0 0

参与评论

最新评论

热门文章

0

0

我们期待与您互动,不要吝啬您的建议与意见。

黄刚老师深入交流请加微信:huanggang36
商务合作、爆料、投稿请加微信:logvip56
猎头、跳槽、招聘服务请加微信:headscmhrv

汉森商学院学员申请咨询请加微信:scmschool
线下活动、峰会合作请加微信:scmgroup
投稿邮箱:tougao@headscm.com

扫描二维码
关注物流指闻微信公众平台
更多深度策划、最新资讯、行业报告、现场视频,欢迎在微信中搜索“物流指闻”,或用微信扫描二维码,添加关注,将行业收录指尖。

汉森总部电话11:010-62656566(工作时间:周一至周五 9:30-18:30)   地址:北京市亦庄经济技术开发区荣华南路13号中航国际广场L1栋9层

汉森供应链管理集团有限公司 版权所有    备案号:京ICP备10020813号-1