
时间: 2025-04-28 08:37:36 | 作者: 高光速冷速热模温机
3月27日,阿里宣告开源Qwen2.5-Omni,这是通义系列模型中首个端到端全模态大模型。
据阿里介绍,Qwen2.5-Omni可一起处理文本、图画、音频和视频等多种模态数据的输入,并实时生成文本与天然语音组成输出。
相较于GPT-4o、Gemini-1.5-Pro 等数千亿参数的闭源大模型,Qwen2.5-Omni仅有70 亿参数。阿里标明,这让全模态大模型在工业上的广泛使用成为或许。即使在手机上,也能布置和使用Qwen2.5-Omni模型。此前,阿里巴巴联合创始人、董事局主席蔡崇信确认了阿里与苹果就AI协作的风闻,国行版苹果手机将选用阿里的AI技能。
除了参数尺度小的优势外,阿里称Qwen2.5-Omni在语音了解、图片了解、视频了解、语音生成等范畴的测评分数,均抢先于专门的Qwen2-Audio或Qwen2.5-VL模型,且语音生成测评分数(4.51)达到了与人类相等的才干。
这得益于Qwen2.5-Omni选用的Thinker-Talker双核架构等技能的立异。Thinker负责处理和了解用户输入的内容,Talker则输出相应的语音符号,比如让模型具有了人类的“大脑”和“发声器”。
阿里方面还发布了大模型开源道路的效果:到现在,海内外AI开源社区中千问Qwen的衍生模型数量打破10万,是公认的全球榜首开源模型。另据全球最大AI开源社区Huggingface在2月10日发布的开源大模型榜单,排名前十的开源大模型,均是根据阿里通义千问开源模型二次练习的衍生模型。
“开源本质上也是在比拼谁的技能更强,有抢先力才有含义。”3月27日,阿里云通义大模型事务总经理徐栋在博鳌亚洲论坛期间承受南都记者正常采访时说,假如大模型公司仅仅开源一款排名第二乃至更落后的模型,对业界而言便失掉含义,这些开源模型会被吞没。
尽管DeepSeek扭转了开源和闭源模型阵营的力气比对,包含百度在内的闭源道路度转向,但徐栋以为,这不意味着一切企业一定会寻求开源。由于其他公司或许评价其模型的才干达不到开源的实力,开源之后未必能立刻得到许多反应。
3月27日,阿里云通义大模型事务总经理徐栋在博鳌亚洲论坛一场分论坛上参加评论。图:柳树
受访时,谈及AI使用层的远景,徐栋标明,很多研讨论文的出现标明,当下模型功能的鸿沟探究没有彻底打开,模型的才干正处于开展初期至中期的阶段。还需要一些时刻,才干看到AI使用层的迸发。
AI智能体是AI落地使用的形状之一。近期,Manus带火Computer Use Agent(用于电脑的智能体)概念。此前,手机出产厂商也在嵌入能自主操作用户指令的AI智能体。但徐栋以为,这类智能体还在相对前期的状况,延时是一个很大的问题,并且精度有待提高。别的,这些智能体现在依赖于云端运转,假如后续能落地到端侧,将会带来更多的商业或许性。
特别声明:以上内容(如有图片或视频亦包含在内)为自媒体渠道“网易号”用户上传并发布,本渠道仅供给信息存储服务。
著名演员陈道明坐问界M9现身赛力斯展台,现场戏弄:怎样来了这么多人!我开了三个月,我以为问界M9很好
暴升4500万!莫布里拿下DPOY 5年2.24亿合同秒变5年2.69亿!
哈登:人生有几个榜首次?今日Intuit Dome首场季后赛 冲就完了!
价值675元!REDMI Turbo 4 Pro首销送五大权益:1年只换不修、进水宝