分享好友 资讯首页 频道列表

两大AI模型性能提升 登上国际榜单

2025-01-16 11:2496520

科技日报讯(记者李禾)近日,由盛大AI团队研发的模型Watt-tool-70B和Newsbang/homer-72B,登上国际知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt团队研发的旗舰模型,目前位列BFCL Leaderboard总榜单第一。

微信截图_20250116112700

据悉,榜单BFCL Leaderboard是由加州大学伯克利分校开发的评估LLM工具调用能力基准测试平台。作为目前大语言模型(LLM)最热门的研究方向之一,工具调用(Function-Calling)是为了让LLM理解,并能准确使用API(应用程序编程接口),来执行更复杂而具体的任务。在近期公布的最新一轮评估结果中,Watt的“多轮对话执行能力”相较于排名第二的GPT-4o 领先11分,比排名第十的Gemini-1.5-Pro 领先近40分。

“这个模型将加速大模型落地‘融合’过程。”Watt有关负责人说,还有助于从底层数据标注到人机交互的体系化建设,让大模型初步实现从“光说不练”到“能文能武”。

此外,由盛大集团NewsBang团队开发的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模型评测平台升级版本,采用更全面和严格评估标准,对各类开源大语言模型进行多维度测试和排名。Newsbang/homer-72B重视提升模型在推理和思考方面的能力,通过搭配数据筛选机制等,在多个核心评测维度,该模型性能有了大幅提升。

微信截图_20250116112743

据公开报道,2023年初,盛大集团宣布All in AI战略,去年10月,联合多家高校发表了AI与长期记忆方面的论文,其自研的OMNE大模型多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》合作推出全球AI驱动科学大奖,举办和支持包括“AI+精神健康”在内的各种高水平国际会议和夏校项目,助力培养跨学科青年AI人才等。

举报 0
收藏 0
打赏 0
“模速空间”这些企业,优刻得在服务
2025年4月29日,总书记在上海考察“模速空间”大模型创新生态社区,对上海在人工智能领域取得的成绩给予高度肯定。成立不到两年

0评论2025-04-305093

颁发450哥胡鸿八友证
2025年4月2日下午,中国智能化网总经理、深圳市智能化学会执行会长、阿智茶八10哥石锡铭先生给八友450哥深圳市萝卜智造机器人有

0评论2025-04-3088

绿色算力“升级”水管理需求,2025十大值得关注的气候技术为何有它?
人工智能在每次对话时,需要“喝”掉一口水、一瓶水,还是一吨水?到2030年,预估全球数据中心耗电量将超越哪个国家的总用电量,

0评论2025-04-295232

24小时工程师在线答疑!海尔发布暖通行业AI智能助手
双碳目标推动下,商用建筑用户正面临双重挑战:既要满足日益严苛的节能指标,又要破解人工管理效率低下的痛点。对于企业管理者而

0评论2025-04-28112

1项国家标准、4大技术创新!海尔智慧楼宇率先落地AI低碳建筑
空调能效低,运行能耗高;电费高,却找不到能耗漏洞在哪;机组多、管理乱,人工管理效率低导致维保支出增加……建筑节能到底该怎

0评论2025-04-28108

新关税背景下智能制造企业破局与出海沙龙"圆满举办
——专家共议境外市场机遇与跨境投资策略2025年4月25日下午,由深圳市智能化学会主办、广州光亚法兰克福展览有限公司和越洋商务

0评论2025-04-285150

CIMT2025华成控制系统实力圈粉(智能化学会副会长单位)
4月21日,第十九届中国国际机床展览会(CIMT2025)在北京顺义国际会展中心盛大开幕,近2000家展商齐聚亮相,解锁机床前沿科技。

0评论2025-04-245275

突破毫米级精度壁垒:深度解析华成工控工业机器人结构标定技术(智能化学会副会长单位)
在制造业智能化升级的浪潮中,工业机器人正面临精密加工、半导体封装等高精尖领域对毫米级定位精度的严苛挑战。针对传统机器人标

0评论2025-04-215475

顺源科技推出DIN2系列传感器信号隔离变送器(智能化学会副会长单位)
顺源科技(智能化学会副会长单位)深耕智能传感器与仪器仪表行业模拟信号隔离放大及变送技术研发已有22年经历,期间已获得行业内

0评论2025-04-195489

顺源科技推出数字化免调节智能温度变送器新产品(智能化学会副会长单位)
顺源科技(智能化学会副会长单位)深耕智能传感器与仪器仪表行业模拟信号隔离放大及变送技术研发已有22年经历,期间已获得行业

0评论2025-04-195485