5熊猫网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

开启左侧
查看: 27|回复: 0
 麋鹿 发表于: 2025-4-16 14:39:00|显示全部楼层|阅读模式

[2025年] OpenAl采用智谱标准评测GPT-4.1系列大模型

 [复制链接]
  : TechWeb
  【TechWeb】4月15日消息,OpenAI发布的了最新GPT-4.1系列大模型,其中在评测函数调用能力时采用了ComplexFuncBench。
  ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。
  据悉,ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准,ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解,并在此基础上进行多步带推理的函数调用,这对模型的函数调用能力提出了更高的挑战。(果青)
『 5熊猫网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 5熊猫网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 麋鹿 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 麋鹿 的书面同意;
  4. 本帖子由 麋鹿 发表,仅代表用户本人所为和观点,与『 5熊猫网 』的立场无关,麋鹿 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 麋鹿 发表,帖子内容(可能)转载自其它媒体,但并不代表『 5熊猫网 』赞同其观点和对其真实性负责。
  6. 本帖子由 麋鹿 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 5熊猫网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2025, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2025-5-7 03:54, Processed in 0.046801 second(s), 8 queries, Gzip On, MemCache On
快速回复 返回顶部 返回列表