影客巴蜀 5熊猫

开启辅助访问历史地理旅游人物收藏本站切换到宽版

5熊猫网»论坛 › IT信息 › 科技 › OpenAl采用智谱标准评测GPT-4.1系列大模型

发新帖

开启左侧

查看: 27|回复: 0

麋鹿 发表于: 2025-4-16 14:39:00|显示全部楼层|阅读模式

[2025年] OpenAl采用智谱标准评测GPT-4.1系列大模型

: TechWeb

　　【TechWeb】4月15日消息，OpenAI发布的了最新GPT-4.1系列大模型，其中在评测函数调用能力时采用了ComplexFuncBench。
　　ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。
　　据悉，ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准，ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解，并在此基础上进行多步带推理的函数调用，这对模型的函数调用能力提出了更高的挑战。（果青）

『 5熊猫网』提醒，在使用本论坛之前您必须仔细阅读并同意下列条款：

遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规，并遵守您在会员注册时已同意的《『 5熊猫网』管理办法》；
严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容；
本帖子由麋鹿发表，享有版权和著作权（转帖除外），如需转载或引用本帖子中的图片和文字等内容时，必须事前征得麋鹿的书面同意；
本帖子由麋鹿发表，仅代表用户本人所为和观点，与『 5熊猫网』的立场无关，麋鹿承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
本帖子由麋鹿发表，帖子内容（可能）转载自其它媒体，但并不代表『 5熊猫网』赞同其观点和对其真实性负责。
本帖子由麋鹿发表，如违规、或侵犯到任何版权问题，请立即举报，本论坛将及时删除并致歉。
『 5熊猫网』管理员和版主有权不事先通知发帖者而删除其所发的帖子。

回复

使用道具举报

发新帖

动态|器材|教程|中介

影客:新闻|纪实|发现|自然|植物|动物|旅行|建筑|文物|民俗|演艺|美术|人像|人体|体育|生活|宗教|静物|商业|老照片|灌水

评论|文物|学术|宗教(佛教|道教)|民族|方言·民歌|美食|茶·道|美容·健康|时尚|男女|诗词|打油诗|散文|小说|演艺|美术|读书|旅行|曝光台

巴蜀:现代|抗日|古代|人物|国际

科技|校园|职场|财经|消费|慈善|图片|灌水

川渝|重庆|成都|四川|阿坝|巴中|达州|德阳|甘孜|广安|广元|乐山|凉山|泸州|眉山|绵阳|内江|南充|攀枝花|遂宁|雅安|宜宾|资阳|自贡

各地|陕西|甘肃|宁夏|青海|新疆|西藏|云南|贵州|广西|海南|台湾|内蒙古

5熊猫:艺术|保健|手机|电脑|家电|汽车|消费|科技|互联网|软件|财经|供方|需方|中介|传奇|游戏|创业

『主编』雷康电话:1308 6666 318, 180 8010 2770 - 邮箱:3214616@QQ.com (如有侵权，务请告知)

广告服务|会员协议|小黑屋|手机版|网站地图

© 2002-2025, 蜀ICP备12031014号, Powered by 5Panda

GMT+8, 2025-5-7 03:54, Processed in 0.046801 second(s), 8 queries, Gzip On, MemCache On

快速回复 返回顶部 返回列表