全新升级的扣子模型广场正式上线!在这里,大模型们将进行匿名对决,精彩纷呈,诚邀您前来观战!

AI资讯5天前更新 快创云
9 0

扣子(Coze)模型广场

抖音旗下扣子AI模型广场全新启动,大模型在线对决,等你来Pick!

模型广场是扣子(Coze)推出的一款在线大模型比较与评价平台。在这里,用户可以参与模型对战,与两个匿名模型进行实时互动,并根据模型的回应进行投票。扣子将持续搜集用户的匿名投票数据,并运用Bradley-Terry模型对各大模型进行评分。

扣子(Coze)官网

地址:https://www.coze.cn/home

模型对战

模型对战是扣子推出的大模型性能基准测试平台,让用户直接体验并评估不同大模型的实际表现。

在匿名的对战页面上,您可以选择不同的对战方式,系统会随机挑选两个匿名大模型进行较量。它们将同时回应您提出的问题。在经过一轮或多轮对话后,您可以根据两个模型对同一问题的回答来进行投票,选出您认为更好的大模型。投票结束后,扣子将揭示这两个匿名模型的真实身份和具体配置。为确保对战公平,系统会尽量保证各模型的配置参数平衡,以便在相同或相近的配置下比较模型性能。

对战模式分为指定Bot对战、随机Bot对战和纯模型对战,分别用于评估大模型在特定应用场景和规则下的性能,以及大模型本身的文本生成能力。

模型对战将严格按照既定规则进行,您可以在对战规则中查看详细说明。

在模型对战中,您可以根据不同匿名模型在对话中的表现来投票,选择在本次对话中表现更佳的大模型,从而帮助我们全面评估各大模型在不同细分领域的能力差异。

扣子模型广场提供多种对战模式,适应各类模型评估需求:

  • 纯模型对战:在此模式下,我们排除编排和其他Bot配置的干扰,专注于评估大模型的文本生成能力。
  • 基于Bot的模型对战:利用扣子正式发布的Bots,在各种场景中比较不同大模型的问答效果,评估在真实业务场景下各模型的文本生成、技能调用和知识调用等能力,助您为不同领域的Bot挑选更适宜的大模型。

对战模式

扣子支持以下对战模式:

扣子支持以下对战模式

如何开始对战

步骤如下:

1. 访问扣子首页。

2. 在左侧导航栏点击“模型广场”。

3. 在“匿名对战”标签下选择您希望的对战方式:

– 指定Bot对战:从模型广场的Bot列表中挑选一个您感兴趣的Bot。

– 随机Bot对战:点击“随机开始”按钮。

– 纯模型对战:直接点击“纯模型对战”选项。

4. 在对话页面输入并发送您的消息。

5. 两个匿名模型将会同时回应您的问题。请注意,模型的回答质量受提问方式、Bot编排和模型能力等因素影响。您可以参考评测问题来快速评估模型的能力。

6. 根据两个模型的回答,进行投票,选择您认为更满意的答案。

7. 为了确保投票的有效性和公平性,您需要在收到至少一轮完整回复后才能进行投票。您可以选择“A更好”、“B更好”、“两者都好”或“两者都不好”。

8. 投票后,页面将显示两个模型的真实名称和详细配置信息,您可以参考对战结果来了解各配置的说明。

9. 投票完成后,本轮模型对战即告结束。您还可以选择:

– 重开一轮:随机选择另外两个模型,在同一对战模式下开始新的一轮对战。

– 分享:将对战结果分享给朋友或在社交网络上发布,邀请他人一同体验模型对战。

扣子AI模型广场全新上线

了解更多AI大赛信息请关注AITOP100平台活动专区: https://www.aitop100.cn/activity/index.html

AITOP100平台大赛社群二维码:

AITOP100平台大赛社群二维码

© 版权声明

相关文章