• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

全新升级的扣子模型广场正式上线!在这里,大模型们将进行匿名对决,精彩纷呈,诚邀您前来观战!

全新升级的扣子模型广场正式上线!在这里,大模型们将进行匿名对决,精彩纷呈,诚邀您前来观战!
AI TOP100
2024-06-14 18:49:40

扣子(Coze)模型广场抖音旗下扣子AI模型广场全新启动,大模型在线对决,等你来Pick!

模型广场是扣子(Coze)推出的一款在线大模型比较与评价平台。在这里,用户可以参与模型对战,与两个匿名模型进行实时互动,并根据模型的回应进行投票。扣子将持续搜集用户的匿名投票数据,并运用Bradley-Terry模型对各大模型进行评分。

扣子(Coze)官网

地址:https://www.coze.cn/home

模型对战

模型对战是扣子推出的大模型性能基准测试平台,让用户直接体验并评估不同大模型的实际表现。

在匿名的对战页面上,您可以选择不同的对战方式,系统会随机挑选两个匿名大模型进行较量。它们将同时回应您提出的问题。在经过一轮或多轮对话后,您可以根据两个模型对同一问题的回答来进行投票,选出您认为更好的大模型。投票结束后,扣子将揭示这两个匿名模型的真实身份和具体配置。为确保对战公平,系统会尽量保证各模型的配置参数平衡,以便在相同或相近的配置下比较模型性能。

对战模式分为指定Bot对战、随机Bot对战和纯模型对战,分别用于评估大模型在特定应用场景和规则下的性能,以及大模型本身的文本生成能力。

模型对战将严格按照既定规则进行,您可以在对战规则中查看详细说明。


在模型对战中,您可以根据不同匿名模型在对话中的表现来投票,选择在本次对话中表现更佳的大模型,从而帮助我们全面评估各大模型在不同细分领域的能力差异。

扣子模型广场提供多种对战模式,适应各类模型评估需求:

  • 纯模型对战:在此模式下,我们排除编排和其他Bot配置的干扰,专注于评估大模型的文本生成能力。
  • 基于Bot的模型对战:利用扣子正式发布的Bots,在各种场景中比较不同大模型的问答效果,评估在真实业务场景下各模型的文本生成、技能调用和知识调用等能力,助您为不同领域的Bot挑选更适宜的大模型。

对战模式

扣子支持以下对战模式:扣子支持以下对战模式

如何开始对战

步骤如下:

1. 访问扣子首页。

2. 在左侧导航栏点击“模型广场”。

3. 在“匿名对战”标签下选择您希望的对战方式:

  - 指定Bot对战:从模型广场的Bot列表中挑选一个您感兴趣的Bot。

  - 随机Bot对战:点击“随机开始”按钮。

  - 纯模型对战:直接点击“纯模型对战”选项。

4. 在对话页面输入并发送您的消息。

5. 两个匿名模型将会同时回应您的问题。请注意,模型的回答质量受提问方式、Bot编排和模型能力等因素影响。您可以参考评测问题来快速评估模型的能力。

6. 根据两个模型的回答,进行投票,选择您认为更满意的答案。

7. 为了确保投票的有效性和公平性,您需要在收到至少一轮完整回复后才能进行投票。您可以选择“A更好”、“B更好”、“两者都好”或“两者都不好”。

8. 投票后,页面将显示两个模型的真实名称和详细配置信息,您可以参考对战结果来了解各配置的说明。

9. 投票完成后,本轮模型对战即告结束。您还可以选择:

  - 重开一轮:随机选择另外两个模型,在同一对战模式下开始新的一轮对战。

  - 分享:将对战结果分享给朋友或在社交网络上发布,邀请他人一同体验模型对战。扣子AI模型广场全新上线了解更多AI大赛信息请关注AITOP100平台活动专区: https://www.aitop100.cn/activity/index.html

AITOP100平台大赛社群二维码:

AITOP100平台大赛社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 扣子coze
相关资讯
  • UC浏览器×大鱼号:大鱼号漫剧合作政策

  • 宇树科技G1-D正式上线:人形机器人工作站“全能王”来袭!

  • 百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

  • 东北大学开源多语言翻译“重器”!NiuTrans.LMT支持60语种234方向,低资源语言翻译迎新曙光

  • 百度AI搜索大跃进!李彦宏称已成全球最激进搜索引擎公司

热点资讯

告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

6天前
告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

4天前
火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

3天前
百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?

6天前
国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?

AI落地天猫双11:搜索转化率提升20%,中小商家效率翻倍

4天前
AI落地天猫双11:搜索转化率提升20%,中小商家效率翻倍
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有