8月,魔搭社区联合香港中文大学(深圳)、深圳市大数据研究院、阿里云开发者社区、阿里云开发者评测发布中文竞技场大模型评测活动,汇聚了包括Baichuan-13B、ChatGLM2-6B、Qwen-Chat-7B、moss-moon-003-sft、Ziya-LLaMa-13B-v1等十余款开源大模型在中文对话场域同台PK。

 

活动提供 iPhone 14pro、Airpods、社区精美周边等限量诚意好礼,诚邀各位大语言模型爱好者们体验、评测投稿,并根据评测投稿质量、人气、速度分别设立奖项。

 

 
评测活动细则

 

活动时间:

2023年8月15日-2023年9月25日

 

参与对象:

阿里云认证用户

 

活动入口:

https://developer.aliyun.com/topic/ms2023

 

具体玩法:

1、体验场景:十余款中文大模型同台竞技

(中文竞技场模型评测平台由魔搭社区提供能力,后文详细介绍玩法)

 

2、场景评测:写下真实评测,角逐最佳评测

进入【文章发布页面】,写下中文竞技场大模型真实评测,参与投稿位置点击【投稿入口】进行提交评审。

 

评测一等奖获得者将被评为“中文竞技场大模型最佳评测官”,在重磅奖品基础上,还有机会参观阿里云云谷,与产研团队实地座谈!

 

3、超级豪礼:发布体验评测,参与角逐赢大奖!

活动期间,依据用户提交顺序及评审要求,为广大开发者提供多款好礼:

 

  • 一等奖(导师评选产生) 1名  

iPhone 14pro / 开发者评测全套周边 / 阿里云社区最佳评测官奖杯

 

  • 二等奖(导师评选产生) 2名 

ModelScope定制周边背包 / Airpods耳机 / 阿里云社区优质评测证书

 

  • 三等奖(点赞量前20名) 20名 

ModelScope / 定制周边T恤

 

  • 参与奖(发布评测前100名) 100名 

30元天猫超市卡

 

 
中文竞技场大模型玩法

 

双模型匿名评测

 

玩法一:选择系统推荐的prompt提问

第一步:选择对话类型,系统会自动推荐prompt,直接点击发送,即可体验效果;

第二步:根据结果选择模型的效果,A更好,B更好,都很好,都很差,选择后,可以看到匿名的两个模型名称。

 

玩法二:构建自己的prompt

第一步:选择对话类型,修改或者清空并重写系统推荐的prompt,点击发送,即可体验效果

第二步:根据结果选择模型的效果,A更好,B更好,都很好,都很差,选择后,可以看到匿名的两个模型名称。

 

模型自动对话

模型自动对话不支持自定义prompt,同时中文竞技场已经准备好了丰富的多场景prompts,供用户体验。

第一步:选择对话类型,系统会自动推荐prompt,直接点击发送,即可体验效果

第二步:根据A模型和B模型的对话效果,选出效果更好的模型

此时模型会模拟一个场景,并展开场景下的两人的对话。

 

单模型对话

可选择任意的模型测试效果。目前支持14个主流的中文LLM

Logo
欢迎加入ModelScope魔搭中文开源社区

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐

  • · ModelScope魔搭9月版本发布月报
  • · 社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜
  • · ComfyUI+多模态LLM--手搓一个好用的视频/图片提示词反推器
cover

ModelScope魔搭9月版本发布月报

cover

社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜

cover

ComfyUI+多模态LLM--手搓一个好用的视频/图片提示词反推器