例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。2、KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支
o(╯□╰)o
例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。 2、KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支
╯△╰
li ru , K w a i Y i i - 1 3 B - B a s e yu xun lian mo xing zai M M L U 、 C M M L U 、 C - E v a l 、 H u m a n E v a l deng B e n c h m a r k shang mu qian chu yu tong deng mo xing gui mo de ling xian shui ping 。 2 、 K w a i Y i i - 1 3 B - C h a t dui hua mo xing ju bei chu se de yu yan li jie he sheng cheng neng li , zhi . . .
>ω<
例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。 2、KwaiYii-13B-Chat对话模型具备出色的语
IT之家8 月 21 日消息,近日,快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。 在最新的 CMMLU 中文向排
数据和评估代码:https://github/haonan-li/CMMLU 本文所提出的 CMMLU,这是一个全新全面的中文评估数据集,旨在专门评估 LLM 在中文语言和文化背景下的高级知识和推理能力。 CMMLU
例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。 2、KwaiYii-13B-Chat对话模型具备出色的语
CMMLU 数据集使用Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License许可协议。
数据和评估代码:https://github/haonan-li/CMMLU 本文所提出的 CMMLU,这是一个全新全面的中文评估数据集,旨在专门评估 LLM 在中文语言和文化背景下的高级知识和推理能力。 CMMLU
∪^∪
快科技8月21日消息,近日,快手的自研大模型“快意”(KuaiYii)已经出现在了AI综合中文评估基准CMMLU的榜单中。 截至本文成稿,该模型的13B版本KwaiYii-13B同时位
客观效果评测:C-Eval 客观效果评测:CMMLU 长上下文版模型评测 量化效果评测 投机采样加速效果评测 人类偏好对齐(RLHF)版本评测 对齐水平 客观效果评测:C-Eval & CMMLU 训练与
发表评论