本次作业主要是使用OpenCompass进行测评,基础部分只要按照文档一步步进行:
文档链接:https://github.com/InternLM/tutorial/blob/main/opencompass/opencompass_tutorial.md
使用 OpenCompass 评测 InternLM2-Chat-7B 模型在 C-Eval 数据集上的性能 进阶作业
结果如下: