A simple program to evaluate large language model.

You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

Go to file

PeterAlbus 88a58600f6 优化评分部分文件结构，增加对比式gpt评分		8 months ago
evaluators	优化评分部分文件结构，增加对比式gpt评分	8 months ago
scoring	优化评分部分文件结构，增加对比式gpt评分	8 months ago
.gitignore	优化评分部分文件结构，增加对比式gpt评分	8 months ago
README.md	增加大模型评分模块以及问答数据集处理模块（半成品）。	9 months ago
compare.py	优化评分部分文件结构，增加对比式gpt评分	8 months ago
eval.py	优化评分部分文件结构，增加对比式gpt评分	8 months ago
generate_eval_text.py	Init commit. Add Evaluators and support ChatGLM/ChatGLM2.	10 months ago
test.py	优化评分部分文件结构，增加对比式gpt评分	8 months ago

LLM_Evaluator

A simple program to evaluate large language model.

需求其余文件

python eval.py --model_name chatglm --cuda_device 0 --finetune ptuning1