LLM_Evaluator/evaluators/chatglm.py

import os
import re
from tqdm import tqdm
import torch
from transformers import AutoTokenizer, AutoModel, AutoConfig
from transformers.generation.logits_process import LogitsProcessor
from transformers.generation.utils import LogitsProcessorList
from evaluators.evaluator import Evaluator
from evaluators.chatglm_mixin import ChatGLMMixin


class ChatGLM_Evaluator(Evaluator, ChatGLMMixin):
    def __init__(self, choices, k, model_name, device='cpu', finetune=None, finetune_method=None):
        super(ChatGLM_Evaluator, self).__init__(choices, model_name, k)
        self.finetune_method = finetune_method
        self.finetune_name = finetune
        self.tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror="tuna")
        if finetune_method == "ptuning":
            CHECKPOINT_PATH = "ptuning/glm1/" + finetune
            config = AutoConfig.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, pre_seq_len=128)
            self.model = AutoModel.from_pretrained("THUDM/chatglm-6b", config=config, trust_remote_code=True)
            prefix_state_dict = torch.load(os.path.join(CHECKPOINT_PATH, "pytorch_model.bin"))
            new_prefix_state_dict = {}
            for k, v in prefix_state_dict.items():
                if k.startswith("transformer.prefix_encoder."):
                    new_prefix_state_dict[k[len("transformer.prefix_encoder."):]] = v
            self.model.transformer.prefix_encoder.load_state_dict(new_prefix_state_dict)
            self.model = self.model.half().to(device)
            self.model.transformer.prefix_encoder.float()
            print("Model loaded! use GLM + " + finetune)
        else:
            self.model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror="tuna",
                                                   resume_download=True).half().to(device)
            print("Model loaded! (GLM original)")
        # self.model = self.model.eval()
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago			`import os`
			`import re`
			`from tqdm import tqdm`
			`import torch`
			`from transformers import AutoTokenizer, AutoModel, AutoConfig`
			`from transformers.generation.logits_process import LogitsProcessor`
			`from transformers.generation.utils import LogitsProcessorList`
			`from evaluators.evaluator import Evaluator`
优化代码结构，减少重复代码，增加复用模块。完善评估流程，保证选择题->问答题->大模型评估全流程覆盖。 7 months ago			`from evaluators.chatglm_mixin import ChatGLMMixin`
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago
增加大模型评分模块以及问答数据集处理模块（半成品）。 9 months ago
优化代码结构，减少重复代码，增加复用模块。完善评估流程，保证选择题->问答题->大模型评估全流程覆盖。 7 months ago			`class ChatGLM_Evaluator(Evaluator, ChatGLMMixin):`
			`def __init__(self, choices, k, model_name, device='cpu', finetune=None, finetune_method=None):`
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago			`super(ChatGLM_Evaluator, self).__init__(choices, model_name, k)`
优化代码结构，减少重复代码，增加复用模块。完善评估流程，保证选择题->问答题->大模型评估全流程覆盖。 7 months ago			`self.finetune_method = finetune_method`
			`self.finetune_name = finetune`
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago			`self.tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror="tuna")`
优化评分部分文件结构，增加对比式gpt评分 8 months ago			`if finetune_method == "ptuning":`
			`CHECKPOINT_PATH = "ptuning/glm1/" + finetune`
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago			`config = AutoConfig.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, pre_seq_len=128)`
			`self.model = AutoModel.from_pretrained("THUDM/chatglm-6b", config=config, trust_remote_code=True)`
			`prefix_state_dict = torch.load(os.path.join(CHECKPOINT_PATH, "pytorch_model.bin"))`
			`new_prefix_state_dict = {}`
			`for k, v in prefix_state_dict.items():`
			`if k.startswith("transformer.prefix_encoder."):`
			`new_prefix_state_dict[k[len("transformer.prefix_encoder."):]] = v`
			`self.model.transformer.prefix_encoder.load_state_dict(new_prefix_state_dict)`
			`self.model = self.model.half().to(device)`
			`self.model.transformer.prefix_encoder.float()`
			`print("Model loaded! use GLM + " + finetune)`
			`else:`
增加大模型评分模块以及问答数据集处理模块（半成品）。 9 months ago			`self.model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror="tuna",`
			`resume_download=True).half().to(device)`
优化评分部分文件结构，增加对比式gpt评分 8 months ago			`print("Model loaded! (GLM original)")`
Init commit. Add Evaluators and support ChatGLM/ChatGLM2. 10 months ago			`# self.model = self.model.eval()`