[Feature] Add dingo test (#1529)

* add qa dingo * update * change name qa to dingo * eval model: llm_base * update path * change name and move path * add eval_dingo * update import * add for pip * add dingo package * change import place * update import place * fix lint fail * isort * double quoted --------- Co-authored-by: sj <shijin@pjlab.org.cn>
2025-05-30 16:03:24 +08:00 · 2024-09-29 19:24:58 +08:00 · 2024-09-29 19:24:58 +08:00 · 7528b8ab8a
commit 7528b8ab8a
parent 85a28874aa
6 changed files with 161 additions and 0 deletions
--- a/configs/datasets/dingo/dingo_gen.py
+++ b/configs/datasets/dingo/dingo_gen.py
@ -0,0 +1,34 @@
 from opencompass.openicl.icl_prompt_template import PromptTemplate
 from opencompass.openicl.icl_retriever import ZeroRetriever
 from opencompass.openicl.icl_inferencer import GenInferencer
 from opencompass.datasets import DingoDataset, DingoEvaluator
 dingo_paths = [
    './data/dingo/en_192.csv',
    './data/dingo/zh_170.csv',
 ]
 dingo_datasets = []
 for path in dingo_paths:
    dingo_reader_cfg = dict(input_columns='input', output_column=None)
    dingo_infer_cfg = dict(
        prompt_template=dict(
            type=PromptTemplate,
            template=dict(round=[dict(role='HUMAN', prompt='{input}')])),
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer),
    )
    dingo_eval_cfg = dict(evaluator=dict(type=DingoEvaluator), pred_role='BOT')
    dingo_datasets.append(
        dict(
            abbr='dingo_' + path.split('/')[-1].split('.csv')[0],
            type=DingoDataset,
            path=path,
            reader_cfg=dingo_reader_cfg,
            infer_cfg=dingo_infer_cfg,
            eval_cfg=dingo_eval_cfg,
        ))
 datasets = dingo_datasets
--- a/configs/eval_dingo.py
+++ b/configs/eval_dingo.py
@ -0,0 +1,7 @@
 from mmengine.config import read_base
 with read_base():
    from .models.hf_internlm.hf_internlm_7b import models
    from .datasets.dingo.dingo_gen import datasets
 work_dir = './outputs/eval_dingo'
--- a/opencompass/configs/datasets/dingo/dingo_gen.py
+++ b/opencompass/configs/datasets/dingo/dingo_gen.py
@ -0,0 +1,34 @@
 from opencompass.openicl.icl_prompt_template import PromptTemplate
 from opencompass.openicl.icl_retriever import ZeroRetriever
 from opencompass.openicl.icl_inferencer import GenInferencer
 from opencompass.datasets import DingoDataset, DingoEvaluator
 dingo_paths = [
    './data/dingo/en_192.csv',
    './data/dingo/zh_170.csv',
 ]
 dingo_datasets = []
 for path in dingo_paths:
    dingo_reader_cfg = dict(input_columns='input', output_column=None)
    dingo_infer_cfg = dict(
        prompt_template=dict(
            type=PromptTemplate,
            template=dict(round=[dict(role='HUMAN', prompt='{input}')])),
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer),
    )
    dingo_eval_cfg = dict(evaluator=dict(type=DingoEvaluator), pred_role='BOT')
    dingo_datasets.append(
        dict(
            abbr='dingo_' + path.split('/')[-1].split('.csv')[0],
            type=DingoDataset,
            path=path,
            reader_cfg=dingo_reader_cfg,
            infer_cfg=dingo_infer_cfg,
            eval_cfg=dingo_eval_cfg,
        ))
 datasets = dingo_datasets
--- a/opencompass/datasets/init.py
+++ b/opencompass/datasets/init.py
@ -33,6 +33,7 @@ from .crowspairs_cn import *  # noqa: F401, F403
 from .csl import *  # noqa: F401, F403
 from .custom import *  # noqa: F401, F403
 from .cvalues import *  # noqa: F401, F403
 from .dingo import *  # noqa: F401, F403
 from .drcd import *  # noqa: F401, F403
 from .drop import *  # noqa: F401, F403
 from .drop_simple_eval import *  # noqa: F401, F403
--- a/opencompass/datasets/dingo.py
+++ b/opencompass/datasets/dingo.py
@ -0,0 +1,84 @@
 # flake8: nodingo
 # yapf: disable
 import csv
 import json
 import os
 import time
 from typing import List
 from datasets import Dataset
 from opencompass.openicl.icl_evaluator import BaseEvaluator
 from opencompass.registry import ICL_EVALUATORS, LOAD_DATASET
 from .base import BaseDataset
@LOAD_DATASET.register_module()
 class DingoDataset(BaseDataset):
    @staticmethod
    def load(path: str):
        raw_data = []
        with open(path, encoding='utf-8') as f:
            reader = csv.reader(f, delimiter=';')
            for row in reader:
                if len(row) < 1:
                    row = ['']
                raw_data.append({'input': row[0]})
        return Dataset.from_list(raw_data)
@LOAD_DATASET.register_module()
 class DingoLongDataset(BaseDataset):
    @staticmethod
    def load(path: str):
        raw_data = []
        with open(path, 'r', encoding='utf-8') as f:
            for line in f:
                raw_data.append({'input': json.loads(line).get('input')})
        return Dataset.from_list(raw_data)
@ICL_EVALUATORS.register_module()
 class DingoEvaluator(BaseEvaluator):
    def score(self, origin_prompt: List, predictions: List) -> dict:
        try:
            # from dingo.model.model import Model
            from dingo.exec import Executor
            from dingo.io import InputArgs
        except Exception:
            raise ModuleNotFoundError(
                '=========== '
                'dingo register fail. please try: pip install dingo-python.'
                ' ===========')
        current_time = time.strftime('%Y%m%d_%H%M%S', time.localtime())
        file_data = [{'prompt': pmt, 'prediction': prd}
                     for pmt, prd in zip(origin_prompt, predictions)]
        file_name = 'dingo_file_' + current_time + '.jsonl'
        with open(file_name, 'a', encoding='utf-8') as f:
            for d in file_data:
                json.dump(d, f, ensure_ascii=False)
                f.write('\n')
        input_data = {
            'eval_models': ['llm_base'],
            'input_path': file_name,
            'output_path': './outputs/dingo/',
            'dataset': 'local',
            'datasource': 'local',
            'data_format': 'jsonl',
            'column_prompt': ['prompt'],
            'column_content': ['prediction'],
        }
        # Model.apply_config(input_data["custom_config_path"])
        input_args = InputArgs(**input_data)
        executor = Executor.exec_map['local'](input_args)
        result = executor.execute()
        summary = result[0].to_dict()
        os.remove(file_name)
        return summary
--- a/requirements/extra.txt
+++ b/requirements/extra.txt
@ -1,6 +1,7 @@
 # Alpaca-eval
 alpaca-eval==0.6
 cn2an
 dingo-python
 # Icl topk retriever
 faiss_gpu==1.7.2
 # Humaneval, Humaneval X