OpenCompass/opencompass/configs/datasets/korbench/korbench_gen.py

from opencompass.datasets.korbench.korbench import korbenchDataset, korbenchEvaluator
from opencompass.openicl.icl_inferencer import GenInferencer
from opencompass.openicl.icl_prompt_template import PromptTemplate
from opencompass.openicl.icl_retriever import ZeroRetriever

categories = ['cipher', 'counterfactual', 'logic', 'operation', 'puzzle']

korbench_0shot_single_datasets = []

for category in categories:
    # Prompt template
    prompt_template = dict(
        type=PromptTemplate,
        template=dict(
            begin=[
                dict(
                    role='HUMAN',
                    prompt=''
                )
            ],
            round=[
                dict(
                    role='HUMAN',
                    prompt='{prompt}' # f-string
                )
            ]
        )
    )

    # Reader configuration
    reader_cfg = dict(
        input_columns=['prompt'],
        output_column='answer',
    )

    # Inference configuration
    infer_cfg = dict(
        prompt_template=prompt_template,
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer),
    )

    # Evaluation configuration
    eval_cfg = dict(
        evaluator=dict(type=korbenchEvaluator),
        pred_role='BOT',
    )

    korbench_dataset = dict(
        type=korbenchDataset,
        abbr=f'korbench_{category}',
        path='opencompass/korbench',
        prompt_mode='0_shot',
        category=category,
        reader_cfg=reader_cfg,
        infer_cfg=infer_cfg,
        eval_cfg=eval_cfg,
    )

    korbench_0shot_single_datasets.append(korbench_dataset)
fix datasets in fullbench_int3 2025-03-12 21:58:58 +08:00			`from opencompass.datasets.korbench.korbench import korbenchDataset, korbenchEvaluator`
			`from opencompass.openicl.icl_inferencer import GenInferencer`
			`from opencompass.openicl.icl_prompt_template import PromptTemplate`
			`from opencompass.openicl.icl_retriever import ZeroRetriever`

			`categories = ['cipher', 'counterfactual', 'logic', 'operation', 'puzzle']`

			`korbench_0shot_single_datasets = []`

			`for category in categories:`
			`# Prompt template`
			`prompt_template = dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`begin=[`
			`dict(`
			`role='HUMAN',`
			`prompt=''`
			`)`
			`],`
			`round=[`
			`dict(`
			`role='HUMAN',`
			`prompt='{prompt}' # f-string`
			`)`
			`]`
			`)`
			`)`

			`# Reader configuration`
			`reader_cfg = dict(`
			`input_columns=['prompt'],`
			`output_column='answer',`
			`)`

			`# Inference configuration`
			`infer_cfg = dict(`
			`prompt_template=prompt_template,`
			`retriever=dict(type=ZeroRetriever),`
fix 2025-03-24 16:27:45 +08:00			`inferencer=dict(type=GenInferencer),`
fix datasets in fullbench_int3 2025-03-12 21:58:58 +08:00			`)`

			`# Evaluation configuration`
			`eval_cfg = dict(`
			`evaluator=dict(type=korbenchEvaluator),`
			`pred_role='BOT',`
			`)`

			`korbench_dataset = dict(`
			`type=korbenchDataset,`
			`abbr=f'korbench_{category}',`
			`path='opencompass/korbench',`
			`prompt_mode='0_shot',`
			`category=category,`
			`reader_cfg=reader_cfg,`
			`infer_cfg=infer_cfg,`
			`eval_cfg=eval_cfg,`
			`)`

			`korbench_0shot_single_datasets.append(korbench_dataset)`