OpenCompass/opencompass/configs/datasets/matbench/matbench_gen_regex_judge.py

from opencompass.openicl.icl_prompt_template import PromptTemplate
from opencompass.openicl.icl_retriever import ZeroRetriever
from opencompass.openicl.icl_inferencer import GenInferencer
from opencompass.datasets.matbench.matbench import MatbenchDataset, MatbenchEvaluator_regression, MatbenchEvaluator_classification, MatbenchEvaluator_classification_glass

matbench_reader_cfg = dict(
    input_columns=['problem'], output_column='answer')


matbench_tasks =  ['matbench_steels','matbench_expt_gap', 'matbench_expt_is_metal','matbench_glass']


matbench_datasets = []

for task in matbench_tasks:
    if task in ['matbench_expt_is_metal']:
        matbench_infer_cfg = dict(
        prompt_template=dict(
            type=PromptTemplate,
            template=dict(
                round=[dict(role='HUMAN', prompt=f"{{problem}}")])),
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer))

        matbench_eval_cfg = dict(
            evaluator=dict(type=MatbenchEvaluator_classification),
            pred_role='BOT')

    if task in ['matbench_glass']:
        matbench_infer_cfg = dict(
        prompt_template=dict(
            type=PromptTemplate,
            template=dict(
                round=[dict(role='HUMAN', prompt=f"{{problem}}")])),
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer))

        matbench_eval_cfg = dict(
            evaluator=dict(type=MatbenchEvaluator_classification_glass),
            pred_role='BOT')


    elif task in ['matbench_expt_gap','matbench_steels']:
        matbench_infer_cfg = dict(
        prompt_template=dict(
            type=PromptTemplate,
            template=dict(
                round=[dict(role='HUMAN', prompt=f"{{problem}}")])),
        retriever=dict(type=ZeroRetriever),
        inferencer=dict(type=GenInferencer))

        matbench_eval_cfg = dict(
            evaluator=dict(type=MatbenchEvaluator_regression),
            pred_role='BOT')

    matbench_datasets.append(
        dict(
            type=MatbenchDataset,
            path=f'opencompass/Matbench/{task}.json',
            abbr=task,
            reader_cfg=matbench_reader_cfg,
            infer_cfg=matbench_infer_cfg,
            eval_cfg=matbench_eval_cfg))
add LLM as judge setting for matbench 2025-05-22 20:28:10 +08:00			`from opencompass.openicl.icl_prompt_template import PromptTemplate`
			`from opencompass.openicl.icl_retriever import ZeroRetriever`
			`from opencompass.openicl.icl_inferencer import GenInferencer`
			`from opencompass.datasets.matbench.matbench import MatbenchDataset, MatbenchEvaluator_regression, MatbenchEvaluator_classification, MatbenchEvaluator_classification_glass`

			`matbench_reader_cfg = dict(`
			`input_columns=['problem'], output_column='answer')`


			`matbench_tasks = ['matbench_steels','matbench_expt_gap', 'matbench_expt_is_metal','matbench_glass']`


			`matbench_datasets = []`

			`for task in matbench_tasks:`
			`if task in ['matbench_expt_is_metal']:`
			`matbench_infer_cfg = dict(`
			`prompt_template=dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`round=[dict(role='HUMAN', prompt=f"{{problem}}")])),`
			`retriever=dict(type=ZeroRetriever),`
			`inferencer=dict(type=GenInferencer))`

			`matbench_eval_cfg = dict(`
			`evaluator=dict(type=MatbenchEvaluator_classification),`
			`pred_role='BOT')`

			`if task in ['matbench_glass']:`
			`matbench_infer_cfg = dict(`
			`prompt_template=dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`round=[dict(role='HUMAN', prompt=f"{{problem}}")])),`
			`retriever=dict(type=ZeroRetriever),`
			`inferencer=dict(type=GenInferencer))`

			`matbench_eval_cfg = dict(`
			`evaluator=dict(type=MatbenchEvaluator_classification_glass),`
			`pred_role='BOT')`


			`elif task in ['matbench_expt_gap','matbench_steels']:`
			`matbench_infer_cfg = dict(`
			`prompt_template=dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`round=[dict(role='HUMAN', prompt=f"{{problem}}")])),`
			`retriever=dict(type=ZeroRetriever),`
			`inferencer=dict(type=GenInferencer))`

			`matbench_eval_cfg = dict(`
			`evaluator=dict(type=MatbenchEvaluator_regression),`
			`pred_role='BOT')`

			`matbench_datasets.append(`
			`dict(`
			`type=MatbenchDataset,`
			`path=f'opencompass/Matbench/{task}.json',`
			`abbr=task,`
			`reader_cfg=matbench_reader_cfg,`
			`infer_cfg=matbench_infer_cfg,`
			`eval_cfg=matbench_eval_cfg))`