OpenCompass/opencompass/configs/datasets/bigcodebench/bigcodebench_full_instruct_gen_8815eb.py

from opencompass.openicl.icl_prompt_template import PromptTemplate
from opencompass.openicl.icl_retriever import ZeroRetriever
from opencompass.openicl.icl_inferencer import GenInferencer
from opencompass.datasets import (BigCodeBenchDataset, BigCodeBenchEvaluator)

bigcodebench_full_reader_cfg = dict(
    input_columns=['instruct_prompt'],
    output_column='test',
)

bigcodebench_full_infer_cfg = dict(prompt_template=dict(
    type=PromptTemplate,
    template=dict(
        begin=[dict(role='system', fallback_role='HUMAN', prompt='')],
        round=[
            dict(role='HUMAN', prompt='{instruct_prompt}'),
        ])),
                                   retriever=dict(type=ZeroRetriever),
                                   inferencer=dict(type=GenInferencer,
                                                   max_out_len=8192))

bigcodebench_full_eval_cfg = dict(
    evaluator=dict(
        type=BigCodeBenchEvaluator,
        release_version='v0.1.2',
        eval_type='instruct',
        # remote_execute_api='https://bigcode-bigcodebench-evaluator.hf.space/',
        remote_execute_api=
        'https://opencompass-opencompass-bigcodebench-evaluator.hf.space',  # noqa: E501
        dataset_version='full',
    ),
    pred_role='BOT',
)

bigcodebench_full_instruct_datasets = [
    dict(abbr='bigcodebench_full_instruct',
         type=BigCodeBenchDataset,
         path='opencompass/bigcodebench',
         reader_cfg=bigcodebench_full_reader_cfg,
         infer_cfg=bigcodebench_full_infer_cfg,
         eval_cfg=bigcodebench_full_eval_cfg,
         release_version='v0.1.2')
]
[Update] Update Skywork/Qwen-QwQ (#1728) * Update JuderBench * Support O1-style Prompts * Update Code * Update OpenAI * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update 2024-12-05 19:30:43 +08:00			`from opencompass.openicl.icl_prompt_template import PromptTemplate`
			`from opencompass.openicl.icl_retriever import ZeroRetriever`
			`from opencompass.openicl.icl_inferencer import GenInferencer`
[Update] Code evaluation alignment (#1909) * code alignment * update oss md5 * bigcodebench update * lint * lint_ * lint yapf 2025-03-04 18:49:38 +08:00			`from opencompass.datasets import (BigCodeBenchDataset, BigCodeBenchEvaluator)`
[Update] Update Skywork/Qwen-QwQ (#1728) * Update JuderBench * Support O1-style Prompts * Update Code * Update OpenAI * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update 2024-12-05 19:30:43 +08:00
			`bigcodebench_full_reader_cfg = dict(`
[Update] Code evaluation alignment (#1909) * code alignment * update oss md5 * bigcodebench update * lint * lint_ * lint yapf 2025-03-04 18:49:38 +08:00			`input_columns=['instruct_prompt'],`
			`output_column='test',`
[Update] Update Skywork/Qwen-QwQ (#1728) * Update JuderBench * Support O1-style Prompts * Update Code * Update OpenAI * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update 2024-12-05 19:30:43 +08:00			`)`

[Update] Code evaluation alignment (#1909) * code alignment * update oss md5 * bigcodebench update * lint * lint_ * lint yapf 2025-03-04 18:49:38 +08:00			`bigcodebench_full_infer_cfg = dict(prompt_template=dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`begin=[dict(role='system', fallback_role='HUMAN', prompt='')],`
			`round=[`
			`dict(role='HUMAN', prompt='{instruct_prompt}'),`
			`])),`
			`retriever=dict(type=ZeroRetriever),`
			`inferencer=dict(type=GenInferencer,`
			`max_out_len=8192))`
[Update] Update Skywork/Qwen-QwQ (#1728) * Update JuderBench * Support O1-style Prompts * Update Code * Update OpenAI * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update 2024-12-05 19:30:43 +08:00
			`bigcodebench_full_eval_cfg = dict(`
			`evaluator=dict(`
			`type=BigCodeBenchEvaluator,`
			`release_version='v0.1.2',`
			`eval_type='instruct',`
[Update] Code evaluation alignment (#1909) * code alignment * update oss md5 * bigcodebench update * lint * lint_ * lint yapf 2025-03-04 18:49:38 +08:00			`# remote_execute_api='https://bigcode-bigcodebench-evaluator.hf.space/',`
			`remote_execute_api=`
			`'https://opencompass-opencompass-bigcodebench-evaluator.hf.space', # noqa: E501`
[Update] Update Skywork/Qwen-QwQ (#1728) * Update JuderBench * Support O1-style Prompts * Update Code * Update OpenAI * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update BigCodeBench * Update 2024-12-05 19:30:43 +08:00			`dataset_version='full',`
			`),`
			`pred_role='BOT',`
			`)`

			`bigcodebench_full_instruct_datasets = [`
[Update] Code evaluation alignment (#1909) * code alignment * update oss md5 * bigcodebench update * lint * lint_ * lint yapf 2025-03-04 18:49:38 +08:00			`dict(abbr='bigcodebench_full_instruct',`
			`type=BigCodeBenchDataset,`
			`path='opencompass/bigcodebench',`
			`reader_cfg=bigcodebench_full_reader_cfg,`
			`infer_cfg=bigcodebench_full_infer_cfg,`
			`eval_cfg=bigcodebench_full_eval_cfg,`
			`release_version='v0.1.2')`
			`]`