OpenCompass/configs/datasets/needlebench/atc/atc.py

from opencompass.openicl.icl_prompt_template import PromptTemplate
from opencompass.openicl.icl_retriever import ZeroRetriever
from opencompass.openicl.icl_inferencer import GenInferencer
from opencompass.datasets.needlebench.atc import NeedleBenchATCOrderedDataset
from opencompass.datasets.needlebench.atc import NeedleBenchATCDataset
from opencompass.datasets.needlebench.origin import NeedleBenchOriginEvaluator
from opencompass.datasets.needlebench.origin import needlebench_postprocess
from opencompass.datasets.needlebench.origin import needlebench_dataset_postprocess

needlebench_reader_cfg = dict(input_columns=['prompt'], output_column='answer')

needlebench_infer_cfg = dict(
    prompt_template=dict(
        type=PromptTemplate,
        template=dict(
            round=[
                dict(role='HUMAN', prompt='{prompt}'),
                dict(role='BOT', prompt='{answer}\n'),
            ]
        )
        ),
    retriever=dict(type=ZeroRetriever),
    inferencer=dict(type=GenInferencer))

needlebench_eval_cfg = dict(
    evaluator=dict(type=NeedleBenchOriginEvaluator),
    pred_postprocessor=dict(type=needlebench_postprocess),
    dataset_postprocessor=dict(type=needlebench_dataset_postprocess),
    pred_role='BOT')

needle_num_list = list(range(2, 100, 3))
document_depth_percent_intervals = 20
repeats = 30
names_path = './data/needlebench/names.json'

needlebench_atc_datasets_zh = []
needlebench_atc_datasets_en = []
needlebench_atc_datasets_zh_ordered = []
needlebench_atc_datasets_en_ordered = []

for num_needles in needle_num_list:
    # ordered English version
    dataset_dict = {
        'abbr': f'needlebench_atc_challenge'
                f'needle_{num_needles}_en_ordered',
        'type': NeedleBenchATCOrderedDataset,
        'path': names_path,
        'num_needles': num_needles,
        'language': 'English',
        'repeats': repeats,
        'reader_cfg': needlebench_reader_cfg,
        'infer_cfg': needlebench_infer_cfg,
        'eval_cfg': needlebench_eval_cfg
    }
    needlebench_atc_datasets_en_ordered.append(dataset_dict)


for num_needles in needle_num_list:
    # ordered Chinese version
    dataset_dict = {
        'abbr': f'needlebench_atc_challenge'
                f'needle_{num_needles}_zh_ordered',
        'type': NeedleBenchATCOrderedDataset,
        'path': names_path,
        'num_needles': num_needles,
        'language': 'Chinese',
        'repeats': repeats,
        'reader_cfg': needlebench_reader_cfg,
        'infer_cfg': needlebench_infer_cfg,
        'eval_cfg': needlebench_eval_cfg
    }
    needlebench_atc_datasets_zh_ordered.append(dataset_dict)

for num_needles in needle_num_list:
    # standard English version
    dataset_dict = {
        'abbr': f'needlebench_atc_challenge'
                f'needle_{num_needles}_en',
        'type': NeedleBenchATCDataset,
        'path': names_path,
        'num_needles': num_needles,
        'language': 'English',
        'repeats': repeats,
        'reader_cfg': needlebench_reader_cfg,
        'infer_cfg': needlebench_infer_cfg,
        'eval_cfg': needlebench_eval_cfg
    }
    needlebench_atc_datasets_en.append(dataset_dict)

for num_needles in needle_num_list:
    # standard Chinese version
    dataset_dict = {
        'abbr': f'needlebench_atc_challenge'
                f'needle_{num_needles}_zh',
        'type': NeedleBenchATCDataset,
        'path': names_path,
        'num_needles': num_needles,
        'language': 'Chinese',
        'repeats': repeats,
        'reader_cfg': needlebench_reader_cfg,
        'infer_cfg': needlebench_infer_cfg,
        'eval_cfg': needlebench_eval_cfg
    }
    needlebench_atc_datasets_zh.append(dataset_dict)
[Feature] Upgrade the needle-in-a-haystack experiment to Needlebench (#913) * add needlebench * simplify needlebench 32k, 128k, 200k for eval * update act prompt * fix bug in needlebench summarizer * add needlebench intro, fix summarizer * lint summarizer * fix linting error * move readme.md * update readme for needlebench * update docs of needlebench * simplify needlebench summarizers 2024-03-04 11:10:52 +08:00			`from opencompass.openicl.icl_prompt_template import PromptTemplate`
			`from opencompass.openicl.icl_retriever import ZeroRetriever`
			`from opencompass.openicl.icl_inferencer import GenInferencer`
			`from opencompass.datasets.needlebench.atc import NeedleBenchATCOrderedDataset`
			`from opencompass.datasets.needlebench.atc import NeedleBenchATCDataset`
			`from opencompass.datasets.needlebench.origin import NeedleBenchOriginEvaluator`
			`from opencompass.datasets.needlebench.origin import needlebench_postprocess`
			`from opencompass.datasets.needlebench.origin import needlebench_dataset_postprocess`

			`needlebench_reader_cfg = dict(input_columns=['prompt'], output_column='answer')`

			`needlebench_infer_cfg = dict(`
			`prompt_template=dict(`
			`type=PromptTemplate,`
			`template=dict(`
			`round=[`
			`dict(role='HUMAN', prompt='{prompt}'),`
			`dict(role='BOT', prompt='{answer}\n'),`
			`]`
			`)`
			`),`
			`retriever=dict(type=ZeroRetriever),`
			`inferencer=dict(type=GenInferencer))`

			`needlebench_eval_cfg = dict(`
			`evaluator=dict(type=NeedleBenchOriginEvaluator),`
			`pred_postprocessor=dict(type=needlebench_postprocess),`
			`dataset_postprocessor=dict(type=needlebench_dataset_postprocess),`
			`pred_role='BOT')`

			`needle_num_list = list(range(2, 100, 3))`
			`document_depth_percent_intervals = 20`
			`repeats = 30`
			`names_path = './data/needlebench/names.json'`

			`needlebench_atc_datasets_zh = []`
			`needlebench_atc_datasets_en = []`
			`needlebench_atc_datasets_zh_ordered = []`
			`needlebench_atc_datasets_en_ordered = []`

			`for num_needles in needle_num_list:`
			`# ordered English version`
			`dataset_dict = {`
			`'abbr': f'needlebench_atc_challenge'`
			`f'needle_{num_needles}_en_ordered',`
			`'type': NeedleBenchATCOrderedDataset,`
			`'path': names_path,`
			`'num_needles': num_needles,`
			`'language': 'English',`
			`'repeats': repeats,`
			`'reader_cfg': needlebench_reader_cfg,`
			`'infer_cfg': needlebench_infer_cfg,`
			`'eval_cfg': needlebench_eval_cfg`
			`}`
			`needlebench_atc_datasets_en_ordered.append(dataset_dict)`


			`for num_needles in needle_num_list:`
			`# ordered Chinese version`
			`dataset_dict = {`
			`'abbr': f'needlebench_atc_challenge'`
			`f'needle_{num_needles}_zh_ordered',`
			`'type': NeedleBenchATCOrderedDataset,`
			`'path': names_path,`
			`'num_needles': num_needles,`
			`'language': 'Chinese',`
			`'repeats': repeats,`
			`'reader_cfg': needlebench_reader_cfg,`
			`'infer_cfg': needlebench_infer_cfg,`
			`'eval_cfg': needlebench_eval_cfg`
			`}`
			`needlebench_atc_datasets_zh_ordered.append(dataset_dict)`

			`for num_needles in needle_num_list:`
			`# standard English version`
			`dataset_dict = {`
			`'abbr': f'needlebench_atc_challenge'`
			`f'needle_{num_needles}_en',`
			`'type': NeedleBenchATCDataset,`
			`'path': names_path,`
			`'num_needles': num_needles,`
			`'language': 'English',`
			`'repeats': repeats,`
			`'reader_cfg': needlebench_reader_cfg,`
			`'infer_cfg': needlebench_infer_cfg,`
			`'eval_cfg': needlebench_eval_cfg`
			`}`
			`needlebench_atc_datasets_en.append(dataset_dict)`

			`for num_needles in needle_num_list:`
			`# standard Chinese version`
			`dataset_dict = {`
			`'abbr': f'needlebench_atc_challenge'`
			`f'needle_{num_needles}_zh',`
			`'type': NeedleBenchATCDataset,`
			`'path': names_path,`
			`'num_needles': num_needles,`
			`'language': 'Chinese',`
			`'repeats': repeats,`
			`'reader_cfg': needlebench_reader_cfg,`
			`'infer_cfg': needlebench_infer_cfg,`
			`'eval_cfg': needlebench_eval_cfg`
			`}`
			`needlebench_atc_datasets_zh.append(dataset_dict)`