OpenCompass/examples/eval_internlm_lmdeploy_apiserver.py

from mmengine.config import read_base

from opencompass.models.turbomind_api import TurboMindAPIModel

with read_base():
    # choose a list of datasets
    from opencompass.configs.datasets.ceval.ceval_gen_5f30c7 import \
        ceval_datasets
    from opencompass.configs.datasets.gsm8k.gsm8k_gen_1d7fe4 import \
        gsm8k_datasets
    from opencompass.configs.datasets.humaneval.humaneval_gen_8e312c import \
        humaneval_datasets
    from opencompass.configs.datasets.mmlu.mmlu_gen_a484b3 import mmlu_datasets
    from opencompass.configs.datasets.SuperGLUE_WiC.SuperGLUE_WiC_gen_d06864 import \
        WiC_datasets
    from opencompass.configs.datasets.triviaqa.triviaqa_gen_2121ce import \
        triviaqa_datasets
    # and output the results in a choosen format
    from opencompass.configs.summarizers.medium import summarizer

datasets = sum((v for k, v in locals().items() if k.endswith('_datasets')), [])

internlm_chat_20b = dict(
    type=TurboMindAPIModel,
    abbr='internlm-chat-20b-turbomind',
    api_addr='http://0.0.0.0:23333',
    max_out_len=100,
    max_seq_len=2048,
    batch_size=8,
    run_cfg=dict(num_gpus=1, num_procs=1),
)

internlm_chat_7b = dict(
    type=TurboMindAPIModel,
    abbr='internlm-chat-7b-turbomind',
    api_addr='http://0.0.0.0:23333',
    max_out_len=100,
    max_seq_len=2048,
    batch_size=16,
    run_cfg=dict(num_gpus=1, num_procs=1),
)

models = [internlm_chat_20b]
add turbomind restful api support (#693) * add turbomind restful api support * config * top_p 0.8 * top_k = 1 2023-12-24 01:40:00 +08:00			`from mmengine.config import read_base`
[Refactor] Code refactoarization (#1831) * Update * fix lint * update * fix lint 2025-01-20 19:17:38 +08:00
add turbomind restful api support (#693) * add turbomind restful api support * config * top_p 0.8 * top_k = 1 2023-12-24 01:40:00 +08:00			`from opencompass.models.turbomind_api import TurboMindAPIModel`

			`with read_base():`
			`# choose a list of datasets`
[Refactor] Code refactoarization (#1831) * Update * fix lint * update * fix lint 2025-01-20 19:17:38 +08:00			`from opencompass.configs.datasets.ceval.ceval_gen_5f30c7 import \`
			`ceval_datasets`
			`from opencompass.configs.datasets.gsm8k.gsm8k_gen_1d7fe4 import \`
			`gsm8k_datasets`
			`from opencompass.configs.datasets.humaneval.humaneval_gen_8e312c import \`
			`humaneval_datasets`
[Doc] Update Readme (#1439) * update * update * update * update * update * update * update * update * update * update * update * update 2024-08-22 14:48:45 +08:00			`from opencompass.configs.datasets.mmlu.mmlu_gen_a484b3 import mmlu_datasets`
[Refactor] Code refactoarization (#1831) * Update * fix lint * update * fix lint 2025-01-20 19:17:38 +08:00			`from opencompass.configs.datasets.SuperGLUE_WiC.SuperGLUE_WiC_gen_d06864 import \`
			`WiC_datasets`
			`from opencompass.configs.datasets.triviaqa.triviaqa_gen_2121ce import \`
			`triviaqa_datasets`
add turbomind restful api support (#693) * add turbomind restful api support * config * top_p 0.8 * top_k = 1 2023-12-24 01:40:00 +08:00			`# and output the results in a choosen format`
[Doc] Update Readme (#1439) * update * update * update * update * update * update * update * update * update * update * update * update 2024-08-22 14:48:45 +08:00			`from opencompass.configs.summarizers.medium import summarizer`
add turbomind restful api support (#693) * add turbomind restful api support * config * top_p 0.8 * top_k = 1 2023-12-24 01:40:00 +08:00
			`datasets = sum((v for k, v in locals().items() if k.endswith('_datasets')), [])`

Support get_ppl for TurbomindModel (#878) * update ppl for turbomindmodel * update api_server * rename config and set thread_safe for pytorch engine if possible 2024-03-06 11:44:19 +08:00			`internlm_chat_20b = dict(`
			`type=TurboMindAPIModel,`
			`abbr='internlm-chat-20b-turbomind',`
			`api_addr='http://0.0.0.0:23333',`
			`max_out_len=100,`
			`max_seq_len=2048,`
			`batch_size=8,`
			`run_cfg=dict(num_gpus=1, num_procs=1),`
			`)`

			`internlm_chat_7b = dict(`
			`type=TurboMindAPIModel,`
			`abbr='internlm-chat-7b-turbomind',`
			`api_addr='http://0.0.0.0:23333',`
			`max_out_len=100,`
			`max_seq_len=2048,`
			`batch_size=16,`
			`run_cfg=dict(num_gpus=1, num_procs=1),`
			`)`

			`models = [internlm_chat_20b]`