mirror of https://github.com/open-compass/opencompass.git synced 2025-05-30 16:03:24 +08:00

History

Que Haoran a244453d9e [Feature] Support inference ppl datasets (#1315 ) * commit inference ppl datasets * revised format * revise * revise * revise * revise * revise * revise		2024-07-22 17:59:30 +08:00
..
inference_ppl.py	[Feature] Support inference ppl datasets (#1315 )	2024-07-22 17:59:30 +08:00
README.md	[Feature] Support inference ppl datasets (#1315 )	2024-07-22 17:59:30 +08:00

Inference-PPL Datasets

Description: Compute the loss only on the labeled positions, especially used for reasoning corpus.
Datasets: cn-reasoning-val.jsonl (example datasets, inference-ppl can be generalized to more corpus).

PPL Computation

 \text{ppl} = - \frac{1}{n} \sum_{i=0}^n \sum_{c=0}^{vocab\_size} y_{i,c} \log p_{i,c} \tag{1}

where Eq. (1) is the normal mean ppl computation formula, for inference-ppl, we only compute the average score based on pre-labeled position.

cd opencompass
python run.py configs/eval_inference_ppl.py