def get_gt_label(item): return item["gt_answer"] def get_pred_label(model_response, item, prompt_style, type): return model_response