PubMedQA & ScienceQA

2025-05-30 16:03:24 +08:00 · 2025-04-25 14:47:20 +08:00 · 2025-04-25 14:47:20 +08:00 · 14311ec0b7
commit 14311ec0b7
parent 7cffdf1cfb
3 changed files with 8 additions and 27 deletions
--- a/opencompass/datasets/PubMedQA.py
+++ b/opencompass/datasets/PubMedQA.py
@ -1,6 +1,4 @@
-import json
+from datasets import Dataset, DatasetDict, load_dataset
 from datasets import Dataset, DatasetDict
 from opencompass.registry import LOAD_DATASET
@ -11,18 +9,12 @@ from .base import BaseDataset
 class PubMedQADataset(BaseDataset):
    @staticmethod
-    def load_single(file_path):
+    def load_single():
        dataset = []
-        with open(file_path, 'r') as file:
+        ds = load_dataset('qiaojin/PubMedQA', 'pqa_labeled')
-            data_lines = json.load(file)
+        for data in ds['train']:
-        num = 0
+            data['question'] = (f"CONTEXTS: {data['context']}\n"
-        for name in data_lines:
+                                f"QUESTION: {data['question']}")
            data = data_lines[name]
            num += 1
            # if num > 10:
            #     break
            data['question'] = (f"CONTEXTS: {data['CONTEXTS']}\n"
                                f"QUESTION: {data['QUESTION']}")
            choices = 'A. yes\nB. no\nC. maybe'
            data['choices'] = choices
            if data['final_decision'] == 'yes':
@ -31,7 +23,6 @@ class PubMedQADataset(BaseDataset):
                data['label'] = 'B. no'
            else:
                data['label'] = 'C. maybe'
            # print(data)
            dataset.append(data)
@ -40,9 +31,7 @@ class PubMedQADataset(BaseDataset):
    @staticmethod
    def load(path):
        train_dataset = Dataset.from_list([])
-        val_dataset = PubMedQADataset.load_single(
+        val_dataset = PubMedQADataset.load_single()
            '/fs-computility/ai4sData/shared/'
            'lifescience/benchmark/raw/PubMedQA/ori_pqal.json')
        dataset = DatasetDict({
            'train': train_dataset,
            'validation': val_dataset
--- a/opencompass/datasets/ScienceQA.py
+++ b/opencompass/datasets/ScienceQA.py
@ -12,12 +12,8 @@ class ScienceQADataset(BaseDataset):
    def load_single():
        dataset = []
        ds = load_dataset('derek-thomas/ScienceQA')
        num = 0
        for data in ds['test']:
-            if data['image'] is None and data['topic'] == 'biology':
+            if data['image'] is None:
                num += 1
                # if num > 10:
                #     break
                data['label'] = chr(65 + data['answer']
                                    ) + '. ' + data['choices'][data['answer']]
                choices = ''
--- a/run.py
+++ b/run.py
@ -1,4 +0,0 @@
 from opencompass.cli.main import main
 if __name__ == '__main__':
    main()