PubMedQA & ScienceQA

2025-05-30 16:03:24 +08:00 · 2025-04-25 14:47:20 +08:00 · 2025-04-25 14:47:20 +08:00 · 14311ec0b7
commit 14311ec0b7
parent 7cffdf1cfb
3 changed files with 8 additions and 27 deletions
--- a/opencompass/datasets/PubMedQA.py
+++ b/opencompass/datasets/PubMedQA.py
@ -1,6 +1,4 @@
-import json
-
-from datasets import Dataset, DatasetDict
+from datasets import Dataset, DatasetDict, load_dataset

 from opencompass.registry import LOAD_DATASET

@ -11,18 +9,12 @@ from .base import BaseDataset
 class PubMedQADataset(BaseDataset):

    @staticmethod
-    def load_single(file_path):
+    def load_single():
        dataset = []
-        with open(file_path, 'r') as file:
-            data_lines = json.load(file)
-        num = 0
-        for name in data_lines:
-            data = data_lines[name]
-            num += 1
-            # if num > 10:
-            #     break
-            data['question'] = (f"CONTEXTS: {data['CONTEXTS']}\n"
-                                f"QUESTION: {data['QUESTION']}")
+        ds = load_dataset('qiaojin/PubMedQA', 'pqa_labeled')
+        for data in ds['train']:
+            data['question'] = (f"CONTEXTS: {data['context']}\n"
+                                f"QUESTION: {data['question']}")
            choices = 'A. yes\nB. no\nC. maybe'
            data['choices'] = choices
            if data['final_decision'] == 'yes':
@ -31,7 +23,6 @@ class PubMedQADataset(BaseDataset):
                data['label'] = 'B. no'
            else:
                data['label'] = 'C. maybe'
-            # print(data)

            dataset.append(data)

@ -40,9 +31,7 @@ class PubMedQADataset(BaseDataset):
    @staticmethod
    def load(path):
        train_dataset = Dataset.from_list([])
-        val_dataset = PubMedQADataset.load_single(
-            '/fs-computility/ai4sData/shared/'
-            'lifescience/benchmark/raw/PubMedQA/ori_pqal.json')
+        val_dataset = PubMedQADataset.load_single()
        dataset = DatasetDict({
            'train': train_dataset,
            'validation': val_dataset
--- a/opencompass/datasets/ScienceQA.py
+++ b/opencompass/datasets/ScienceQA.py
@ -12,12 +12,8 @@ class ScienceQADataset(BaseDataset):
    def load_single():
        dataset = []
        ds = load_dataset('derek-thomas/ScienceQA')
-        num = 0
        for data in ds['test']:
-            if data['image'] is None and data['topic'] == 'biology':
-                num += 1
-                # if num > 10:
-                #     break
+            if data['image'] is None:
                data['label'] = chr(65 + data['answer']
                                    ) + '. ' + data['choices'][data['answer']]
                choices = ''
--- a/run.py
+++ b/run.py
@ -1,4 +0,0 @@
-from opencompass.cli.main import main
-
-if __name__ == '__main__':
-    main()