OpenCompass

jiangzhs/OpenCompass

Fork 0

mirror of https://github.com/open-compass/opencompass.git synced 2025-05-30 16:03:24 +08:00

Commit Graph

Select branches

Hide Pull Requests

bittersweet1999-patch-1

bittersweet1999-patch-3

dev

main

main2dev_merge

pypi_workflow_dispatch_038

revert-1216-patch-7

revert-1287-calm_dataset

revert-1331-patch-11

revert-1679-add_lora_for_vllm

revert-2059-mmlu_andscieval__tc

#1

#10

#1001

#1003

#1004

#1004

#1006

#101

#1014

#1015

#1016

#1019

#102

#1020

#1024

#1027

#1028

#1029

#1030

#1032

#1036

#1043

#1048

#105

#1050

#1051

#1052

#1053

#1060

#1060

#1062

#1063

#1064

#1065

#1070

#1072

#1073

#1074

#1076

#1077

#1079

#108

#1080

#1081

#1084

#1084

#1089

#1092

#1093

#1094

#1096

#1098

#1099

#11

#1102

#1103

#1104

#1106

#1108

#1109

#111

#1110

#1113

#112

#1120

#1122

#1123

#1125

#1139

#1143

#1146

#1151

#1152

#1153

#1154

#1155

#1156

#1159

#116

#1160

#1163

#1167

#1171

#1173

#1175

#1176

#1178

#118

#1180

#1182

#1183

#1183

#1186

#1189

#119

#1190

#1191

#1193

#1194

#1195

#1198

#12

#1204

#1205

#1206

#1207

#121

#1211

#1211

#1213

#1214

#1215

#1216

#1217

#1218

#122

#1221

#1224

#1225

#1228

#123

#1230

#1240

#1241

#1246

#125

#1250

#1252

#1255

#126

#1263

#1264

#1266

#1267

#1272

#1273

#1276

#1279

#128

#1282

#1284

#1285

#1286

#1287

#1289

#129

#1293

#1294

#13

#130

#1302

#1305

#1306

#1308

#1310

#1311

#1312

#1312

#1313

#1314

#1314

#1315

#1318

#1322

#1324

#1330

#1331

#1333

#1334

#1335

#1337

#1339

#134

#1340

#1341

#1342

#1344

#1349

#1350

#1351

#1352

#1353

#1357

#1358

#1363

#1364

#1365

#1366

#1367

#137

#1373

#1375

#1376

#1377

#1378

#1380

#1383

#1385

#1386

#1389

#1392

#1395

#1396

#1398

#14

#1403

#1404

#1405

#1406

#1411

#1413

#1417

#142

#1422

#1423

#1425

#1426

#1430

#1431

#1433

#1437

#1438

#1439

#144

#1447

#1449

#1450

#1451

#1451

#1453

#1454

#1458

#1461

#1463

#1464

#1467

#1468

#147

#1470

#1475

#148

#1480

#1481

#1482

#1483

#1484

#1486

#1489

#1490

#1491

#1496

#1496

#1497

#15

#1500

#1502

#1503

#1503

#1507

#1508

#1511

#1514

#1517

#1518

#1519

#152

#1521

#1522

#1527

#1528

#1529

#1534

#1539

#1541

#1543

#1544

#1545

#1546

#1547

#1548

#1550

#1552

#1553

#1554

#1555

#1556

#1558

#1559

#1561

#1562

#1563

#1564

#1565

#1566

#1567

#1568

#1569

#1570

#158

#1581

#1582

#1583

#1584

#1588

#1589

#1592

#1593

#1599

#16

#1600

#1601

#1602

#1603

#1604

#1605

#1607

#161

#1610

#1614

#1616

#1617

#1618

#162

#1620

#1623

#1624

#1625

#1626

#1627

#1628

#1631

#1635

#1636

#1637

#1638

#1639

#1640

#1641

#1642

#1642

#1643

#1645

#1648

#165

#1651

#1652

#1653

#1655

#1656

#1657

#1658

#1659

#166

#1662

#1666

#1668

#1670

#1674

#1677

#1677

#1679

#1680

#1681

#1682

#1683

#1684

#1685

#1688

#1689

#169

#1690

#1691

#1691

#1692

#1693

#1694

#1697

#1698

#1699

#17

#170

#1700

#1701

#1702

#1704

#1705

#1706

#1707

#1708

#1709

#1711

#1712

#1713

#1714

#1717

#1719

#1720

#1722

#1724

#1726

#1727

#1728

#1729

#173

#1730

#1731

#1733

#1734

#1735

#1737

#1738

#174

#1740

#1741

#1742

#1744

#1745

#1749

#175

#1750

#1751

#1754

#1757

#1758

#176

#1762

#1763

#1763

#1764

#1765

#1766

#1767

#1768

#1769

#177

#1771

#1772

#1774

#1775

#1777

#178

#1780

#1782

#1783

#1784

#1785

#1786

#1789

#1790

#1791

#1792

#1792

#1794

#1795

#1798

#18

#1800

#1801

#1802

#1806

#1808

#1808

#1809

#1811

#1811

#1812

#1813

#1814

#1815

#1819

#1819

#1826

#1827

#1829

#183

#1830

#1831

#1834

#1837

#1838

#1839

#184

#1841

#1846

#1848

#185

#1850

#1851

#1851

#1852

#1853

#1853

#1854

#1857

#186

#1862

#1863

#1863

#1868

#187

#1870

#1876

#1879

#188

#1881

#1882

#1882

#1886

#1888

#1892

#1894

#1898

#1899

#19

#190

#1900

#1902

#1904

#1906

#1908

#1909

#1910

#1912

#1912

#1916

#1917

#1919

#192

#1920

#1922

#1923

#1924

#1925

#193

#1934

#1936

#1937

#1939

#1940

#1942

#1944

#1945

#1947

#195

#1951

#1953

#1954

#1958

#1959

#196

#1960

#1962

#1963

#1966

#1967

#1968

#1969

#1969

#197

#1974

#1978

#1982

#1985

#1985

#1986

#1990

#1992

#1993

#1996

#1997

#1998

#1999

#2

#20

#2000

#2001

#2002

#2005

#2005

#2007

#2008

#201

#2010

#2011

#2012

#2015

#2016

#2017

#2018

#2018

#202

#202

#2020

#2020

#2021

#2022

#2023

#2024

#2025

#2028

#2029

#203

#2030

#2033

#2034

#2034

#2036

#2037

#2039

#204

#2041

#2043

#2043

#2045

#2046

#2047

#2047

#2048

#2049

#205

#2050

#2050

#2051

#2051

#2052

#2053

#2054

#2056

#2057

#2057

#2059

#206

#2060

#2060

#2061

#2063

#2064

#2065

#2066

#2067

#2068

#2069

#2069

#2070

#2071

#2072

#2073

#2073

#2074

#2074

#2077

#2078

#2080

#2081

#2083

#2085

#2087

#2089

#2090

#2090

#2091

#2091

#2092

#2095

#2096

#2098

#2099

#2099

#21

#210

#2101

#2102

#2103

#2104

#2104

#2105

#2105

#2106

#2109

#2109

#211

#2110

#2111

#2111

#2112

#2113

#2116

#2116

#2118

#2118

#212

#2121

#2121

#2124

#2125

#2125

#2126

#2127

#214

#22

#222

#223

#227

#229

#231

#232

#235

#236

#237

#238

#239

#24

#241

#242

#243

#246

#247

#25

#251

#252

#253

#254

#255

#258

#26

#261

#262

#265

#266

#268

#269

#27

#270

#272

#273

#277

#28

#280

#286

#287

#29

#3

#31

#312

#32

#327

#327

#328

#33

#330

#331

#332

#334

#335

#336

#337

#339

#34

#340

#344

#346

#346

#348

#348

#35

#350

#352

#353

#354

#358

#360

#361

#362

#365

#366

#367

#368

#37

#370

#371

#372

#373

#375

#376

#377

#38

#380

#382

#384

#387

#389

#39

#391

#392

#393

#395

#397

#4

#400

#405

#406

#408

#409

#41

#411

#412

#413

#414

#416

#417

#418

#419

#42

#420

#421

#422

#423

#424

#43

#431

#432

#435

#437

#438

#439

#44

#440

#441

#442

#443

#444

#445

#446

#455

#459

#46

#460

#467

#468

#475

#477

#478

#48

#483

#484

#488

#49

#490

#490

#494

#495

#495

#496

#497

#499

#5

#50

#504

#505

#506

#507

#508

#509

#51

#510

#511

#513

#513

#515

#516

#516

#517

#518

#520

#522

#523

#53

#530

#531

#533

#534

#535

#538

#539

#54

#540

#546

#547

#548

#549

#551

#555

#559

#56

#562

#564

#567

#568

#57

#570

#571

#572

#574

#576

#577

#578

#580

#582

#585

#587

#589

#59

#592

#594

#596

#598

#6

#60

#600

#601

#603

#603

#604

#606

#607

#609

#61

#610

#611

#612

#613

#614

#615

#618

#619

#622

#624

#625

#628

#629

#63

#632

#633

#634

#635

#636

#637

#639

#64

#641

#642

#643

#644

#645

#648

#652

#654

#655

#657

#658

#658

#66

#660

#662

#662

#666

#669

#672

#675

#676

#678

#679

#68

#680

#681

#682

#683

#684

#685

#686

#69

#690

#692

#693

#694

#695

#697

#698

#699

#7

#70

#700

#704

#705

#706

#707

#71

#710

#711

#713

#714

#715

#716

#718

#719

#72

#720

#721

#722

#724

#726

#727

#729

#73

#730

#731

#732

#733

#734

#735

#738

#739

#74

#740

#743

#744

#745

#746

#747

#749

#75

#750

#751

#753

#754

#755

#76

#762

#762

#764

#765

#766

#769

#770

#771

#772

#773

#774

#775

#776

#777

#778

#779

#78

#782

#786

#787

#788

#789

#79

#790

#790

#791

#795

#8

#801

#802

#803

#804

#805

#806

#807

#808

#809

#81

#810

#812

#813

#814

#815

#816

#82

#823

#824

#825

#825

#828

#829

#830

#833

#834

#835

#836

#837

#838

#839

#840

#842

#844

#845

#846

#847

#849

#852

#853

#854

#859

#862

#863

#864

#871

#873

#874

#875

#876

#877

#878

#880

#887

#888

#890

#891

#892

#893

#894

#896

#897

#9

#903

#906

#907

#909

#91

#911

#913

#914

#915

#916

#922

#929

#930

#931

#938

#939

#94

#941

#943

#944

#945

#947

#95

#951

#953

#954

#956

#957

#958

#96

#960

#961

#963

#964

#966

#969

#969

#97

#972

#973

#975

#976

#977

#98

#982

#983

#984

#985

#986

#988

#989

#99

#992

#993

#994

#995

#997

#999

0.1.0

0.1.1

0.1.2

0.1.3

0.1.4

0.1.5

0.1.6

0.1.7

0.1.8

0.1.8.rc1

0.1.9

0.2.0

0.2.1

0.2.2

0.2.2.rc1

0.2.3

0.2.4

0.2.4.rc1

0.2.5

0.2.5.rc1

0.2.6

0.3.0

0.3.1

0.3.2

0.3.2.post1

0.3.3

0.3.4

0.3.5

0.3.6

0.3.7

0.3.8

0.3.9

0.4.0

0.4.1

0.4.2

6097186a95

[Datasets] MedQA, ProteinLMBench; Add Models: huatuogpt, baichuanM1 (#2064) Jin Ye 2025-05-09 16:47:44 +1000
fba250a094 PromptCBLUE:Life Science dataset+data root 2025-05-09 06:47:26 +0000
d72df59363

[Revert] Add Lifescience Sub-set Support for SciEval (#2059) (#2087) Linchen Xiao 2025-05-09 14:46:27 +0800
e28868e72e

Merge branch 'main' into SciKnowEval Linchen Xiao 2025-05-09 14:42:44 +0800
b1b429b680

Revert "[Dataset] Add Lifescience Sub-set Support for SciEval (#2059)" revert-2059-mmlu_andscieval__tc Linchen Xiao 2025-05-09 14:36:49 +0800
c5048bfec7

[Dataset] Add Lifescience Sub-set Support for SciEval (#2059) tcheng 2025-05-09 14:31:12 +0800
f09c085817 Add version code for MedQA and ProteinLMBench Yejin0111 2025-05-09 06:26:14 +0000
f7ae6c690e resolve new conflicts marcry 2025-05-09 05:59:40 +0000
6ed5f0c8bc Add version code for MedQA and ProteinLMBench Yejin0111 2025-05-09 05:47:03 +0000
9c8244aa44 Add Lifescience SciEval (datasets + configs + loader+dataset-index.yml) root 2025-05-09 05:00:57 +0000
f238298512 revise name:Add Lifescience SciEval (datasets + configs + loader+dataset-index.yml) root 2025-05-09 04:48:22 +0000
efae720249 fix lint huihui 2025-05-09 04:46:47 +0000
47fd267d4d fix lint huihui 2025-05-09 04:39:28 +0000
89752ce5bd fix lint huihui 2025-05-09 03:59:06 +0000
70192c284b

Merge branch 'main' into SciKnowEval Linchen Xiao 2025-05-09 12:19:18 +0800
936acd8a3c update MaiziXiao 2025-05-09 04:03:28 +0000
37155ebe5b fix lint huihui 2025-05-09 03:59:06 +0000
d939e32438 add bench Dongsheng Zhu 2025-05-09 02:36:39 +0000
d28e3e4c80 Fix bugs for MedQA. Add info in dataset-index Yejin0111 2025-05-08 14:41:15 +0000
5744ae6b7b feature:change 4o-mini to 4o yuehuazhang 2025-05-08 21:25:09 +0800
a7f3ac20b2

[Dataset] Add CARDBiomedBench (#2071) huihui1999 2025-05-08 19:44:46 +0800
1b5e467065 fix init huihui 2025-05-08 11:14:28 +0000
724472ee5d fix lint huihui 2025-05-08 11:12:17 +0000
ff3275edf0

[Update] Add Long-Context configs for Gemma, OREAL, and Qwen2.5 models (#2048) Mo Li 2025-05-08 19:06:56 +0800
3f2ce77543 fix lint huihui 2025-05-08 10:59:45 +0000
1b05a473d2 fix lint huihui 2025-05-08 10:55:51 +0000
862cf61f64 fix lint huihui 2025-05-08 06:07:08 +0000
a685ed7daf

[Dataset] Add nejm ai benchmark (#2063) Wei Li 2025-05-08 16:44:05 +0800
9ec23c145b

[Datasets] Add ClinicBench, PubMedQA and ScienceQA (#2061) Jiahao Xu 2025-05-08 16:25:43 +0800
295f10e749 update MaiziXiao 2025-05-08 08:10:35 +0000
4579828ac3 feature:1.add o4-mini;2.o3 or o4-mini only support temperature==1 yuehuazhang 2025-05-08 16:09:39 +0800
1acb3c30c0 update MaiziXiao 2025-05-08 07:26:18 +0000
734073cc53 Update hf_path xuxuxuxuxuxjh 2025-05-08 14:53:29 +0800
26adccc20c use official llmjudge_postprocess huihui 2025-05-08 06:07:08 +0000
314cfc0754 remove print in medbullets.py marcry 2025-05-08 05:04:47 +0000
021c0d896a fix dataset-index.yml huihui 2025-05-08 05:02:36 +0000
c40c52b221 resolve dataset-index conflict marcry 2025-05-08 05:00:28 +0000
23fb3c7fa9 resove dataset-index conflicts marcry 2025-05-08 04:54:39 +0000
5e8bfee3f4 fix dataset-index & use official llm_judge_postprocess huihui 2025-05-08 04:31:11 +0000
85ecf3c932 use official llmjudge_postprocess huihui 2025-05-08 04:23:20 +0000
6ff36c1b1f use official llmjudge postprocess huihui 2025-05-08 04:20:10 +0000
b9aa1c17f7 fix comments &dataset-index yml huihui 2025-05-08 04:01:48 +0000
b3aa62ba5c fix dataset-index huihui 2025-05-08 03:49:18 +0000
b6d1bc60dc Update datasets_info & hf_path xuxuxuxuxuxjh 2025-05-07 23:05:36 +0800
adc33cd4f8 revise class name & remove csv file & add dataset-index.yml info marcry 2025-05-07 14:35:48 +0000
cc7d39ecdd remove csv file marcry 2025-05-07 14:11:19 +0000
b9f025a902 revise config file & remove csv file & add dataset info to dataset-index.yml marcry 2025-05-07 14:06:19 +0000
2a40298950 MMLU_Pro Biomedical Version Support Flaick 2025-05-07 11:38:25 +0000
1359cfacea HLE Biomedical version support Flaick 2025-05-07 11:30:37 +0000
e8ce8f82c7

Merge 3e63508bd0 into ba0e32292c Kun Yuan 2025-05-07 11:24:34 +0000
3e63508bd0 Merge branch 'hle_biomed' of github.com:Flaick/opencompass into hle_biomed Flaick 2025-05-07 11:23:57 +0000
6a13d32b57 new HLE_biomed support Flaick 2025-05-07 11:22:13 +0000
93c52fb97a

Merge 6201c3cc84 into ba0e32292c Kun Yuan 2025-05-07 17:01:51 +0800
ba0e32292c

[Feature] Support InternSandbox (#2049) Dongsheng Zhu 2025-05-07 16:42:09 +0800
43b2c4ed76

[Fix] Update lawbench data path (#2037) 谢昕辰 2025-05-07 16:18:43 +0800
d62b69aaef

[Fix] Fix InternVL model config (#2068) Dongsheng Zhu 2025-05-07 15:51:18 +0800
af8432e1d6

[Update] OpenAI SDK model reasoning content (#2078) Linchen Xiao 2025-05-07 14:06:40 +0800
024434dbdd update MaiziXiao 2025-05-07 05:51:04 +0000
442c829e0f Add PubMedQA & ScienceQA & ClinicBench xuxuxuxuxuxjh 2025-05-07 13:38:15 +0800
c66423fc99 fix hash huihui 2025-05-07 05:28:48 +0000
bc9ba0126f fix hash huihui 2025-05-07 05:27:37 +0000
dfa157c74d fix hash huihui 2025-05-07 05:24:14 +0000
a240f979ab update MaiziXiao 2025-05-07 03:57:55 +0000
1673501a08 update MaiziXiao 2025-05-07 03:46:49 +0000
ddc9cc0afb

[Add] add a config to Judge dataset all (#2077) bittersweet1999 2025-05-07 10:57:23 +0800
1af2c2cbdf add judgedatasetall bittersweet1999 2025-05-07 02:51:47 +0000
66f45af8f0 add judgedatasetall bittersweet1999 2025-05-07 02:47:41 +0000
a77a040ba7 add judgedatasetall bittersweet1999 2025-05-07 02:44:58 +0000
4c90cf9d79 Add PubMedQA & ScienceQA & ClinicBench xuxuxuxuxuxjh 2025-05-07 01:55:18 +0800
b65b2789fe

Merge branch 'open-compass:main' into hle_biomed Kun Yuan 2025-05-07 01:13:54 +0800
d1cc275f03 rename files Flaick 2025-05-07 01:12:00 +0800
4f8c1a2078 revise name: PromptCBLUE:Life Science dataset root 2025-05-06 15:05:05 +0000
aedfbcc809 revise name:Add Lifescience Sub-set Support for MMLU & SciEval (datasets + configs + loader) root 2025-05-06 14:56:34 +0000
6a3b550881 revise gen name marcry 2025-05-06 13:19:27 +0000
e7b04afa3c revise gen name marcry 2025-05-06 13:11:44 +0000
5ee365593e revise gen name marcry 2025-05-06 13:09:31 +0000
36d085d3e2

Merge branch 'open-compass:main' into main bittersweet1999 2025-05-06 16:58:12 +0800
a36d34f135 add hash huihui 2025-05-06 04:36:57 +0000
61b52844be BaseInferencer batch_size and max_seq_len cast to int Francesco Bertolotti 2025-05-05 19:55:21 +0200
41df5e5604 PromptCBLUE:Life Science dataset root 2025-05-04 12:00:36 +0000
72ec9ba289 MedCal_Bench huihui 2025-05-02 16:35:27 +0000
c6e1955cae MedCalc_Bench huihui 2025-05-02 16:33:25 +0000
9db1fea758 CARDBiomedBench huihui 2025-05-02 12:55:47 +0000
272efd7d25 SciKnowEval huihui 2025-05-02 12:08:58 +0000
de6e4909bd first huihui 2025-05-02 11:57:24 +0000
111c584049 phybench yufeng zhao 2025-04-30 12:34:35 +0000
de10fb1194 hybench yufeng zhao 2025-04-30 11:59:02 +0000
a159b03c81 phy_bench_newest yufeng zhao 2025-04-30 12:23:38 +0000
71173c4fef phybench yufeng zhao 2025-04-30 12:29:54 +0000
7f0fd50c02 internvl fix Dongsheng Zhu 2025-04-30 10:11:56 +0000
37cbaf8d92

[Add] Add Judgerbenchv2 (#2067) bittersweet1999 2025-04-30 17:12:34 +0800
9ef97268a2

Update __init__.py bittersweet1999 2025-04-30 17:05:43 +0800
36ab6e25e6

Merge branch 'main' into judgerbenchv2 bittersweet1999 2025-04-30 17:01:23 +0800
18d415847f add judgerbenchv2 bittersweet1999 2025-04-30 08:59:46 +0000
b6148aa198

add Judgebench (#2066) Taolin Zhang 2025-04-30 15:01:10 +0800
f6c519e283 add judgebench taolinzhang 2025-04-30 06:34:00 +0000
ea413544e2 add judgebench taolinzhang 2025-04-30 06:33:26 +0000
ad466bb658 add judgebench taolinzhang 2025-04-30 06:31:42 +0000
f931d2ca94 first huihui 2025-04-30 05:29:40 +0000
44aadf627b first huihui 2025-04-30 05:29:04 +0000