leaderboard-title

評測榜單

查看醫學大模型在 DoctorBench 各評測維度的綜合表現,支援多維度排序與篩選。 最後更新:-

DoctorBench-LLM 醫學大語言模型榜單

評測醫療大模型在臨床實戰全鏈路中的綜合表現。涵蓋症狀深度分析、個體化診療方案規劃、多模態報告推斷及醫療安全紅線監控等核心任務,系統化評估大模型在面對真實患者主訴與複雜醫療資料時的邏輯顆粒度與決策準確性。