leaderboard-title

评测榜单

查看医学大模型在 DoctorBench 各评测维度上的综合表现,支持按多维度排序与筛选。 最后更新:-

DoctorBench-LLM 医学大语言模型榜单

评测医疗大模型在临床实战全链路中的综合表现。涵盖症状深度分析、个体化诊疗方案规划、多模态报告推断及医疗安全红线监控等核心任务,系统化评估大模型在面对真实患者主诉与复杂医疗数据时的逻辑颗粒度与决策准确性。