评测榜单
DoctorBench-LLM 医学大语言模型榜单
评测医疗大模型在临床实战全链路中的综合表现。涵盖症状深度分析、个体化诊疗方案规划、多模态报告推断及医疗安全红线监控等核心任务,系统化评估大模型在面对真实患者主诉与复杂医疗数据时的逻辑颗粒度与决策准确性。