健康发展与政策研究

欢迎访问《健康发展与政策研究》官方网站，今天是

图/表详细信息

医疗大语言模型的评价现状及思考

邢倩, 何达

健康发展与政策研究, 2025, 28(1): 65-72. DOI: 10.12458/HDPR.202407099

对比维度	医疗大语言模型	通用大语言模型
数据来源	医学文献、病例报告、临床指南、医疗数据库、医学相关数据	多领域网页、论坛、书籍等文本数据
数据处理重点	去识别化处理，保护患者隐私，避免泄露敏感信息	数据过滤，去除低质量、重复、偏见或有害内容
伦理敏感性	高度敏感，涉及患者隐私保护，需严格遵守伦理规范	相对较低，但仍需考虑内容的偏见、歧视以及有害信息的去除
准确性要求	极高，错误诊断或建议可能导致严重医疗后果	相对较低，无直接的生命健康风险
可靠性要求	极高	相对宽泛
评价标准	以准确性、建议的合理性、临床决策支持的有效性为主	以自然语言理解、生成的流畅性、上下文相关性等通用语言能力
法律责任	责任归属尚不明确	一般无重大法律责任
更新频率	需随研究进展定期更新	更新频率相对灵活
输出审核	需经过医疗专家审核	通常不需要专家审核
潜在风险	可能危及患者生命健康，带来伦理和法律风险	影响用户体验

表1 通用大语言模型与医疗大语言模型的差异

本文的其它图/表