×
模态框(Modal)标题
在这里添加一些文本
关闭
关闭
提交更改
取消
确定并提交
×
模态框(Modal)标题
×
欢迎访问《健康发展与政策研究》官方网站,今天是
ISSN 2097-4205 CN 31-2200/R
Toggle navigation
首页
期刊介绍
编委会
期刊简介
期刊订阅
联系我们
开放获取声明
新闻公告
投稿指南
作者须知
下载中心
征稿通知
期刊政策
稿件处理流程
期刊伦理政策
学术不端处理
更正和撤稿
在线期刊
最新录用
当期目录
过刊浏览
阅读排行
下载排行
引用排行
E-mail Alert
English
图/表 详细信息
医疗大语言模型的评价现状及思考
邢倩, 何达
健康发展与政策研究, 2025, 28(
1
): 65-72. DOI:
10.12458/HDPR.202407099
评估工具
评估内容
分值范围
Likert量表
评估响应准确性、信息量和可理解性
5种分类等级变量(强烈不同意、不同意、不置可否、同意、强烈同意
Flesch阅读量表
评估模型输出文本的可读性,分值越高代表可读性越强
0~100分
Flesch-Kincaid分级Coleman-Lia指数
理解文本需要的教育水平,或文本复杂性;分值高代表内容复杂
/
DISCERN评分系统
评估响应质量、相关性、信息公平性;分值高代表信息质量高,内容表述充分
16~80分
表4
医疗大语言模型质量评估工具
本文的其它图/表
图1
医疗大语言模型应用架构
表1
通用大语言模型与医疗大语言模型的差异
表2
国内主要医疗大语言模型工具
表3
国内主要医疗大语言模型评测框架
图2
医疗人工智能转化评估简化版框架
表5
医疗大语言模型对比测试的代表性研究