基于改进LSTM,的多源绩效数据综合评估与预测模型设计

王建琴

(河北北方学院附属第二医院,河北张家口 075100)

在医院内部绩效管理中,核心的问题是绩效评估与预测,这要求必须选择合理的指标数据对医院的绩效进行衡量。合理指标不仅可反映出医院发展的真实情况,还能预测医院未来的发展趋势。传统公立医院的绩效考核主要将财政收支情况及医院诊治人数作为核心评价指标,该指标简单且没有明确的数据体系[1-2]。文中使用DRG(Diagnosis Related Groups)模型指标,同时利用改进长短时记忆网络(Long Short-Term Memory,LSTM)模型对指标进行训练,从而实现对医院绩效的有效评估及预测。

1.1 DRG绩效评估模型

DRG 也被称为疾病诊断相关组[3-4],该模型使用各种病例的诊断结果作为数据基础。同时考虑医疗设备、手术操作、患者信息等与医院资源配置相关因素的影响,进而实现对医院综合绩效的有效评估。

DRG 总体可分为三个部分:1)服务能力参数,包括DRG 分组、权重因子等,其中DRG 分组表征诊室所覆盖疾病种类的广度,而权重因子则表征医疗服务的总收益;
2)服务效率参数,包括时间、费用等因素,其中时间因素表示医院治愈患者所花费的时间,费用因素则表示治疗疾病所需的费用;
3)安全参数,即病患治愈率、死亡率等。表1 为DRG 评价指标同传统指标的对应关系。

表1 DRG指标同传统指标的对应关系

从表1 中可以看到,相比传统绩效评估指标,DRG 指标考虑到了资源消耗、病症难度等综合因素对医院绩效管理的影响,因此最终结果更为精准。

1.2 Bi-LSTM模型设计

LSTM 全称为长短时记忆网络[5-8],该算法能够克服传统卷积神经网络(Convolutional Neural Networks,CNN)无法处理包含时间属性序列的缺点。LSTM 中最典型的结构就是时间记忆模块,该模块能从时间序列数据中提取出隐藏信息。因此,使用LSTM 可对医院时间绩效管理数据进行分析。

LSTM 网络结构通常由多个基础网络单元组成。由三个网络单元构成的LSTM 网络结构如图1所示。

图1 LSTM网络结构

LSTM 网络单元使用门结构对数据进行处理,该网络单元由输入门、遗忘门及输出门三种类型的门组成。输入门为结构的数据输入接口,其可从外界获取新的数据,同时对数据进行预处理。遗忘门则接收上个单元传递而来的记忆信息,再根据数据的权重,选择特征最强的数据信息,并遗忘特征较弱的数据信息。输出门则负责将处理完毕的数据进行输出。神经单元的当前状态可以在基础网络中传输,具体的LSTM 单元结构如图2 所示。

图2 LSTM单元结构

神经单元在上一时刻的输入数据由输入门输入的数据xt、上个单元记忆状态Ct-1以及前单元输出层状态ht-1组成。数据输入后,由遗忘门函数ft和输入门函数it对记忆单元的状态进行计算。ft和it的具体计算方法分别如式(1)、(2)所示:

其中,σ和Wf、Wu为网络架构的权重系数,bf、bu为偏置。之后对记忆细胞的信息进行计算,如式(3)所示:

最后,根据记忆单元的状态与输出数据对输出层进行计算。输出状态为Ct和ht,二者可表示为:

为了提高LSTM 的计算准确性,对其进行改进。文中使用双向LSTM 算法,通过正向与反向数据传输路径共同完成数据的训练。双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)结构由正向及逆向LSTM 组成[9-10],逆向LSTM 不断对正向的参数进行修正,进而减小正向单元层与层之间的数据误差。最终输出结果使用不同的权重融合得到,具体结构如图3 所示。

图3 Bi-LSTM结构

为了满足模型训练的需求,将Bi-LSTM 结构封装成残差结构网络。原始Bi-LSTM 模型为浅层模型,使用残差结构即可满足深度系统的训练要求。残差网络结构见图4 所示,且网络的映射函数为H(x)=F(x)+x。

图4 残差网络结构

1.3 ATT-Bi-LSTM模型设计

各种指标权重值的训练对于文中的DRG 模型至关重要。为了得到理想的指标权重值,此次使用注意力机制(Attention Mechanism)[11-14]对输入数据进行权重因子训练,进而获得更为准确的预测结果。数据分类中的注意力机制本质即为一组能对数据权重进行标定的权值数据,具体如图5 所示。

图5 注意力机制

1.4 绩效数据预测模型

将注意力机制加入Bi-LSTM 模型,最终得到的多层模型如图6 所示。该模型由输入层、嵌入层、双向LSTM 层、注意力机制层以及输出层组成。其中输入层数据为DRG 模型中的各项指标,嵌入层首先将数据进行预处理,然后双向LSTM 层对数据加以训练,再由注意力机制层对权重因子进行输出,最终得到后续绩效的预测情况。

图6 多层网络结构

嵌入层的权重et的计算方式为:

整体系统架构如图7 所示。文中使用三个并行的ATT-Bi-LSTM模型对DRG的三大指标——服务能力参数、服务效率参数及安全参数进行训练,并作为绩效预测模型的输入层。将经过该模型训练后的参数输入Softmax 分类器,再将三大指标模块的权重因子加以融合,最终便可得到绩效的评估值与预测值。

图7 整体系统架构

2.1 误差指标

为了优化模型性能进行评估,此次使用四项误差指标来分析,分别为平均百分比误差(MAPE)、均方根误差(RMSE)、平均绝对误差(MAE)以及决定系数(R2)。其中,平均百分比误差与决定系数可对绩效预测结果的准确程度进行判断。而均方根误差和平均绝对误差,则能对预测精度作出评判。这四项误差的计算公式如下所示:

2.2 实验环境与数据集

实验选择的数据类型为DRG 模型中的各种指标,数据采集来源为河北省某大型医院的各业务部门、医疗设备物联网终端等,采样时间为近五年内每月的数据,总量约为10 000 条,且训练集与验证集的比例为8∶2。具体实验环境如表2 所示。

表2 实验环境

2.3 性能测试

在性能测试中,选用BP(Back Prpagatin)神经网络[15]与循环神经网络(Recurrent Neural Network,RNN)模型[16]作为对比算法。测试时,三种网络的输入数据完全相同,模型运行次数为10 次,且取预测权重的平均值。采用2018-2020 年的数据进行训练,并使用2021-2022 年的数据加以验证,得到最终的实验结果如图8 所示。

图8 性能测试对比曲线

从图中可看出,与后两年的实际值相比,该文算法的拟合值相较其他算法而言最为理想,说明其预测精度较高,且在全局及局部效果中均有较优的表现。

为了定量观察算法的性能差别,使用平均百分比误差、均方根误差、平均绝对误差和决定系数这四项误差指标对预测精度进行对比。对比算法则选用BP 神经网络、LSTM 网络、逻辑回归模型(Logistic Regression,LR)、Bi-LSTM 模型及RNN 模型。对比结果如表3 所示。

表3 最优值计算结果

由表3 可知,随着预测年数的增多,由于时间序列数据集合的增加,各算法的准确率均有一定的提高。所设计的ATT-Bi-LSTM 算法预测两年的R2 值相较预测一年的高0.001。同时,与LSTM 和Bi-LSTM模型相比,由于该模型加入了注意力机制,因此能更好地对权重因子进行预测,进而得到更为准确的效果。而传统的BP 神经网络及LR 模型,二者对时间序列的训练能力较差,导致其性能也不理想,因此测试指标远落后于该文算法。

由此可见,该文算法能够根据已有数据集的训练结果对未来绩效结果进行预测,故其具有较强的实用价值。

现有医院绩效考核的数据较为片面、整体性差。针对该问题,文中基于指标综合考虑较为全面的DRG 模型,对LSTM 加以改进,构建了ATT-Bi-LSTM 模型对指标数据进行训练,再通过分类器融合权重因子,从而得到较为客观全面的未来绩效预测结果。实验结果表明,该算法的预测结果与实际结果更为接近,同时误差指标较低,证明了该算法可对医院的绩效进行有效评估及合理预测。

猜你喜欢权重误差预测无可预测黄河之声(2022年10期)2022-09-27选修2-2期中考试预测卷(A卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2-2期中考试预测卷(B卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25角接触球轴承接触角误差控制哈尔滨轴承(2020年2期)2020-11-06权重常思“浮名轻”当代陕西(2020年17期)2020-10-28Beidou, le système de navigation par satellite compatible et interopérable今日中国·法文版(2020年7期)2020-07-04压力容器制造误差探究中国特种设备安全(2019年1期)2019-03-13为党督政勤履职 代民行权重担当人大建设(2018年5期)2018-08-16基于公约式权重的截短线性分组码盲识别方法电信科学(2017年6期)2017-07-01不必预测未来,只需把握现在中学生数理化·八年级物理人教版(2017年11期)2017-04-18

推荐访问:绩效 模型 改进