重庆市气象因子对呼吸道疾病的影响及预测研究

王 娜,崔秀云,冉 亮,骆 方,高 雅,赵衍斌,芦 华

(1.重庆市渝北区气象局,重庆 401120;
2.甘肃省气象局,兰州 730020;
3.重庆市防雷中心,重庆 401147;
4.重庆市气象信息中心,重庆 401147;
5.重庆市气象科学研究所,重庆 401147)

呼吸道疾病是指感冒、气管炎、支气管炎、肺炎等呼吸道的急性炎症,是常见多发的疾病。2020年我国城市居民呼吸系统疾病死亡率为55.36/(10万),位列城市居民主要疾病死亡率第4位[1]。大量研究表明,呼吸道疾病的发生与一定的气象条件有密切关系[2-7]。气象因素如温度、湿度、气压等均有对健康适宜的阈值范围,偏离该范围后可能对人群健康造成负面影响[8]。研究表明,全球变暖和天气模式的可变性都会对人类呼吸健康产生负面影响,气候变化将导致全世界呼吸系统发病率和死亡率显著增加[9]。呼吸系统疾病死亡人数与气象因子的相关程度随季节变化[10],不同气象要素对呼吸系统的影响具有协同效应[11]。此外,多项研究表明,气象要素对呼吸道疾病的影响存在明显的滞后性[12-15]。

重庆是我国西部唯一的直辖市,属东亚季风区,冬季受东北季风控制,夏季受西南季风影响。该地区位于四川盆地东南部,地形起伏较大,具有独特的立体天气气候特点,区域内江河纵横,水汽充沛,常年处于高湿环境,年平均相对湿度多为70%~80%,而日照百分率仅为25%~35%,为年日照时数最少的地区之一。相关研究指出,呼吸系统疾病引起的死亡人数位于重庆市居民总死亡人数的前三位[16]。过去研究多着重分析大气污染对重庆地区呼吸道疾病的影响[17-20],对气象因子的影响研究甚少,尤其是基于气象因子的疾病预测还未见报道。而重庆天气气候条件特殊,其对于呼吸道疾病的影响值得精细化研究。本文以重庆市医科大学附属第三医院为例,对气象因子和呼吸道疾病的关系进行研究,并建立预测模型,为当地制定应对政策和科学防控呼吸道疾病提供参考依据。

1.1 资料来源

本文气象资料来自重庆市渝北国家气象观测站,包括2017年1月1日-2019年12月31日的日平均气压、日最高气压、日最低气压、日平均气温、日最高气温、日最低气温、日平均相对湿度、日最低相对湿度、日最大风速、日照时数、日降雨量等。同期呼吸道疾病资料来自重庆市医科大学附属第三医院,该医院为国家三级甲等综合医院,位于重庆市渝北区,在地域和人员上具有一定的代表性,数据包括逐日全人群就诊人次,男性就诊人次,女性就诊人次。

日平均水汽压(VP)通过日平均气温和日平均相对湿度计算得到,公式如下:

(1)

式中,T0为参考气温273.15 K,es(T0)为T0时的饱和水汽压,L为水的蒸发热量,RV为水蒸气的气体常数,T为日平均气温,RH为日平均相对湿度。

气温日较差(δT)为日最高气温Tmax与日最低气温Tmin之差:

δT=Tmax-Tmin

(2)

前n天的日平均气温最大值max(Tn)与最小值min(Tn)之差得到变温幅度(ΔT):

ΔT=max(Tn)-min(Tn)

(3)

1.2 呼吸道疾病风险等级确定

Jarque-Bera检验是对样本数据是否具有符合正态分布的偏度和峰度的拟合优度的检验,定义JB统计量:

(4)

式中,N是观测数,S是样本偏度,K是样本峰度。若样本数据来自具有正态分布的总体,JB统计量近似服从自由度为2的卡方分布,因此该统计量可以用于检验数据是否服从正态分布。

本文对呼吸道疾病就诊人次进行Jarque-Bera检验,若呼吸道疾病就诊人次x服从数学期望为μ、方差为σ2的正态分布,对其概率密度函数进行积分,将积分值S作为呼吸道疾病风险等级的阈值:

(5)

把概率密度函数积分值等于0.15、0.35、0.65和0.85时的就诊人次x确定为呼吸道疾病风险1、2、3、4、5级的分级指标[21],对应发病风险低、较低、中等、较高、高(表1)。

表1 呼吸道疾病风险等级阈值及含义

1.3 呼吸道疾病风险等级预测模型

1.3.1 逐步回归分析

选取可能影响呼吸道疾病的多个气象变量作为预报因子,对呼吸道疾病就诊人次进行预测,应用多元线性回归方法建立回归方程:

(6)

式中,Y表示呼吸道疾病就诊人次,b为常数项,ai为回归系数,xi为气象因子,m为气象因子的数量。为保证在已选定的气象因子中得到最优回归方程,采用逐步回归分析方法,即利用因子的方差贡献大小对待选的气象因子进行逐步筛选,建立最优回归方程。

1.3.2 KNN算法

K最近邻分类算法(K-Nearest Neighbor,KNN)通过给定测试样本,找出训练集中与其最靠近的K个训练样本,选择K个样本中出现最多的类别标记作为预测结果[22-23]。首先给定一组由n个样本组成的历史样本集D,其中每个样本由m个属性变量和1个标志量构成:

(7)

本文属性变量xij指影响呼吸道疾病发生的气象因子经数据归一化处理后的值,标志量yi为呼吸道疾病风险等级。

给定由气象因子组成的预测样本集X′={x′1,x′2,…,x′m},采用欧式距离法计算预测样本集X′与历史样本集中属性变量集X的距离Li:

(8)

从计算得到的n个距离中找出距离最近的K个近邻(K通常取奇数)对应的标志量集合Y={y1,y2,…,yk},根据投票多数原则,选取最多的量yi作为预测样本x′i的预测结果。

KNN算法中的K值选取对模型准确率有较大影响。本文利用交叉验证法确定K参数。具体来讲,通过将训练集再次划分为n组训练/验证集,对n组训练/验证集进行n次训练和验证,返回n次验证结果的均值,即“n折交叉验证”,预设不同K值条件,通过交叉验证评估出最优K值。文中取K=1、3、5、7、9、11,n=10,分别计算每个K值条件下10折交叉验证结果的均值,选取均值最大的K值作为最终K参数。

2.1 呼吸道疾病就诊人次的一般情况

采用平均值、第25、50和75百分位数(P25、P50、P75)、最大值和最小值统计2017-2019年重庆市呼吸道疾病逐日就诊人次。结果显示,2017年1月1日至2019年12月31日就诊日数共计1086天,呼吸道疾病就诊共计84415人次,平均每天77.7人次。其中男性43627人次,平均每天40.2人次;
女性40782人次,平均每天37.6人次。性别缺失6人次(表2)。

表2 2017-2019年重庆市呼吸道疾病逐日就诊人次统计 人次

为了消除医院春节放假和各月天数本身不一致造成的呼吸道就诊人次差别,本文计算逐月的日平均值来表示逐月就诊人次变化趋势。图1为2017-2019年重庆市逐月呼吸道疾病全人群及男女呼吸道疾病就诊人次分布图。由图1可以看出,重庆市呼吸道疾病一年四季均有发生,与四川地区春季为高发期[14]及吉林地区秋冬、夏秋之交发病较高[24]不同,重庆市冬季(12月、1月、2月)为疾病高发期,发病占全年的28.7%;
夏季(6月、7月、8月)为低值期,占全年的21.6%。对比各月,发病最多的是1月,占比9.6%;
最少的是8月,占比6.8%。这与雷小英[25]等统计的重庆地区2009-2011年病毒检出率、总检出阳性率冬季最高、夏季最低的结论一致。逐月的男女就诊人次显示,36个月份中仅2017年3月、2019年1月、2019年4月、2019年12月这4个月份就诊人次女性多于男性,三年平均逐月就诊人次仅1月份女性略多于男性,其余月份男性均多于女性,这可能和男性喜吸烟的生活习性、工作环境相对较恶劣等有关。

图1 2017-2019年重庆市逐月呼吸道疾病就诊人次分布图

2.2 呼吸道疾病与气象因子相关分析

本文根据2017-2019年重庆市呼吸道疾病就诊人次及同期气象数据,共计算7组不同的潜伏期(M=1~7天)气象因子平均值与6组发病期(N=1~6天)平均就诊人次的相关性,并用时效M_N表示,例如时效6_3表示过去6天气象因子平均值与未来3天平均就诊人次的相关关系。不同时效气象因子与呼吸道疾病就诊人次(Spearman)相关分析结果显示(表3),气温(包括平均值、最高和最低值)与呼吸道疾病相关程度最高,其中又以最低气温与呼吸道疾病的关系最为紧密,最小相关系数达-0.40(P<0.05)。多项研究表明,低温对呼吸道疾病的健康风险大于高温的风险[26-28]。气温较低时,鼻腔局部血管收缩,鼻腔内局部分泌的免疫球蛋白A明显减少,为病毒入侵提供了有利条件[29];
另外,低温冷却黏膜层,寄宿在上呼吸道的病毒更稳定,有利于其进一步扩增进而引起病毒再次感染[28]。水汽压与呼吸道疾病的相关性仅次于气温的相关性,均为显著负相关。值得注意的是,呼吸道疾病就诊人次与水汽压相关程度较高,但与相对湿度的相关性较低,这和刘欣等[28]相较于相对湿度,绝对湿度对病毒的影响更加稳定的结论一致。由于相对湿度随气温升高而降低,间接抵消了气温对呼吸道疾病的影响,而水汽压为大气中水汽的分压力,表示水汽的绝对含量。水汽压比相对湿度更能反映湿度环境对呼吸道疾病的影响。气压(包括平均值、最高和最低值)与呼吸道疾病具有显著正相关,日照时数、气温日较差、日降雨量与呼吸道疾病均为负相关。其余气象因子与呼吸道疾病相关性较低。相关程度由高到低的前10个变量分别为日最低气温、日平均气温、日平均水汽压、日最高气温、日最高气压、日平均气压、日最低气压、气温日较差、日照时数、日降雨量。

表3 不同时效重庆市呼吸道疾病就诊人次与气象因子的Spearman相关系数

选取与呼吸道疾病就诊人次相关程度最高的两类气象因子(气温和水汽压),绘制不同时效的气象因子和就诊人次相关系数(R)变化图(图2)。气温、水汽压的相关系数绝对值随发病期与潜伏期的增加均呈增加趋势。随着发病期的增加,气温、水汽压与就诊人次的相关性迅速增加,表明气温、水汽压对呼吸道疾病的影响具有滞后性。R值随潜伏期的变化相对较缓,表明气温、水汽压的前期变化对呼吸道疾病影响较小。这与张书余等[24]的研究结果一致,该研究指出,一次明显的天气变化过程对应的不是一个高发病日,而是一个持续的高发病状态。

图2 不同时效呼吸道疾病就诊人次与日平均气温(a)、日平均水汽压(b)的相关系数变化图

2.3 呼吸道疾病风险等级

选取不同发病期(N=1~10天)平均就诊人次的对数值做Jarque_bera正态分布检验,结果显示,当N=1~6时,P>0.05,样本服从对数正态分布。根据不同发病期(N=1~6天)的平均就诊人次的概率密度函数积分值划分5个发病等级,确定呼吸道疾病风险1、2、3、4、5级的分级指标,得到不同发病期呼吸道疾病风险等级天数(表4)。

表4 不同发病期呼吸道疾病风险等级天数 天

2.4 逐步回归模型预测结果

选取14个气象因子作为预报因子X,包括日平均气压、日最高气压、日最低气压、日平均气温、日最高气温、日最低气温、日平均相对湿度、日最低相对湿度、日最大风速、日照时数、日降雨量、日平均水汽压、气温日较差、变温幅度。将样本集按7∶3划分训练集和测试集,在训练集中通过逐步回归方法建立最优方程,测试集的预报因子代入最优方程得到预报值。

本文设计了7组不同的潜伏期(M=1~7天)和6期发病期(N=1~6天),采用逐步回归方法建立了42个预测模型,即根据过去M天潜伏期的气象因子平均值预测未来N天发病期的平均就诊人次,各方程复相关系数为0.10~0.61,均方根误差为14.2~30.1。将测试集的平均就诊人次实际值和预报值划分呼吸道疾病风险等级,对比测试集的预报等级与实际等级得到模型准确率。不同时效的逐步回归模型预测呼吸道疾病风险等级与实际完全一致的准确率为22.1%~47.9%(表5),预测等级与实际相差1级以内的准确率为71.2%~91.7%(表6)。

表5 不同时效逐步回归模型预测重庆市呼吸道疾病风险等级与实际完全一致的准确率 %

表6 不同时效逐步回归模型预测重庆市呼吸道疾病风险等级与实际相差1级以内的准确率 %

2.5 KNN模型预测结果

选取上述14个气象因子经标准化处理后的值作为属性变量X,根据呼吸道疾病就诊人次划分的疾病风险等级作为标志量Y,基于KNN算法建立呼吸道疾病风险等级预测模型。标志量和属性变量组成的样本集按照7∶3的比例随机划分为训练集和测试集,采取交叉验证法确定最优K值,建立KNN模型。

根据7组不同潜伏期(M=1~7天)和6组发病期(N=1~6天),采用KNN算法建立42个预测模型,利用测试集的预报等级与实际等级的差别得到准确率。结果显示,不同时效的KNN模型预测呼吸道疾病风险等级与实际完全一致的准确率为23.6%~64.4%(表7),预测等级与实际相差1级以内的准确率为59.5%~92.3%(表8)。

表7 不同时效KNN模型预测重庆市呼吸道疾病风险等级与实际完全一致的准确率 %

表8 不同时效KNN模型预测重庆市呼吸道疾病风险等级与实际相差1级以内的准确率 %

2.6 两种模型对比

对两种模型预测的呼吸道疾病风险等级与实际完全一致的准确率进行对比,结果显示,M≤2时,逐步回归模型的准确率更高,即逐步回归模型利用过去1~2天的气象因子对呼吸道疾病风险等级的预测具有更高的准确率。在历史气象资料充足的情况下(使用过去3~7天的气象因子),KNN模型预报未来1~6天的呼吸道疾病风险等级的准确率均明显高于逐步回归模型的准确率。

(1)重庆市呼吸道疾病患者男性略多于女性,冬季为高发期,占全年的比例为28.7%;
夏季为低值期,占全年比例的21.6%。发病最多的是1月,占比9.6%,最少的是8月,占比6.8%。

(2)各类气象因子与就诊人次的相关性分析显示,气温、水汽压与呼吸道疾病相关性最高,均具有显著负相关,其中最低气温对呼吸道疾病影响最大,并且气温、水汽压对呼吸道疾病的影响具有滞后性。与呼吸道疾病相关程度较高的10个变量分别为日最低气温、日平均气温、日平均水汽压、日最高气温、日最高气压、日平均气压、日最低气压、气温日较差、日照时数、日降雨量。

(3)不同时效的逐步回归模型预测呼吸道疾病风险等级与实际完全一致的准确率为22.1%~47.9%,预测等级与实际相差1级以内的准确率为71.2%~91.7%。不同时效KNN模型预测呼吸道疾病风险等级与实际完全一致的准确率为23.6%~64.4%,预测等级与实际相差1级以内的准确率为59.5%~92.3%。在历史气象资料充足的情况下(使用过去3~7天的气象因子),KNN模型预报未来1~6天的呼吸道疾病风险等级的准确率均明显高于逐步回归模型的准确率。

由于呼吸道疾病的诱发因素很多,气象因素只是其中一部分,根据模型预测的结果无法排除其他致病因素的干扰,对预报准确率会产生一定的影响,有待后续收集到更完整的资料作进一步探讨。

猜你喜欢 水汽重庆市气温 青藏高原上空平流层水汽的时空演变特征成都信息工程大学学报(2022年4期)2022-11-18京津冀地区FY-4A水汽校正模型研究全球定位系统(2022年3期)2022-09-04基于FY-3D和FY-4A的气温时空融合成都信息工程大学学报(2022年3期)2022-07-21重庆市光海养蜂场蜜蜂杂志(2022年5期)2022-07-20重庆市光海养蜂场蜜蜂杂志(2022年3期)2022-05-23为什么会下雪?科普童话·学霸日记(2021年3期)2021-09-051998-2017年三江源地区水汽和云水状况的时空分布成都信息工程大学学报(2021年2期)2021-07-22深冬气温多变 蔬菜管理要随机应变今日农业(2021年2期)2021-03-19奋进中的重庆市巴南区中医院实用中医药杂志(2020年11期)2020-12-11与气温成反比的东西小雪花·成长指南(2015年10期)2015-10-23

推荐访问:重庆市 因子 气象