【Paper Note】基于聚类算法的我国临终关怀现状分析

来源:互联网 发布:喜马拉雅提示网络错误 编辑:程序博客网 时间:2024/05/16 02:01

摘要

随着老龄化社会快速来临,临终关怀已成为医疗、养老等民生领域增长迅速的新需求。临终关怀是现代社会对工具理性和现代性反思的产物,也是社会成熟与文明的标志。在发达国家,由志愿者、全科医生、宗教人士等构成的临终关怀体系非常成熟。而在我国社会流动加剧的当下,社会化的临终关怀建设亟待关注。于是,笔者所在团队通过互联网的媒介,进行网络调研,通过统计分析软件对调研数据进行整合分析,扫描我国临终关怀发展的现状。

临终关怀及调研目的

临终关怀,指的是对没有治愈希望的患者进行的积极又全面的医学人文照顾,它需要控制疼痛及其他症状、解决心理和精神问题,以提高患者生活品质,达到最好的生活状态。
近年来,临终关怀在国内一二线城市发展势头良好,已经在北京、上海、南京、沈阳等地陆续建立专门的临终关 怀机构。本次调研的目的便是希望通过对国内多个城市进行临终关怀理念调查,了解临终关怀在国内的各个省市的发展情况,医护工作人员是临终关怀理念的传播者和践行者,因此,我们一医护工作人员为调研对象进行调查研究,再将调研数据应用统计分析软件R进行建模分析,应用聚类算法,将省市临终关怀现状进行聚类分析,以此探求我国临终关怀现状。

聚类分析方法分析我国省份的临终关怀现状

聚类算法定义

聚类分析(cluster analysis)是对样品或变量进行分类的一种多元统计方法,目的在于将相似的事物归类。通常分类一般限于单个度量,分类标准主要是由主观偏好决定的,但有时样品很多,分类无法可依,很难确定应该选择哪个度量作为分组的依据,这时聚类分析便成为一种选择。常用的聚类算法有层次聚类法和k-means聚类法。本次调研分析采取k-means聚类算法对调研结果进行聚类分析。

 k-means聚类算法原理

k-means算法的输入对象是d维向量空间的一些点,算法执行过程中,会进行不断的迭代,属于一种动态聚类方法,每次都要考察对每个样本点的分类正确与否,如果不正确,就要进行调整,是一种无监督的机器学习算法。
k-means算法的基本过程如下:
k-means算法                                                 
输入:数据集D,聚簇数K                             
输出:聚簇代表集合C,聚簇成员向量m       
/*初始化聚簇代表C*/
从数据集D中随机挑选k个数据点
使用这k个数据点构成初始聚簇代表集合C
repeat
/*再分数据*/
将D中的没个数据点重新分配至与之最近的聚簇均值
更新m()
/*重定均值*/
更新C(表示第j个聚簇均值)
until 目标函数收敛                                          
由上表可知,聚类算法实际上是通过计算不同样本点之间的距离来确定样本点之间的关系的,样本点的不同属性值是不同的,如果直接将属性值代入计算,不同属性之间值得大小差异则会直接影响聚类结果,因此需进行数据标准化,再通过聚类算法,实现样本点组间相似度最大,组间相异度最大。

算法实现及可视化展现

在k-means算法中,k值得确定有为重要,如果事先无法知道理想的k值,人们一般会尝试取多个不同k值来进行算法计算,然后选 出一个最佳取值,在R语言中,可以应用rinds函数求得最佳聚簇的值,然后根据工作流程执行算法。
应用kmeans算法,对数据进行聚类建模,如下图:

如上图展示,不同的聚类数目得到不同结果,使用rinds函数求得最佳聚类数目为4,现将三种分类以表格形式给出:

 

分三类

 

第一类

第二类

第三类

北京 上海

 

天津 辽宁 江苏 浙江 山东

河北 山西 内蒙 吉林 黑龙江 安徽 福建 江西 河南 湖北 湖南 广东 广西 海南 重庆 四川 云南 贵州 陕西 宁夏

 

分四类

 

第一类

第二类

第三类

第四类

北京 上海

 

 

天津 辽宁 江苏 浙江 山东

 

广东 海南

河北 山西 内蒙 吉林 黑龙江 安徽 福建 江西 河南 湖北 湖南 广西 重庆 四川 云南 贵州 陕西 宁夏

 

分五类

 

第一类

第二类

第三类

第四类

第五类

北京 上海

 

 

天津

 

天津 辽宁 江苏 浙江 山东

 

 

广东 海南

河北 山西 内蒙 吉林 黑龙江 安徽 福建 江西 河南 湖北 湖南 广西 重庆 四川 云南 贵州 陕西 宁夏

总结与说明

通过Rstudio的可视化展示,我们可以很直观地观察到我国国内临终关怀现状,不难发现,城市临终关怀发展程度与其经济状况呈正相关,临终关怀这一新兴的科学理念是需要强有力的经济基础作为支撑,相对而言,经济落后地区的临终关怀情况也较差,这符合当今发展趋势。
通过调研数据,我们可以了解到我国国内的临终关怀仍然处于发展阶段,举例来说,94.12%的受访者知道临终关怀的基本内容,但仅仅11.76%的受访者选择了全部的正确答案。这表明,大多数医护工作人员对于临终关怀并没有进行深入的了解,临终关怀理念在医护工作人员间并未得到普及,因此,开展适当的临终关怀活动或培训有其必要性。另外,通过聚类分析,我们可以清楚地看到我国临终关怀现状的梯度分布。
最后,本次调研由于人力财力有限,调研团队采取以网络调研为主、实地调研为辅的方式对实践地进行调查研究,最终得到调研问卷743份,我们对这743分调研问卷进行认真清洗,排除39份无效问卷后,剩余704份调研问卷作为我们的数据分析源数据,但是,由于我们采取网络调研的方式,可能个别不符合当地临终关怀发展现状但符合常理的问卷被保留,这会最终影响分析结果的准确性和可靠性,是分析误差的来源之一。本次调研城市中,部分省市无法实施调研计划或调研数据太少无法反应当地现状,已被移除。此外,由于调研问卷的数量为704份,对于像本次的分析而言数据量较小,可能无法全面地诠释当地临终关怀发展现状,具有片面性,团队会随着日后调研的逐渐深入,力求获得较为准确的临终关怀现状分析。

原创粉丝点击