首页 » PHP教程 » phpspss导出技巧_医学数据科研数据自定义导出

phpspss导出技巧_医学数据科研数据自定义导出

访客 2024-11-29 0

扫一扫用手机浏览

文章目录 [+]

一、背景

医学科研是医学进步的动力。
通过科学的方法对医学数据进行整理剖析,进而得出医学中的诊疗规律,并运用于相同病症的患者,进而提高患者的治愈率。

phpspss导出技巧_医学数据科研数据自定义导出

患者的诊疗数据存储于医院的信息系统中。
由于医院信息系统并未供应医学科研干系的剖析工具,以是须要利用专业的剖析软件对数据进行统计剖析。

phpspss导出技巧_医学数据科研数据自定义导出
(图片来自网络侵删)

首先,通过搜索功能找到符合哀求的患者记录。
然后,设法将科研干系的字段导出。

如果人工将数据导出,那么操作过程将会变成如下过程:从患者列表逐个进入患者详情,从患者详情中找到目标数据。

如果科研的数据涉及到多种业务,那么在同一条患者记录内部,就须要跨多张表单查找目标数据。
并手动复制粘贴到系统外的Excel表格中。

全体数据导出过程中涉及多次打开系统、关闭系统,打开表单、关闭表单,在表单内查找目标字段,耗费了大量的韶光本钱,还存在数据粘贴在缺点位置的可能。

如何能够快速将目标字段整理出来?便是我们本日谈论的主题——数据自定义导出。

二、数据自定义导出

数据自定义导出,指的是从变量池中根据需求选中符合哀求的目标变量,以某种格式的文件一次性从系统中全部导出。

例如,系统供应600 个变量可用于数据导出。
在做胃部分切除术干系的研究时,从中选择了30个字段导出为CSV文件。

个中, “600 个变量”便是“变量池”,指的是系统中许可被导出的所有字段。

“30 个字段”便是“目标变量”,指的是本次须要导出的变量。
“CSV 文件”便是“某种格式的文件”,指的因此数据导出后的利用目的为导向,天生相应格式的文件。
“从 600 个变量里根据需求选择了 30 个变量”,即“自定义”,指的是用户可以根据须要从变量池中选择任何变量,并且变量数量不受限定。

首先,将不同业务内、不同表单内的导出频率高的字段组合在一起形成变量池。
省去查找目标字段时的,表单切换和表单阅读的韶光。

然后,将在数据导出时,对数据格式进行处理,使其知足目标软件的哀求,然后将导出后的数据直接导入到目标软件中。
缩短了数据格式进一步加工的韶光。

通过这两步,大大提高数据导出的效率。

1. 变量池

医疗业务繁芜,一个人无法处理所有的业务,以是须要将业务拆分身分歧的部分,由不同的专业职员卖力不同的业务范围,只有这样才能让系统正常运行。

例如,张技师和王技师分别卖力实验室考验部分和影像检讨部分的业务。
如果张技师去卖力影像检讨部分的业务,由于对影像业务的完备不熟习,该段韶光内的影像检讨部分的业务将结束。
与之干系的业务都将收到影响。

医院信息系统中与患者诊疗干系的系统包括门急诊电子病历系统、住院电子病历系统、实验室考验系统、影像学检讨系统、手术麻醉系统等系统。

住院电子病历系统中包括住院年夜夫事情站、住院护士事情站、病案管理事情站等,存储了患者的长临医嘱、用药信息、日常病程记录、既往病史、家族史等信息。

不同的模块、不同的表单存放不同的患者信息。
查找须要导出的字段时,须要翻阅不同的系统,在系统内部切换不同的表单,在表单中找到须要导出的字段。
全体过程耗费大量韶光,严重影响字段查找效率。

例如,导出患者胃部分切除术手术及手术前后的干系信息,则须要前往手麻系统、电子病历系统、检讨系统、考验系统等。
在某个子系统中,仍旧须要找到患者,并且进入患者详情找到对应表单内容。
全体过程耗费大量韶光。

有没有一种可能将可能用于导出的字段放在一起,不须要切换系统、表单逐个查找。

变量池便是将不同业务系统、不同表单中可能会用于导出的字段名称放在一起。

变量池具备字段数量多、字段多值性的特点。

1)字段数量多

字段数量多,指的是可以用于导出的字段数量比较大。

涌现这种情形的缘故原由是,不同科室在做数据剖析时关注的重点不同,须要导出的字段不完备同等。
为了知足这么多的导出需求,就须要把可能涉及到的字段全部放在变量池中。

一个剖析方向可能会导出二三十个变量,须要支持几十个可能的剖析方向。
对字段进行去重往后,变量池内的字段数量同样也会达到几百个。

变量池内字段较多时,通过人眼从中找到某一个字段,耗时较长。

可以按照字段所属业务系统、所在业务表单对字段进行分组。
直接选中目标字段所在表单,缩小字段查找范围,提高字段查找效率。

也可以通过搜索功能,通过输入目标变量的字段名,直接定位到目标变量所在位置,提高字段查找的效率。

例如,为了支持肝脏参与科的数据剖析事情,将可能用到的字段进行整理,共计整理出 300 个字段(下图字段仅做示例)。

将字段按照所在表单进行划分人口学、现病史、考验、手术,可以通过点击左侧的表单列表,将字段的范围缩小到几十个变量。
也可以在搜索框内输入字段名,直接定位到该字段的位置。

2)字段的多值性

字段的多值性,指的是同一个患者的同一个字段会有多个结果。

例如,张三的血常规中的白细胞计数字段有 11 个结果。

产生字段多值的缘故原由是,患者症状在变革。
为了让记录不断变革的病情,须要做多次考验检讨,并据此调度治疗方案,终极产生了多个值。

例如,患者张三随着放疗的进行,身体状况在不断变革。
通过考验检讨等手段来丈量身体的各项指标。
放疗 2 个月,共做了 7 次考验。
使得考验部分的字段产生了 多次结果。

而研究时每每关注患者在某个状态下的指标情形,即从浩瀚结果中找到某一个特定的结果。

例如,研究胃部分切除术的情形时,须要理解术后第一次白细胞计数的结果。
此时就须要精准的找到患者的该次白细胞计数的值。

以是就须要给具有多值性的字段增加一个限定条件。

常见的限定条件有:

针对数值型字段有全部、最大值、最小值、最早一次、最近一次、均匀值。
针对文本型、选项型日期型字段有全部、最早一次、最晚一次。

上陈说的限定条件都有一个默认条件,“在所有的韶光范围内”,即在患者的全体就医韶光范围内,但是实际研究中,我们可能须要的是患者在某个特定时间内某个状态的结果。

例如,须要患者在“最近一次胃部分切除术后的第一次白细胞计数结果”。
个中,特定时间值得是“最近一次胃部分切除术后的所有韶光”。

此时须要先找到该患者的最近一次,胃部分切除术的韶光点,末了以该韶光为基定时光点。
然后去所有的血常规检讨中查找白细胞计数。
根据血常规的检讨韶光,定位到详细的某一次结果。

这种限定类型称之为“事宜-韶光”型,即先通过某一个详细的事宜,以该事宜发生的韶光点作为基准,在该基准前 / 后某段韶光范围内,目标字段的特定值。
常见的事宜有“放疗、化疗、手术、用药、临床诊断、病理诊断等”。

2. 特定的数据格式

科研的需求一贯存在,为了知足科研需求,专业统计剖析软件应运而生,并逐步发展。
常用的软件有spss、SAS、R等。
个中SPSS从1984年开始发展,到2009年已经将数据管理、数据剖析做到非常完善的地步。

而2009年,中国首次将医疗卫生信息化定性为支撑改革的支柱,在国家级层面提出发展信息化的哀求。
此后医院信息化软件迅速发展,前期以业务信息化为主。
2014年才开始重点转移到康健数据上。

如果此时医院信息系统再集成或者开拓统计剖析软件,须要投入大量的金钱和精力,而且年夜夫的接管度如何都是未知数。
医院自行开拓或采购的意义都变得不大。

造成了现在的情形,医院现有的软件系统中医学统计剖析部分缺失落,统计剖析事情须要在专业统计剖析软件中完成的。
以是当年夜夫想要做医学统计剖析时,就须要将数据从在医院信息系统中导出。

数据导出后,须要手动对数据格式处理,才可以知足目标软件的须要,摧残浪费蹂躏年夜夫的韶光。

怎么才能让数据导出后,不须要额外的数据处理,直接被目标软件所利用,从而减少年夜夫韶光的摧残浪费蹂躏。

在数据导出时,由系统完成数据格式处理的事情,数据被导出后可以直接导入剖析软件,从而节约数据处理的韶光。

在数据导出时,根据目标软件的须要,天生特天命据格式的文件。
数据文件被导出后可以直接导入剖析软件,从而节约数据处理的韶光。

特定的数据格式,指的是医疗信息系统往统计剖析软件传输数据时,按照统计剖析软件对数据格式的哀求天生数据。

以将数据导入spss剖析为例。

spss对导入数据有以下哀求:

文件格式为Excel或csv。
同一个案的数据要单独占一行。
每一个丈量指标只占一列。
丈量指标的结果为数值型。

如果导入的数据不符合哀求,则数据导入失落败,须要手动对数据进行调度,然后再重新导入。

为了担保数据能够直接导入spss中。
导出的数据须要知足:

文件格式为Excel或csv。
Excel中同一个案的数据要在一行,每一个丈量指标占一列。
确保数值型字段的数据类型为数字,而不是文本。
将列举型的值更换成数字。

系统将处理好格式的数据,以Excel文件的形式通报给前端页面。
用户将文件下载下来往后,直接导入spss做剖析事情。

三、总结

由于医疗信息化和专业统计软件的发展速率不屈衡,造成了医院信息系统与统计剖析软件互不相通。
以是医学数据统计剖析时,须要先数据导出,再导入剖析软件。

2014年,中国提出“46312”操持,开展“康健中国云做事操持”,海内的医疗大数据产品迅速崛起。
临床大数据公司纷纭成立,医院开始培植临床数据中央。
医院信息化从业务信息化发展到临床数据风雅化。

各大数据平台不仅开始增加传统的统计剖析工具,也增加了基于深度学习、机器学习的的新的剖析方法。
这使得我们可以在大数据平台中完成统计剖析事情。
不过易用性、利用习气仍须要不断打磨。

相信不远的将来,再做医学数据统计剖析时,可以在院内大数据平台中,无缝完成数据剖析事情,不再须要将数据导出。

PS:与之前完成的数据的高等搜索刚好组成一体,通过高等检索搜索到目标患者,然后将须要的字段导出。

本文由 @山南 原创发布于大家都是产品经理,未经容许,禁止转载

题图来自 Pexels,基于 CC0 协议

标签:

相关文章

桂林SEO教学,详细分析搜索引擎优化步骤

搜索引擎优化(SEO)已经成为网站推广的重要手段。桂林作为中国著名的旅游城市,拥有丰富的旅游资源和文化底蕴。本文将结合桂林的实际情...

PHP教程 2025-03-24 阅读0 评论0

全面分析SEO诊断,关键步骤与优化步骤

网站SEO(搜索引擎优化)已经成为企业营销的重要组成部分。SEO诊断作为SEO优化的重要环节,对于提高网站排名、提升用户体验具有重...

PHP教程 2025-03-24 阅读0 评论0

关键词优化,助力企业网络营销的方法分析

在互联网高速发展的今天,网络营销已经成为企业竞争的重要手段。而关键词优化作为网络营销的核心策略之一,其重要性不言而喻。本文将从关键...

PHP教程 2025-03-24 阅读0 评论0

沈阳SEO系统,助力企业互联网营销的利器

企业纷纷将目光投向了线上市场。如何在众多竞争者中脱颖而出,成为企业关注的焦点。沈阳SEO系统作为一种有效的互联网营销工具,为企业提...

PHP教程 2025-03-24 阅读0 评论0