跳过主要内容

非住院患者表型的进化表明长时间感染COVID

摘要

背景

对于一些SARS-CoV-2幸存者来说,从感染的急性期恢复的过程一直很艰难,其影响挥之不去。以COVID-19急性后后遗症(PASC)为特征的许多症状可能有多种原因,或在非COVID-19患者中也可见。准确识别PASC表型对于指导未来的研究和帮助卫生保健系统将其努力和资源集中在充分控制的年龄和性别特异性的COVID-19感染后遗症方面具有重要意义。

方法

在这项回顾性电子健康记录(EHR)队列研究中,我们应用了一个从临床数据中发现知识的计算框架,MLHO,以确定与过去的COVID-19逆转录聚合酶链反应(RT-PCR)阳性检测呈正相关的表型。我们在测试后的3-6个月和6-9个月的两个时间窗中评估测试后的表型,并按年龄和性别进行评估。分析使用了波士顿大都会区马萨诸塞州综合布里格姆医院电子病历中存储的纵向诊断记录数据。对2020年3月至2021年6月的数据进行了统计分析。研究参与者包括超过9.6万名COVID-19检测呈阳性或阴性且未住院的患者。

结果

我们确定了均与过去的SARS-COV-2感染相关联的不同年龄/性别群组或时间窗口之间33个表型。所有确定的表型为2个月或更长新记录在病人的医疗记录非住院患者一个COVID-19 RT-PCR试验,无论测试结果之后。在这些表型,对于嗅觉丧失和味觉障碍一个新的诊断记录(OR 2.60,95%CI [1.94-3.46]),脱发(OR 3.09,95%CI [2.53-3.76]),胸痛(OR 1.27,95%CI[1.09-1.48]),慢性疲劳综合征(OR 2.60,95%CI [1.22-2.10]),呼吸(OR 1.41急促,95%CI [1.22-1.64]),肺炎(OR 1.66,95%CI [1.28-2.16])和2型糖尿病(OR 1.41,95%CI [1.22-1.64])是一个过去COVID-19感染的最显著指标之一。此外,越来越多的新表型发现谁是年龄小于65的队列中增加了信心。

结论

这项研究的结果证实了COVID-19后的许多症状,并表明各种新的诊断,包括新的糖尿病和神经系统疾病诊断,在有COVID-19病史的人中比没有感染的人更常见。此外,超过63%的PASC表型在65岁以下的患者中观察到,这表明接种疫苗的重要性,以最大限度地降低年轻人COVID-19急性衰弱后遗症的风险。

同行评审报告

背景

COVID-19大流行在美国和世界各地的冲击是无情的。对许多人来说,从SARS-CoV-2感染(导致COVID-19的冠状病毒)的急性期恢复,可能会伴随着令人虚弱的第二幕。急性COVID-19患者可出现一系列持续的身体(如疲劳、呼吸困难、胸痛、咳嗽)、心理(如焦虑、抑郁、创伤后应激障碍)和神经认知(如记忆和注意力受损)症状,并持续数周或数月[123.45678].以COVID-19急性后后遗症(PASC)为特征的许多症状可能有多种原因。

到目前为止,已有多项研究发表在PASC上[123.4567910,但大多数都有小样本和个案系列,或依靠自我报告。Carfi等人使用标准问卷对179名意大利住院的COVID患者在出现症状后的平均60天进行了评估[11].只有12.6%的人完全摆脱了所有COVID-19症状,55%的人有3个或3个以上症状。最常见的症状是疲劳、呼吸困难、关节痛和胸痛。Chopra等人通过电话调查对488名出院后60天住院的患者进行了观察研究[12].最常见的持续性症状是咳嗽、呼吸困难、持续失去味觉或嗅觉,以及越来越难以完成日常生活活动。Huang等人进行了一项更大的队列研究,他们分析了1733名在6个月时从中国一家医院出院的COVID患者[13].他们在最初诊断6个月后确认,疲劳、肌肉无力、睡眠困难、焦虑和抑郁是最常见的症状。

这些研究都是病例系列,只关注COVID-19患者。此外,之前的PASC研究往往集中在住院后出现严重COVID-19症状的患者。目前尚不清楚所确定的持续症状是否适用于未住院的COVID - 19患者。此外,许多已发表的研究基于小队列(分析了数百名COVID-19患者),并依赖于自我报告的结果,这些结果可能包含由于夸大症状等原因而产生的潜在偏见[14].

也有一些不太常见的症状,包括眼部炎症[15],心脏损害[1617,自主不稳定性[18),复发假单胞菌感染(19],持续黏液分泌[20.,大脑的微观结构变化[21和格林-巴利综合征[22].一个大型队列分析了国际疾病和相关健康问题统计分类第十修订版ICD-10(国际疾病和相关健康问题统计分类第十修订版)电子健康记录中的诊断,可以帮助澄清有和没有COVID病史的患者之间的实际联系。

我们提供了一项回顾性队列研究的结果,该研究对马萨诸塞州布里格姆总医院(MGB)逾9.7万名接受COVID-19 RT-PCR检测的患者进行了检测。我们检测了COVID-19阳性和阴性患者在COVID-19检测后3-6和6-9个月两个时间窗内首次出现的新表型。利用MLHO,为从电子健康记录(ehr)中发现知识而开发的计算框架[232425],并提供一种经过验证的实用工具,用于研究和建模covid后的结果[2627我们在不同年龄/性别或时间窗的人群中发现了33种与最近/过去的SARS-CoV-2感染呈正相关的表型。所有确诊的表型均在未住院患者COVID-19 RT-PCR检测后2个月或更长时间内新记录在患者的医疗记录中,无论检测结果如何。

方法

我们利用了2020年3月至2021年6月在麻省总医院(MGB)检测SARS-CoV-2感染-逆转录聚合酶链反应(RT-PCR)的所有患者的纵向EHR诊断记录。我们将患者群限制在未住院的活着的人。为了增强对我们队列中的患者在后covid时代可能寻求MGB治疗的信心,我们进一步将研究人群缩小到自2010年以来在我们的电子数据存储库中有两份诊断记录的患者,间隔6个月。我们还排除了诊断代码与过去的COVID-19有关,但由于我们无法接近感染日期,在MGB记录中RT-PCR检测为阴性的患者。MGB机构审查委员会批准了本研究中临床数据的使用,并放弃了知情同意。

表型编码

为了构建特征空间,我们使用了ICD-9和ICD-10编码(国际疾病和相关健康问题统计分类第9和第10修订版)中记录的EHR诊断。为了表示分析的表型,我们将ICD-9/10诊断代码映射到一个来自全现象关联研究(PheWAS)的唯一表型代码(PheCode) [2829表型组。我们分配了RT-PCR检测后2个月的时间缓冲液作为COVID-19患者急性期的代理,并使用了急性期后首次记录的首次观察表型(图。1).使用这个时间分割,我们进一步的数据有限,只有使用的第一个观察记录(最小化问题列表重复)和只考虑诊断记录,第一次出现在一个病人的医疗记录2个月或更长时间后,rt - pcr test-see附加文件1:图S1。因此,特征空间包含了COVID-19 RT-PCR检测后2个月或之后首次在患者纵向EHR数据中记录的所有PheCodes,无论检测结果如何。

图。1
图1

研究队列,时间分割,诊断记录。该研究评估了所有在MGB设施进行COVID-19检测并具有可靠EHR数据的患者的后rt - pcr检测的诊断记录

MLHO框架

为了强有力地识别与最近COVID-19阳性检测呈正相关的表型,我们应用了多变量时间方法,从检测后的临床数据对过去的RT-PCR检测结果进行分类。这里的分类算法并不是为了分类的目的。相反,我们执行了“postdiction”,即“对过去某件事的断言或演绎”,[30.的目的是识别带有信息的特征(即表型),从而对过去的事件作出这样的断言。为此,我们利用了MLHO框架[26],其中包括一套计算算法[2326专门为临床数据建模和分型而设计的。我们采用了与Estiri等人使用的类似的分析过程[31用于从电子病历数据中确定COVID-19死亡率的危险因素。从MLHO框架来看,计算过程涉及到应用最小稀疏度,最大相关性(MSMR)算法[233233];临床专业知识;和多变量促进logistic回归,以计算识别与过去的RT-PCR检测呈正相关的表型的复合置信评分(参见附加文件中的MLHO表型选择标准)。

所有分析均采用R统计语言进行。

人群分层

为了增加特异性,我们在嵌套结构中按年龄和性别分层分析。这导致了以下层次:(1)所有患者,(2)65岁及以上,(3)65岁以下,(4)65岁及以上女性,(5)65岁及以上男性,(6)65岁以下女性,(7)65岁以下男性。除了对队列进行分层,我们还控制了患者的年龄和性别(在性别不可知论模型中)。对于MLHO在每个分层模型中识别的表型,我们训练了控制年龄和性别的标准广义logistic回归模型,并同时提取了多变量优势比(ORs)p-value (Wald’s test)和95%置信区间使用配置日志似然。

通过病历回顾进行临床验证

由于已知的电子病历诊断记录的可靠性问题[3334],我们通过图表回顾验证了MLHO鉴定的表型。一名临床专家审查了5名随机样本患者的临床记录和纵向记录,每个表型由MLHO鉴定,置信度在80以上。查看图表时,需要查看诊断代码时的临床记录,以确定该表型是否在遇到时实际存在,以及这是否是自遇到COVID时以来的新症状或诊断。如果随机抽取的五张图表中至少有三张证实了表型的存在及其最近的表现或诊断,那么表型就被纳入最终分析。

结果

在MGB设施中使用鼻拭子检测COVID-19的39.7万多名患者中,有210949名符合我们的纳入/排除标准,其中52491名患者检测结果呈阳性。在应用该方法保存记录后,96,025例患者仍留在我们的最终研究队列中,这意味着45.71%的在MGB设施进行感染检测的门诊队列在RT-PCR检测后2个月或更长时间内的ehr中有新的表型记录。其中22,475例(23.41%)患者SARS-CoV-2病毒阳性(附加文件)1:图S2和表S1)。经过稀疏性筛选(即从亚队列中去除低患病率[< 0.22%]表型)后,在3-6 -和6- 9个月的时间窗口内,在全队列中评估了354和334种表型。

总体而言,MLHO在不同年龄/性别组和/或时间窗中发现了41种与过去COVID-19检测阳性呈正相关的表型,MLHO置信评分高于80。所有确诊的表型均在未住院患者COVID-19 RT-PCR检测后2个月或更长时间内新记录在患者的医疗记录中,无论检测结果如何。我们对215名随机抽样的患者进行了图表回顾,以验证MLHO的发现。对于几乎所有的表型,临床笔记中提供的细节和描述与该图表指定的表型相匹配(附加文件)1:表S2)。33个表型(图。23.),大多数被审查的笔记随机样本表明,自COVID以来,表型是新的。因此,尽管自COVID-19诊断以来使用了新的ICD-9/10记录,但基于笔记,我们删除了8种表型,因为它们在COVID-19之前存在的可能性。对于33个表型,多变量优势比(ORs), 95%置信区间和MLHO的置信评分(CSs)提供如下-也可在附加文件中获得1:表S3。

图2
figure2

与过去的covid -19阳性RT-PCR检测呈正相关的表型。根据年龄和性别确定covid -19后表型,并根据MLHO置信度评分排序(用白色字体表示)。100表示表型在100%的MLHO迭代中被识别。所包括的表型与过去COVID-19检测呈阳性相关,至少在一个亚队列中置信度评分高于80%

图3.
图3

covid -19后3-6、6-9个月PASC表型的时间表现PASC表型由MLHO置信度评分进行排名

结果显示,在总体队列和/或一个或多个亚队列中,11种表型具有极高的可信度(> 97%),这些表型与过去COVID-19感染呈阳性相关。在3 - 6个月的窗口期,有7个在整个人群中是非常高的。在整个队列中,在第3至6个月间的所有MLHO迭代中均发现了脱发(OR 3.09, 95% CI [2.53-3.76], cs100)。特别是在65岁以下和65岁以上的人群中,特别是在65岁以下和65岁以上的女性中。同样,非特异性胸痛的新诊断记录表明,在3 - 6个月的时间窗内曾感染COVID-19 (OR 1.27, 95% CI [1.09-1.48], cs100),特别是65岁以下人群(OR 1.30, 95% CI [1.08-1.55], cs100)。在MLHO迭代中,嗅觉缺失和味觉障碍在3 - 6个月的窗期(OR 2.60, 95% CI [1.94-3.46], CS 100)中被确定为100%,在6- 9个月的窗期(OR 2.10, 95% CI [1.40-3.11], CS 100)中仍然重要。这一表型表明,65岁以下人群和65岁以下女性的COVID-19过去呈阳性。

在其他被鉴定为97分且可信度较高的表型中,慢性疲劳综合征出现在3 - 6个月窗期(OR 2.60, 95% CI [1.22-2.10], CS 98)和6- 9个月窗期(OR 2.03, 95% CI[1.31-3.11]),在小于65岁的患者和小于65岁的女性中表现更为突出。在3 - 6个月窗口期,肺炎在总体人群(OR 1.66, 95% CI [1.28-2.16], cs99)和65岁以上人群(OR 1.92, 95% CI [1.03-3.46], cs99)中具有较高的置信评分。呼吸急促在3 - 6个月窗期(OR 1.41, 95% CI [1.22-1.64], CS 100)和6- 9个月窗期(OR 1.45, 95% CI [1.09-1.93], CS 96)均具有较高的置信度。在65岁以下的人群中,它的信任度也很高。最后,心悸(OR 1.41, 95% CI[1.22-1.64]) 2型糖尿病(OR 1.41, 95% CI[1.22-1.64])在3-6个月窗期也有很高的置信评分。

一些表型得分非常高,但只在特定的时间框架和特定的亚队列中,例如,65岁以下(OR 2.02, 95% CI [1.37-2.95], CS 100)和65岁以下女性(OR 2.10, 95% CI [1.40-3.15], CS 100) 6 - 9个月范围内的缺铁性贫血。65岁以下的男性在3 - 6个月范围内出现蛋白尿(OR 3.19, 95% CI [1.72-5.96], CS 100),在6- 9个月范围内出现晕厥和虚厥(OR 4.80, 95% CI [1.56-13.39], CS 99)。

在其他被确定为过去COVID-19感染指标的COVID-19相关表型中,有一些亚组,置信度评分为90至96分。在3-6-month窗口中,这包括65年以下的女性在孕期贫血,慢性肾脏疾病的人群超过65,65岁以上和女性心力衰竭与保存射血分数在65岁以上的人群,不规则的月经周期在65年以下的女性,65年以下的神经紊乱,以及65岁以下男性的皮疹和其他非特异性皮肤疹。6-9-month范围内表型,信心得分在90年到96年窗口中,这包括贫血的慢性疾病在女性65岁及以上,65岁以下的男性疾病的结膜,头昏眼花,头晕65岁以上的女性,月经周期不规则在总群,感音神经性听力损失大于65的女性,以及65岁以上人群和65岁以上女性的血管性痴呆。

讨论

我们在未住院的COVID-19患者中确定了33种表明长期感染COVID-19的表型。表型如脱发、嗅觉缺失、疲劳、呼吸短促和胸痛已被充分记录为PASC的常见体征和症状[73536].这项研究表明,这些表型是与初次感染后3 - 6个月窗口期出现的综合征的一些最早关联,也是表明之前感染COVID-19的一些最重要特征。所有这五种表型(脱发、嗅觉缺失和味觉障碍、呼吸短促、慢性疲劳综合征和非特异性胸痛)在3 - 6个月的窗口期被高度可信地记录下来。虽然脱发和非特异性胸痛在6 - 9个月的窗期中没有高可信度,但嗅觉缺失和慢性疲劳综合征仍然是在这两个时间段中看到的重要表型。此外,一些表型也被鉴定为类似的高可信度,包括II型糖尿病、肺炎、蛋白尿、晕厥和虚脱。

有趣的是,65岁以下的人比65岁以上的人有更多的新表型,更有信心。超过63%的已确定的长时间COVID-19表型在65岁以下的过去COVID-19患者中观察到。这些发现对年轻患者具有重要意义。尽管在急性期没有住院治疗,但在这一较年轻队列人群中,长期COVID的症状被发现具有很高的可信度。这为年轻患者选择接种疫苗提供了另一个理由,因为这种疾病的长期影响显然不限于老年患者。虽然造成这些后遗症的确切生物学原因尚不清楚,并正在研究中,但在年轻人群中丰富的这些诊断可能表明,这些患者免疫反应的健壮性导致了一些covid后后遗症。然而,这些结果应该理解和合格的上下文中,平均而言,年轻患者往往比65岁及以上的有更少的健康与卫生保健系统的交互(因此更少的诊断记录),这可能导致检测信号更轻松地在这个年轻群体相比,一个年长的人群。

While the chart review’s primary purpose was to determine if the clinical notes were in agreement with the ICD-9/10 labels, the reviewer also noted that physicians consistently attributed two of the phenotypes (alopecia, and anosmia and dysgeusia) to a previous history of COVID-19, whereas the physicians’ notes did not specifically identify a connection between the phenotype and the previous infection for most of the other phenotypes, even those with high confidence like type 2 diabetes or non-specific chest pain. Our model indicates that even if these phenotypes are not explicitly identified or recognized by the clinician and patient at the individual level, many of these unrecognized phenotypes still have a high confidence score. While an ICD code on its own does not specify the time of onset, the chart review helped to confirm that the presented phenotypes were likely new since COVID-19. The majority of charts reviewed for each phenotype suggest that the symptoms or the diagnosis occurred after COVID-19. Our model identifies the relationships between COVID and a phenotype, where a healthcare provider and patient may otherwise miss that relationship.

几种神经表型(血管性痴呆、痴呆和神经紊乱)在COVID之后经常被诊断出来,似乎与感染有更大的关联。神经系统疾病表型包括几个ICD代码,在随机抽样的这种表型患者中,大多数患者具有ICD代码“r41.89 -涉及认知功能和意识的其他症状和体征”。总的来说,这些表型表明持续的认知功能障碍。关于急性COVID的最早报告,如Mao对中国214名住院患者的回顾性分析,描述了近一半重症患者的神经表现,包括脑血管并发症[37].自急性期以来,对诊断为COVID后的后遗症“脑雾”的描述已多次被描述[3839].Al-Aly特别记录了记忆力问题和中风的增加[40].我们的模型表明,这些认知缺陷是持续的,在某些情况下可能非常严重,甚至导致有COVID史的人有更高的初始正式诊断为痴呆症。虽然许多患者可能已经显示出一些记忆丧失的迹象,但直到COVID-19之后才被正式诊断为痴呆症,这表明这种病毒性疾病可能导致了他们的病情恶化,并正式宣布了这一诊断。

另一个重要的表型是2型糖尿病。多项研究指出,COVID-19和糖尿病之间可能存在病理生理学关系[4142].在确诊COVID-19后,一些代谢性疾病的发病率增加了[40].我们的研究表明,代谢紊乱可能如此重要,以至于导致糖尿病的正式诊断。

甲表型疾病包括各种各样的诊断,包括白甲病、甲松解、甲化、Mees系、Muehrcke系和Beau系,所有这些都是整体健康的标志,以前曾与感染和肾脏或肝脏功能障碍有关。博氏线特别与COVID-19感染有关[4344].我们的研究结果表明,这种相关性是广泛的,可能是包括肾损伤在内的全身感染的结果。

在65岁以下的男性患者中,蛋白尿也被确认与COVID-19有关。COVID-19以前曾与急性肾损伤有关[45],而蛋白尿是众所周知的肾脏疾病的替代物[46].蛋白尿是年轻患者群体与COVID-19具有关联关系的鉴定,其结果COVID-19对肾脏持续存在几个月的侮辱感染已得到解决之后。

MLHO框架似乎比单变量PheWAS更强大。少数表型具有相对较高的未经调整的统计显著性(Ap-值在0.01和0.001之间)将在线性单变量PheWAS之后被删除p-多个假设的值校正。这类表现型的两个例子是心悸和非特异性胸痛,这两种症状以前都被描述为PASC的常见症状[73536].

MLHO在本研究中的实施类似于标准的单变量PheWAS [2829都为从临床数据中进行高通量关联挖掘提供了计算解决方案。然而,标准PheWAS的一个挑战是在适当地应用纠正之间找到一个合理的平衡p-值,以减少由于多次测试而导致的错误发现和最小化错误阴性[47].我们的方法扩展了单变量p-价值相关的标准,以识别与更全面和多元的基于熵的过程的现象范围的关联。MLHO迭代应用联合互信息,进行稀疏筛查,并使用梯度增强来描述COVID-19急性后后遗症。MLHO中的迭代过程为与过去COVID-19 RT-PCR检测阳性相关的每个表型提供了可解释的概率置信评分。

MLHO的计算算法通过临床专业知识(即图表审查)的增强,避免了大量的假阳性发现,同时提供了比标准PheWAS更稳健的概率方法。我们评估了超过1600种表型,并确定了与过去的COVID-19感染相关的少量表型(自信心得分)。因此,在纳入covid阴性患者的同时,该研究排除了一些表型关联,这些关联以前是通过控制不佳的观察数据确定的,如指甲改变以外的皮肤疹和脱发。

我们承认,由于仅使用诊断代码,本研究的发现可能存在局限性,这可能导致缺失临床记录和实验室结果中的体征和症状。此外,考虑到大流行的强度和错误信息的传播,EHR数据可能代表提供者和患者之间的确认性偏见。在其他机构重复这项研究将有助于阐明在MGB中看到的临床表型是否反映了PASC或当地医疗保健利用模式的真实特征。此外,我们只纳入covid - 19 PCR阳性日期至少2个月后首次使用的诊断。这可能导致一些在急性期开始2个月内开始的误诊;然而,它有助于确保新发现的诊断与急性期无关。未来的研究可以考虑修改这个时间缓冲器;然而,在捕获所有后续诊断和增加诊断不是疾病急性期的一部分的信心之间仍将存在权衡。最后,我们排除了住院的COVID-19患者。一方面,新冠肺炎时期的住院患者和非住院患者很难匹配。 On the other hand, the post-COVID syndrome can still be observed in patients who were never hospitalized [124849505152].无论如何,未来PASC研究应包括住院患者。

结论

2020年,美国的COVID-19大流行几乎无法控制。虽然SARS-CoV-2感染后急性后遗症的确切人数尚不清楚,但由于COVID-19在全球范围内的大规模传播,这是一个重大的公共卫生负担。我们在未住院的COVID-19患者中确定了33种表明长期感染COVID-19的表型。我们对COVID-19及其慢性后遗症的认识正在不断发展,新的风险仍是未知的。我们不知道谁可能会出现COVID-19后综合征,症状会持续多久,以及COVID-19是否会引发慢性病。准确的表型识别对于指导未来的研究和卫生保健系统将其努力和资源集中在充分控制的年龄和性别特异性的COVID-19感染后遗症方面具有重要意义。在过去的十年中,电子病历库中存储的临床数据的不断增加和数量的增加为医疗保健系统研究演变中的流行病副产品提供了非常好的机会。EHR数据为了解SARS-CoV-2感染后的急性后影响提供了一个独特的机会。

数据和材料的可用性

由于信息治理的原因,此项目使用的匿名患者级数据不能共享。获得MGB IRB批准的附属研究人员可以获得数据。MLHO的计算机代码在GitHub上公开:https://github.com/hestiri/mlho/

缩写

置信区间:

置信区间

CS:

信心得分

电子医疗纪录:

电子健康记录

诊断结果:

《国际疾病和相关健康问题统计分类》第10次修订本

ICD-9:

国际疾病和相关健康问题统计分类第9次修订

MGB:

质量一般的布里格姆

MSMR:

最小化稀疏性,最大化相关性

或者:

优势比

PASC:

COVID-19急性后后遗症

PheWAS:

Phenome-wide关联研究

rt - pcr:

逆转录聚合酶链反应

参考文献

  1. 1.

    Carfì A, Bernabei R, Landi F.其他。Gemelli对抗COVID-19后急性护理研究组。急性COVID-19患者出现持续症状。《美国医学协会杂志》上。2020; 324:603-5。

    文章谷歌学术

  2. 2.

    熊强,徐敏,李军,刘勇,张军,徐勇,等。中国武汉COVID-19幸存者的临床后遗症:一项单中心纵向研究临床微生物感染。2021;27:89-95。

    中科院文章谷歌学术

  3. 3.

    Goërtz YMJ, Van Herck M, delbressin JM, Vaes AW, Meys R, Machado FVC,等。感染SARS-CoV-2 3个月后症状持续:covid -19后综合征?6.《美国队长3》;https://doi.org/10.1183/23120541.00542-2020

  4. 4.

    100名COVID-19住院患者的嗅觉和味觉功能障碍:现实生活中的性别差异和恢复时间。欧洲Arch耳鼻喉科。2020;277:3519-23。

    文章谷歌学术

  5. 5.

    等。COVID-19感染幸存者的出院后症状和康复需求:一项横断面评估J Med Virol. 2021; 93:1013-22。

    中科院文章谷歌学术

  6. 6.

    Bowles KH, McDonald M, Barrón Y, Kennedy E, O 'Connor M, Mikkelsen M.出院后COVID-19存活:家庭健康接受者的症状、功能和不良结局。安实习医生,2020年。https://doi.org/10.7326/M20-5206

  7. 7.

    等。关键词:人工神经网络,神经网络,神经网络COVID-19症状:门诊设置中的纵向进化和持久性安实习医生,2020年。https://doi.org/10.7326/M20-5926

  8. 8。

    疾病预防控制中心。COVID-19的长期影响。2020.https://www.cdc.gov/coronavirus/2019-ncov/long-term-effects.html.修订于2021年3月11日。

  9. 9。

    作者简介:王志刚,男,硕士,硕士研究生。COVID-19大流行期间新发嗅觉丧失的早期恢复——一项观察队列研究J耳鼻咽喉头颈外科医生2020;49。https://doi.org/10.1186/s40463-020-00423-8

  10. 10.

    wang AW, Shah AS, Johnston JC, Carlsten C, Ryerson CJ。COVID-19后患者报告的结局指标:一项前瞻性队列研究。Eur Respir J. 2020;56。https://doi.org/10.1183/13993003.03276-2020

  11. 11.

    Carfì A, Bernabei R, Landi F. Gemelli抗COVID-19后急性护理研究组。急性COVID-19后患者持续症状《美国医学协会杂志》上。2020; 324:603-5。

  12. 12.

    乔普拉V,弗兰德斯SA,奥马利M,马拉尼AN,普雷斯科特HC。COVID-19住院患者的60天预后。安实习医生,2020年。https://doi.org/10.7326/M20-5661

  13. 13.

    关键词:新型冠状病毒肺炎(COVID-19),出院患者,6个月预后,队列研究《柳叶刀》杂志。2021;397:220-32。

    中科院文章谷歌学术

  14. 14.

    《自我报告的科学》,Garcia J, Gustavson AR。APS观察。1997;10https://www.psychologicalscience.org/observer/the-science-of-self-report

  15. 15.

    Bakhoum MF, Ritter M, Garg AK, Chan AX, Bakhoum CY, Smith DM。medRxiv。2020; 2020.09.22.20128140。

  16. 16.

    庞特曼,Carerj ML, Wieters I, Fahim M, Arendt C, Hoffmann J,等。最近从2019冠状病毒病(COVID-19)中康复的患者的心血管磁共振成像结果。JAMA心功能杂志。2020;5:1265 - 73。

  17. 17.

    Brito D, Meester S, Yanamala N, Patel HB, Balcik BJ, casaclangverzosa G, et al.;从COVID-19康复的大学生运动员心包受累的高患病率JACC cardiovascular Imaging. 2021; 14:541-55。

  18. 18.

    等。“长期COVID”中的自主功能障碍:原理、生理和管理策略地中海。2021; 21: e63-e67。

  19. 19。

    王志强,王志强,王志强,等。急性COVID-19后与旁观者t细胞活化和复发耐抗生素细菌性肺炎相关的证据Elife。2020;9。https://doi.org/10.7554/eLife.63430

  20. 20.

    持久性粘稠粘液是COVID-19的长期症状吗?Eur J病例代表实习医生。2020;7:002145。

    PubMed公共医学中心谷歌学术

  21. 21.

    鲁Y,李X,耿d,梅N,吴P-Y,黄C-C等。脑Mmicro-sStructural Cchanges在COVID-19 Ppatients - AAN MRI基于3个月的F按照向上Sstudy。eclinicalMedicine。2020; 25:100484。

    文章谷歌学术

  22. 22.

    Raahimi MM, Kane A, Moore CE, Alareed AW。SARS-CoV-2感染后Guillain-Barré综合征晚发:“长COVID-19综合征”的一部分?英国医学杂志病例报告2021;https://doi.org/10.1136/bcr-2020-240178

  23. 23.

    stiri H, Strasser ZH, Murphy SN。高通量与时间序列表型分型。J Am Med Inform Assoc. 2020。https://doi.org/10.1093/jamia/ocaa288

  24. 24.

    Estiri H, Vasey S, Murphy SN。离散临床数据的传递顺序模式挖掘。国际人工智能大会。2020。https://link.springer.com/chapter/10.1007/978-3-030-59137-3_37

  25. 25.

    Estiri H,斯特拉瑟ZH,Klann JG,麦考TH JR,Wagholikar KB,Vasey S,Castro的VM,墨菲ME,墨菲SN。传递测序病历挖掘预测和可解释的时间表征。模式(N Y)。2020; 1(4):100051。

  26. 26.

    stiri H, Strasser ZH, Murphy SN。MLHO个体化预测COVID-19不良结局Sci众议员2021;11:5322。

    中科院文章谷歌学术

  27. 27.

    stiri H, Strasser ZH, Klann JG, Naseri P, Wagholikar KB, Murphy SN。用电子医疗记录预测COVID-19死亡率。NPJ Digit Med, 2021;4:15。

    文章谷歌学术

  28. 28.

    丹尼JC,里奇MD,贝斯福德MA,滑轮JM,Bastarache L,欠压Gentry的K,等人。PheWAS:展现着phenome全扫描的可行性,以发现基因疾病的关联。生物信息学。2010; 26:1205年至1210年。https://doi.org/10.1093/bioinformatics/btq126

    中科院文章PubMed公共医学中心谷歌学术

  29. 29.

    Denny JC, Bastarache L, Roden DM.全现象关联研究作为推进精准医学的工具。Annu Rev Genomics Hum Genet. 2016; 17:353-73。

  30. 30.

    POSTDICTION。https://www.lexico.com/en/definition/postdiction.2021年7月2日生效。

  31. 31.

    stiri H, Strasser ZH, Klann JG, Naseri P, Wagholikar KB, Murphy SN。用电子医疗记录预测COVID-19死亡率。npj数字医学。https://doi.org/10.1038/s41746-021-00383-x

  32. 32.

    Estiri H, Vasey S, Murphy SN。离散临床数据的传递序列模式挖掘。正确用法:医学领域的人工智能。施普林格国际出版;2020.p . 414 - 424。

  33. 33.

    Estiri H, Vasey S, Murphy SN。生成迁移学习用于测量EHR诊断记录的可信性。J Am Med Inform Assoc. 2020。https://doi.org/10.1093/jamia/ocaa215

  34. 34.

    Kahn MG, Callahan TJ, Barnard J, Bauck AE, Brown J, Davidson BN,等。电子健康记录数据二次使用的统一数据质量评估术语和框架。EGEMS (DC)洗。2016; 4:1244。

  35. 35.

    Nalbandian A, Sehgal K, Gupta A, Madhavan MV, McGroder C, Stevens JS等。急性COVID-19综合症。Nat地中海》2021。https://doi.org/10.1038/s41591-021-01283-z

  36. 36.

    Petersen MS, Kristiansen MF, Hanusson KD, Danielsen ME, Á Steig B, Gaini S, et al.法罗群岛长期COVID - 19 -一项对非住院患者的纵向研究。2020。doi:https://doi.org/10.1093/cid/ciaa1792

  37. 37.

    毛林,金华,王敏,胡艳,陈胜,何强,等。武汉市2019冠状病毒病住院患者的神经系统表现中国JAMA神经。2020;77:683 - 90。

  38. 38.

    作者等。非住院治疗的COVID-19“长搬运工”的持续神经症状和认知功能障碍译自《神经学》2021;8:1073-1085。

  39. 39.

    Bell ML, Catalfamo CJ, Farland LV, Ernst KC, Jacobs ET, Klimentidis YC,等。非住院队列中COVID-19急性后后遗症:亚利桑那州CoVHORT的结果bioRxiv。2021.doi:https://doi.org/10.1101/2021.03.29.21254588

  40. 40.

    王志强,谢玉华,王志强。新型冠状病毒肺炎急性后遗症的高维特征分析。自然》2021。https://doi.org/10.1038/s41586-021-03553-9

  41. 41.

    新冠肺炎和糖尿病:揭示两大流行病的相互作用。糖尿病Metab Res Rev. 2020;:e33213321。

  42. 42.

    新冠肺炎的直接和长期并发症可能是2型糖尿病:β细胞功能障碍、细胞凋亡和可能机制的探索细胞。2020;9。https://doi.org/10.3390/cells9112475

  43. 43.

    阿罗拜达,林俊敏。Beau lines与COVID-19有关。协会。2020; 192: E1040。

    中科院文章谷歌学术

  44. 44.

    井S,盛冈S,稻田男,Ohmagari N.博的线和白甲在COVID-19患者。内科杂志。2020; 59:3259。

  45. 45.

    COVID-19急性肾损伤:肾脏学的另一个挑战。Am J Nephrol. 2020; 51:761-3。

  46. 46.

    蛋白尿的病理生理学及其作为慢性肾脏疾病预后指标的价值[临床药理学杂志。2013;76:516-23 .]

    PubMed公共医学中心谷歌学术

  47. 47.

    Storey JD, Tibshirani R.全基因组研究的统计学意义美国国立科学研究院2003;100:940 - 5。

    中科院文章谷歌学术

  48. 48.

    covid - 19后神经综合征(PCNS);一种对全球神经病学具有挑战的新综合征。神经科学杂志。2020;419:117179。

  49. 49.

    “后冠状病毒”综合征:损害有多深?J Med Virol. 2020。https://onlinelibrary.wiley.com/doi/abs/10.1002/jmv.26465

  50. 50.

    冠状病毒携带者的持久痛苦。大自然。2020;585:339-41。

    中科院文章谷歌学术

  51. 51.

    随着数字的增长,COVID-19“长途搬运工”的树桩专家。《美国医学协会杂志》上。2020; 324:1381-3。

  52. 52.

    Sudre CH, Murray B, Varsavsky T, Graham MS, Penfold RS, Bowyer RC, et al.;Llong-COVID的属性和预测因子:COVID症状研究应用bioRxiv收集的COVID病例及其症状的分析。2020.doi:https://doi.org/10.1101/2020.10.19.20214494

  53. 53.

    Wei W-Q, Bastarache LA, Carroll RJ, Marlo JE, Osterman TJ, gamazer, et al.;评估电子健康记录中全现象相关性研究的phecodes、临床分类软件和ICD-9-CM编码。《公共科学图书馆•综合》。2017;12:e0175508。

    文章谷歌学术

  54. 54.

    吴鹏,李晓峰,李晓峰,等。将ICD-10和ICD-10- cm代码映射到Phecodes:工作流开发和初始评估。JMIR Med Inform. 2019;7:e14325。

  55. 55.

    基于联合互信息最大化的特征选择。专家系统应用程序2015;42:8520-32。

  56. 56.

    基于联合互信息的特征选择。见:国际公务员制度委员会智能数据分析进展专题讨论会论文集。Citeseer;1999.22 - 25页。

  57. 57.

    Hofner B,迈尔A,Robinzonov N,施密德M.基于模型的在R. COMPUT统计推进。2012年。http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.433.2755&rep=rep1&type=pdf

  58. 58.

    基于Boosting的无偏模型选择框架。J computer Graph Stat. 2011; 20:956-71。

  59. 59.

    Bühlmann P, Hothorn T. Boosting算法:正则化、预测和模型拟合。统计科学。2007;22:477 - 505。

  60. 60.

    在R中基于模型的推进:使用R包mboost的实践教程。第一版Stat。2014;29:3-35。

    文章谷歌学术

下载参考

确认

我们感谢马萨诸塞州综合布里格姆研究信息科学与计算团队的许多同事策划了MGB COVID-19市场并提供了信息科学和计算支持。COVID-19临床特征EHR (4ce)联盟成员如下:James R Aaron, Giuseppe Agapito, Adem Albayrak, Mario Alessiani, Danilo F Amendola, Li L.L.J Anthony, Bruce J Aronow, Fatima Ashraf, Andrew Atz, Paul Avillach, James Balshi, Brett K beaulieue - jones, Douglas S Bell, Antonio Bellasi, Riccardo Bellazzi, Vincent Benoit, Michele Beraghi José Luis Bernal Sobrino, Mélodie beraux, Romain Bey,Alvar Blanco Martínez, Martin Boeker, Clara-Lea Bonzel, John Booth, Silvano Bosari, Florence T Bourgeois, Robert L Bradford, Gabriel A Brat, Stéphane Bréant, Nicholas W Brown, William A Bryant, Mauro Bucalo, Anita Burgun, Tianxi Cai, Mario Cannataro, Aldo Carmona, Charlotte Caucheteux, Julien Champ, Jin Chen, Krista Chen, Luca Chiovato,Lorenzo Chiudinelli, Kelly Cho, James J Cimino, Tiago K Colicchio, Sylvie Cormont, Sébastien Cossin, Jean B Craig, Juan Luis Cruz Bermúdez, Jaime Cruz Rojo, Arianna Dagliati, Mohamad Daniar, Christel Daniel, Anahita Davoudi, Batsal Devkota, Julien Dubiel, Loic Esteve, Hossein Estiri, Shirley Fan, Robert W Follett, Paula S. A GaiollaThomas Ganslandt, Noelia García Barrio, Lana X Garmire, Nils Gehlenborg, Alon Geva, Tobias Gradinger, Alexandre Gramfort, Romain Griffier, Nicolas Griffon, Olivier Grisel, Alba Gutiérrez-Sacristán, David A Hanauer, Christian Haverkamp, Bing He, Darren W Henderson, Martin Hilka, John H Holmes, Chuan Hong, Petar Horki, Kenneth M Huling,梅根·R厨、理查德•W Issitt安妮·索菲雅诺Vianney Jouhet,马克·S·凯勒凯蒂·基尔霍夫杰弗里·克兰,以撒小羽,伊恩·D“将军”Detlef克拉斯Sehi L 'Yi, Ashok K•克里希纳穆尔蒂Trang T勒,朱迪斯·勒布朗,Andressa RR雷特,纪尧姆Lemaitre, Leslie Lenert Damien Leprovost, Molei Liu Ne Hooi Loh, Sara Lozano-ZahoneroYuan Luo, Kristine E Lynch, Sadiqa Mahmood, Sarah Maidlow, Alberto Malovini, Kenneth D Mandl, Chengsheng Mao, Anupama Maram, Patricia Martel, Aaron J Masino, Maria Mazzitelli, Arthur Mensch, Marianna Milano, Marcos F Minicucci, Bertrand Moal, Jason H Moore, Cinta Moraleda, Jeffrey S Morris, Michele Morris, Karyn L Moshal, Sajad Mousavi,丹尼尔·L Mowery,道格拉斯的Murad,肖恩N墨菲,托马斯P诺顿,安东尼Neuraz,凯元Ngiam,詹姆斯·B·诺曼圣战奥贝德滨P当Okoshi,凯伦·L奥尔森吉尔伯特Omenn,尼娜奥尔,布莱恩·D Ostasiewski Nathan P帕默,尼古拉斯巴黎,盥洗室P Patel,米格尔Pedrera吉梅内斯,艾米丽R普法夫,丹尼尔摩托车后座,汉斯·U普罗科什Robson A Prudente Víctor Quirós González, Rachel B Ramoni, Maryna Raskin, Siegbert Rieg, Gustavo Roig Domínguez, Pablo Rojo, Carlos Sáez, Elisa Salamanca, Malarkodi J Samayamuthu, Arnaud Sandrin, Janaina CC Santos, Maria Savino, Emily R Schriver, Petra Schubert, Juergen Schuettler, Luigia Scudeller, Neil J Sebire, Pablo Serrano Balazote, Patricia Serre, Arnaud Serret-Larmande, Zahra Shakeri, Domenick Silvio, Piotr Sliz, Jiyeon Son, Charles Sonday, Andrew M South, Anastasia Spiridou, Amelia LM Tan, Bryce WQ Tan, Byorn WL Tan, Suzana E Tanni, Deanne M Taylor, Ana I Terriza Torres, Valentina Tibollo, Patric Tippmann, Carlo Torti, Enrico M Trecarichi, Yi-Ju Tseng, Andrew K Vallejos, Gael Varoquaux, Margaret E Vella, Guillaume Verdy, Jill-Jênn Vie, Shyam Visweswaran, Michele Vitacca, Kavishwar B Wagholikar, Lemuel R Waitman, Xuan Wang, Demian Wassermann, Griffin M Weber, Zongqi Xia, Nadir Yehya, William Yuan, Alberto Zambelli, Harrison G Zhang, Daniel Zoeller, and Chiara Zucco.

资金

本研究得到国家人类基因组研究所3U01HG008685-05S2和国家医学图书馆T15LM007092资助。内容完全是作者的责任,并不一定代表国家卫生研究院或马萨诸塞州总医院的官方观点。

作者信息

从属关系

作者

财团

贡献

HE, ZHS, GAB和SNM设计了这项研究。他获得了数据并进行了分析。HE、ZHS、GAB、YRS、CJP和SNM参与了结果的解释。HE和ZHS是联合主要作者。HE, ZHS, GAB, YRS, CJP, SNM对该手稿进行了评论。作者阅读并批准了最终稿。

相应的作者

给侯赛因·埃斯蒂里的信件。

道德声明

伦理批准和同意参与

MGB机构审查委员会批准了本研究中临床数据的使用,并放弃了知情同意。

同意出版

不适用。

相互竞争的利益

两位作者宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

万博平台登陆网址施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

附加文件1:图S1。

统计病例和控件中的诊断记录的模式。图S2。患者人群的选择。表S1。研究队列的人口学特征。表S2。MHLO鉴定的42种表型的手工图表回顾。表S3。PASC表型的多变量or [5354555657585960].

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

再版和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

斯蒂里,H.,斯特拉瑟,Z.H.,布拉特,G.A.et al。非住院患者表型的进化表明长时间感染COVID。BMC医学19,249(2021)。https://doi.org/10.1186/s12916-021-02115-0

下载引用

关键字

  • SARS-CoV-2急性后遗症
  • 电子健康记录
  • 表型
  • 机器学习
Baidu