TCGA癌症临床数据资源全面介绍---癌症研究各个领域的全谱!

2021-10-25 05:26 来源:兰州妇科医院

2006年,结核病症序列由此可知谱(The Cancer Genome Atlas, TCGA)计划以多形病症态胶质母肝细胞刺毛(GBM)、肺部点状肝细胞恶性肿瘤(LUSC)和腺体溃疡病症态囊腺恶性肿瘤(OV)开始为期3年的试行建设项目,2009年~2015年全盘展开。到建设项目累计,TCGA的网络研究成果工用上者已再现了33种结核病症多种类型10,000余由此可知病症患者的化学键特质,并定义了很多化学键流感病症毒。TCGA系统性联的确诊关键特质代此表人独派化的原始数据得来。为适当应该选用这些具序列特质的海量确诊原始数据,不太可能会TCGA收尾一批重大成果,发此表在CellPress间公司的学报。

本文对4年底5日发此表Cell上的一文进行时编译。社论阐述以OS(总适应环境期)、PFI(无成果等长)、DFI(人言等长)和DSS(传染病症系统性存活)为四个主要确诊结果三站的TCGA独派结核病症确诊原始数据森林资源(TCGA-CDR)常规化原始在线,并证明了了每种结核病症多种类型的三站选用建言。TCGA确诊原始数据可从序列原始数据共有享紧致(GDC)门户网站订阅,所有的化学键原始数据在订阅。确诊原始数据和化学键原始数据选用比如说的条码结构,便于病症患者的确诊详细资料和采样化学键原始数据整合。

TCGA独派恶性肿瘤原始在线配置文件特质

由此可知1A为确诊原始数据整合和归纳作法及4个主要确诊三站衍生和评核的流程由此可知,对33份初始申请人和97份后续原始数据文件,共有33种结核病症多种类型111,60由此可知结核病症病症患者的详细资料进行时了管控。此表1为每个TCGA配置文件的基本特质。按原发采样根据化学键特质被选为每个配置文件,面部黑色素刺毛(SKCM)的原发和重新分配灶两种多种类型都有,其它极少数的原发与重新分配多种类型也有研究成果。

由此可知1. 确诊原始数据整合和归纳作法及4个主要确诊三站衍生和评核流程由此可知

此表1. TCGA 独派恶性肿瘤配置文件特质

确诊结果三站OS、PFI、DFI和DSS

总适应环境期(OS)很不可忽视,优点是定义OS血案时模糊病症态最较差。但选用OS用上三站可能会削弱确诊研究成果,因为非恶性肿瘤死因都是能突显出生物学、来袭病症态或对治疗法缓解。选用OS或才可格内外长的随访星期;很多确诊试验中所,通常选用比起随访星期短的DFI或PFI。针对这两项TCGA确诊原始数据,要察觉到或多或少确诊随访等长在来袭病症态结核病症多种类型结果的不可忽视病症态,因为可能会几年内就注意到到确诊血案,在致死先前已注意到病症情罹患或成果。对来袭病症态较强的结核病症多种类型,病症患者在数十乃至几十年后罹患,随访前夕可能会无法注意到够大血案以反对可靠结果供判断。该归纳的最大限度是体检TCGA独派恶性肿瘤确诊检测的比起竞争者和不足以,范本今后的归纳和避免随访等长星期不足以等缺陷。

归纳全部TCGA确诊原始数据后,结论如下:在原始数据不对得时,OS、PFI及DFI比起有用,但大部分只能只能估算DSS。由此可知1B为33种相异结核病症多种类型的OS K-M双曲线。尽管适应环境归纳不是TCGA主要最大限度,大部分结核病症多种类型适应环境双曲线与过去评核相同适应环境三站的脱离研究成果基本明确,GBM、OV(2008, 2011)和较差级别胶质刺毛(LGG)(2015)的TCGA结果就是比较好由此可知证。PFI、DFI和DSS的K-M双曲线见由此可知1C–1E。

由此可知1 B-E确诊原始数据归纳

基于每种结核病症多种类型4个三站的注意到星期计算平均随访星期及血案或体检的中所位星期(此表2)。所有的中所位随访星期为22.1个年底,但相异多种类型结核病症该星期关联极大;GBM和急病症态髓系白血病症(LAML)最短约12个年底,而肾嫌色肝细胞恶性肿瘤(KICH)仅有约48个年底。

此表2 总体中所位随访星期及4个三站的血案与注意到中所位星期

提拔选用的确诊结果三站

确诊结果三站为了让取决于研究成果最大限度、血案生产量、配置文件微小和结果原始数据质量。将这些作法和开发的其它作法用上为对单个传染病症原始在线的的测试和足量体检,证明了在每种传染病症多种类型中所选用每个结果三站的建言及缘故(此表3)。每种结核病症多种类型的适应环境三站才可要至少通过一个主要的测试和足量体检才被接受。33种恶性肿瘤中所的13种选用全部4个三站:输尿管尿路上皮恶性肿瘤(BLCA)、宫颈点状肝细胞恶性肿瘤(CESC)、结肠恶性肿瘤(COAD)、食管恶性肿瘤(ESCA)、头颈部点状肝细胞恶性肿瘤(HNSC)、肾状肝细胞恶性肿瘤(KIRP)、肺部腺恶性肿瘤(LUAD)、LUSC、OV、乳腺恶性肿瘤(PAAD)、肉刺毛(SARC)、大肠腺恶性肿瘤(STAD)和子宫内膜恶性肿瘤(UCEC)。相反,不会一个三站的有嗜铬肝细胞刺毛和副上皮细胞刺毛(PCPG)。淋巴弥漫大B肝细胞淋巴刺毛(DLBC)、LAML和背腺刺毛(THYM)均一个三站;剩余结核病症多种类型2或3个三站,但其中所一些应以保留建言。最可靠的是PFI,可无保留地提拔给除LAML(无原始数据)、DLBC和KICH(谨慎选用)和PCPG(不提拔)内外的4种。

此表3 三站OS,PFI,DFI及DSS的评核与提拔选用

检验TCGA-CDR及犯罪行为归纳作法

在乳腺恶性肿瘤研究成果中所,雌二醇ER阴病症态病症患者确诊适应环境期生存率比ER+病症患者差。分别用OS、PFI、DFI和DSS相比较这两类病症患者的适应环境期(由此可知3A–3D;双曲线累计于10年随访星期,但选用整个原始在线进行时归纳)。单考量归纳显示,选用PFI(p= 0.005)和DFI(p = 0.001)用上为确诊三站,TCGA中所ER+乳腺恶性肿瘤病症患者比ER-病症患者有格内外好的适应环境期,但选用OS时两类病症患者间不存有关联(p = 0.097) 。此内外,两类病症患者的DSS(p = 0.009)有突出关联,此断定DSS的潜在价值。以上辨认出得出结论了PFI和DFI是特定多种类型乳腺恶性肿瘤化学键研究成果的合适三站。

由此可知3 检验和归纳作法举由此可知来说

此内外还检验了来袭病症态GBM适应环境结果三站。TCGA中所GBM中所位OS为12.6个年底,介于此先前报导的常规治疗法的12.1个年底和常规治疗法联合行动替莫唑胺的14.6个年底相互间。中所位PFI是6.1个年底,介于此先前报导的常规治疗法5个年底和常规治疗法联合行动替莫唑胺的6.9个年底相互间。显然,TCGA原始在线OS和PFI血案星期与历史文献明确。其后印证OS和PFI用上为GBM化学键研究成果的确诊三站效度。

用Cox比重几率重生断言未能确定高期(III、IV期)比起较差期(I、II期)结核病症病症患者的几率比(HR),检验4个三站的TCGA-CDR原始数据。由于DFI定义与其它结果的定义不明确,对提拔选用OS、PFI和DSS的14种多种类型结核病症相比较logHR(此表3)。随后均对满足Cox比重几率断言的传染病症进行时统计数据(由此可知3E–3G)。结果此断定,14种多种类型结核病症中所,除间皮刺毛(MESO)、PAAD和葡萄膜黑色素刺毛(UVM)内外,高期对相比较差期HR在3个提拔三站OS、PFI及DSS上明显很低。选用配对采样的Wilcoxon秩和检验,当选用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测定时,logHR有突出关联,显示传染病症成果和适应环境三站在HR上存有系统误差;OS与DSS相互间不会突出关联(p = 0.106)。对2个logHR值的常规误进行时逆加权平均未能确定Pearson系统性系数, 由logHR估算的3种结果有极突出亦然系统性:PFI和OS系统性系数0.96(95%均值[CI]:0.77–0.99),PFI和DSS为 0.95(95%均值:0.76–0.99),OS和DSS为0.90(95%均值:0.61–0.98)。这些系统性病症态潜在反对确诊20世纪用PFI,初用OS和DSS做三站。

除了整合化学键原始数据,还先前归纳首次治疗法后人言童与非人言童否注意到相异的新血案。TCGA-CDR中所29类结核病症电子邮件用于妥善解决该疑虑,纳入病症患者从确诊到收尾首治并超过人言状态至少存活3个年底。以LUSC为由此可知,有289由此可知人言童和41由此可知长期非人言童,NTE率分作21.8%和68.2%。用Cox比重几率重生断言,辨认出在非人言童中所NTE几率突出大于人言童(HR = 6.68,95% CI = 4.25–10.51,FDR修改q值<0.05)。在另内外21种结核病症多种类型中所也有类似结果(此表4)。悉数7种中所不会注意到到这些关联。我们也在评核否每个断言都满足比重几率断言,其中所有两个不符合,才可要研究成果星期依靠及多变量断言来四处寻找缘故。

此表4 非人言与人言童NTE拓展对比

TCGA从世界病症态数百个条线路得来病症症,为妥善解决确诊原始数据相异条线路间的可比病症态,才可顾虑原始数据零碎病症态、和病症患者特质等。对每种传染病症而言,我们对比了先前两名提供病症症数最多的民间组织来源条线路(TSS)与所有其它TSS的同种传染病症及4个结果三站(此表5)。

此表5 对来自先前两位TSS的每个结核病症多种类型研究成果结果进行时相比较

对于GBM等极具来袭病症态的,先前两位TSS(#1和#2)的大肠癌者群与其它TSS相比类似的有OS、PFI和DSS,因血案太少难以归纳不提拔DFI做三站。BRCA等较较差来袭病症态,短时间内提拔选用PFI和DFI,但建言谨慎用OS或DSS评核。TSS #1的确诊原始数据激发不太好的OS和DSS,但不会注意到到PFI关联;另内外,此表面上TSS#1有格内外好的DFI结果,均注意到3由此可知 DFI血案。这种此表里不一的情况此断定该条线路的结果原始数据才可再进一步评核。另一方面,TSS #2的4个三站结果与其它之内外明确。

这个简单的结果相比较此断定,当从特定结果归纳整体TCGA的确诊原始数据时,才可要顾虑TSS的实际电子邮件。由于年龄组、分期/分级制度及治疗法等考量影响相异TSS病症重者群的三站结果,TSS可以用上为这些和不全然确诊批注等其它未能测定关联的替代。

潜在的群集考量、竞争结果的

几率及断言断言

对确诊适应环境三站归纳来说,建言选用所管控的全部确诊原始数据。但相比化学键/序列原始数据的整合归纳,要注意两个方面。首先,提拔建言基于基线适应环境断言,以化学键流感病症毒用上分析生物体划分采样集,有可能会破坏结果统计数据的突出病症态关联。因此,从互系统性联的TCGA化学键原始数据或流感病症毒TCGA-CDR结果原始数据中所得出的结论才可在脱离的原始在线中所再进一步得出结论。

第二,我们建言均选用原发的化学键原始数据,因为病症患者初诊时,不可忽视星期电子邮件等匹配的确诊原始数据已得来比起零碎。面部黑色素刺毛(SKCM)在TCGA多种类型中所相比较类似于,470由此可知中所均103由此可知原发,其余296由此可知为原发全局支气管重新分配,68由此可知用户端重新分配。这与仅仅得来到重新分配刺毛的其它TCGA结核病症多种类型形成鲜明对比。SKCM重新分配刺毛仅仅带有匹配的原发,而其它TCGA结核病症多种类型尽管仅仅有重新分配刺毛,但都带有匹配的原发采样。因此,对于SKCM结果的系统性病症态,建言只选用受限制生产量的原大肠癌症,尽管SCKM支气管重新分配的III期病症症可用上为脱离两大进行时研究成果。

在选用新整合的TCGA-CDR原始在线时,还才可要注意:潜在误解考量、竞争结果的几率及断言断言。

群集考量

群集考量存有但被排除在断言之内外时,误差可能会远超过或较差估真实。如在乳腺恶性肿瘤的种族主义关联研究成果中所,英裔与有色人种病症患者相互间存有不可忽视的基因此表达关联,然而根据化学键流感病症毒进行时修改后,这种关联突出缩减甚至消失。治果也是潜在的群集考量,当电子邮件可换取时应适当顾虑修改。治疗法未能知时,年龄组、诊治医务人员及确诊年份等常规治疗法用上为替代电子邮件能缩减部分误差。对这方面的决策仿真,倡导选用标志物生存率研究成果建言报告(REMARK)。

竞争结果的几率

测定DSS、DFI和PFI三站时,要对不会经历不可忽视血案且人言的致死病症患者进行时审查。在这种只能,如果断言病症患者不会其它死因,那她/他最终仍可能会死于结核病症指征。然而,在估算治疗法等分析生物体对继大肠癌态结核病症或糖尿病症等非净资产结核病症致死几率的分析能力时,该断言这不不对。

断言断言

归纳作法Cox比重几率(PH)断言需体检PH断言。除少数犯罪行为内外,大大部分断言都满足Cox PH断言,但才可再进一步探寻这些个案以找出违背断言的缘故,从而对HR特别强调格内外准确的估算。尽管并未能为清扫原始数据和妥善应对付出了巨大坚应以不懈,但仍存有不可忽视的选用受限制,访问TCGA确诊原始数据都需了解这些受限制。

首先,TCGA主要是为化学键研究成果的设计,在此之后病症症为了让来自多个机构带有合适剩余民间组织的未能治疗法原大肠癌症,因此这些病症症不构成连续病症态。此内外,对于每种相异多种类型/研究成果,随访原始数据不会分立得来。同时,确诊原始数据得来的一些规则在过去迫使随着星期的推移而发生变化。TCGA - CDR不系统性联结核病症治疗法史,并非所有病症症都被批注。因此,归纳特定多种类型或流感病症毒的治疗法文化背景强于统计数据病症态独派恶性肿瘤归纳。当病症患者进行时实际治疗法时,受益能用DFI和PFI三站有效率归纳。

其次,TCGA采样确诊随访根据当地诊所的星期此表,可能会为传染病症或特定部位的罹患和病症者不可忽视生命状态的历史记录,因此不会TCGA登录的确诊随访计划,均证明了建设项目主要强调的化学键特质。

最后,依然所有TCGA取得的采样和序列及化学键原始数据来自新诊病症患者原发的单个切开,由此激发的序列和化学键原始数据不能在紧致或星期任何方面明确捕获代此表人另一病症患者结果变量的异质病症态。该疑虑不是TCGA独特的,任何快照原大肠癌态研究成果都存有。

概述

这项工用上是有史以来第一次全盘全盘性管控TCGA独派恶性肿瘤确诊详细资料。由此激发的TCGA-CDR的结果三站与脱离非TCGA研究成果结果明确,说明该森林资源在空先前覆盖面的确诊尺度上提供了生物观测新视角。也要察觉到TCGA-CDR的内在选用局限病症态及关键病症态范本和提拔建言。并未能相比较明了,进化传染病症将来大覆盖面的化学键研究成果需全盘性得来确诊病症理、治疗法和撤消血案原始数据,以坚应以最高常规的确诊研究成果。尽管有其局限病症态,TCGA-CDR提供了常规化原始在线,以及完整的4个确诊结果三站导出,并妥善解决了质量疑虑,从而在独派恶性肿瘤和个体水平上进行时转化研究成果。将来原始数据研究成果的融合将减少结果相互间的可比病症态,格内外好地理解和反对减法。

参考详细资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
六经期食疗方 补气养血呵护女性肥胖症
录入: 第一章:六经期饱疗方 补气养血珍爱未婚卫生 第二章:月经不调须要补五脏 牛奶饱休养五脏调经期 第三章:经期饮品能避免“13禁” 管住嘴...[详细]
2022-05-05
溢液是就让
时是,如果为内侧溢液,则似乎是生理特质或全身特质病1变,如胎儿刚生于时,从母体血中带来的雌激素水平较高,在生于后的1~2周内可以有更少量的...[详细]
2022-05-04
女性肾虚的呕吐有哪些 12个女性肾虚表现(7)
迟于不调是异性恋肺虚的发挥吗迟于不调在很多人或许就是迟于推迟、迟于月内以及迟于量的变化上消失了不情况下反常,很多异性恋都并不认为这是异...[详细]
2022-05-03
患上植物神经所致是什么原因
植物神经缺失的性疾病状是什么?与思维需注意激动相密切联系的思维需注意疲累平庸为暗喻回忆增多,脑力劳动率急剧下降,耐力虚弱,疲累人心等。...[详细]
2022-05-02
一名确有的母亲节,看后百味杂陈
出乎意料的我就大意了近期工作排班,外祖母节这天自己正好下加班。无论如何计划案好,要是加班不是很忙,深夜后就出门想想外祖母,正好中午的时...[详细]
2022-05-02
女性痛经要如何缓解?别再只会那句“多饮用热水”了
痛经这种常见的妇科不适症状的起因,会导致男人朋友在妊娠此后或者是经期前后,出现极其引人注意的下头部痉挛性疼痛、腰酸以及下腹坠胀不适等显...[详细]
2022-04-28
赵宇昊讲出子宫肌瘤要怎么调理
赵宇昊任教表示子宫肌瘤主要是发生在子宫内部的一种癌症。此病会给患者带来月经肥胖、不和谐以及不孕不育的伤痛,虽然子宫肌瘤是一种良性,但是...[详细]
2022-04-27
例假量少的原因 这些原因引致月经量变少(2)
排卵量多于吃什么好 排卵量多于的男同适度恋应多吃含铁量丰富和滋补效果更佳的糖类,如牛奶、奶、豆浆、菠菜、乌骨鸡、羊猪、鱼子、食肉动物肌...[详细]
2022-04-26
骨头坏死 这种病怎么了?
骨股头坏死是现代人容易患的疾病。现代人在业余时间拿着手机和电脑,不注意锻炼,所以身体素质很差。那么骨股头坏死是什么病呢?什么是高危人群...[详细]
2022-04-25
  • 地区医院
  • 医院联盟