Posted on

图片

Sample:其中编号01~09表示肿瘤,10~19表示正常对照。(区分正常和癌症样本的凭证)

Code

Definition

01

Primary Soild Tumor(原发性实体肿瘤)

02

Recurrent Soild Tumor(复发性实体肿瘤)

03

Primary Blood Derived Cancer -Peripheral Blood(原发性血源性-外周血)

04

Recurrent Blood Derived Cancer -Bone Blood(复发性血源性-骨髓)

05

Additional -New Primary

06

Metastatic(转移肿瘤)

07

Additional Metastatic

08

Human Tumor Original Cells(肿瘤原始细胞)

09

Primary Blood Derived Cancer -Bone Marrow(原发性血源性-骨髓)

10

Blood Derived Nomal

11

Soild Tissue Normal

01A:癌症组织

01B:福尔马林浸泡样本

02A:复发组织
06A:
转移组织

Analyte:分析的分子类型

Code

Definition

D

DNA

G

Whole Geneome Amplification (WGA) produced using GeneomePlex(Rubicon) DNA

H

mirVana RNA(Allprep DNA) produced by hybrid protocol

R

RNA

T

Total RNA

W

Whole Geneome Amplification (WGA) produced using Repli-G (Qiagen) DNA

X

Whole Geneome Amplification (WGA) produced using Repli-G X(Qiagen) DNA(2nd Reaction)

看一个例子:

TCGA-A6-6650-01A-11R-1774-07

TCGA 

 Project

所有TCGA样本名均以这个开头

A6 

Tissue source site

组织来源编码,如A6就表示来源于Christiana Healthcare中心的结肠癌组织

6650

Participant

参与者编号

01

Sample

编号01~09为癌症组织,10~19表示正常对照

A

Vial

在一系列患者组织中的顺序,绝大多数样本该位置编码都是A; 很少数的是B,表示福尔马林固定石蜡包埋组织,已被证明用于测序分析的效果不佳,所以不建议使用-01B的样本数据

11

Portion

Portion 同属于一个患者组织的不同部分的顺序编号,同一组织会分割为100-120mg的部分,分别使用

Analyte

分析的分子类型,对应RNA

1774

Plate

在一系列96孔板中的顺序,值大表示制板越晚

07

Center

测序或鉴定中心编码

对RNA数据来说,Analyte为R的优先级最好,其次是R和T,而对于DNA层面的分析来说,D的优先级最高。

如果Analyte相同,那就选择Portion和/或Plate值更大的。

3 Replies to “TCGA的样本命名(Barcode)详解”

  1. 大佬,我进行TIDE计算时,获得的文件里面的ID有TCGA-44-2656-01A和TCGA-44-2656-01B,这种情况下是不是可以直接删除01B这一行的数据,辛苦大佬解答

aXin进行回复 取消回复

邮箱地址不会被公开。 必填项已用*标注