Posted on
今天介绍一个经典的肿瘤数据库-seer,它是北美最具代表性的大型肿瘤登记注册数据库之一,收集了大量循证医学的相关数宝贵的第一手资料。SEER数据的大规模数据优势是无可比拟的。大规模的病例数还可以减轻病理学诊断的少数或随机错误分类的影响。SEER依靠实验室的质量规范来最大程度地减少此类错误!

本文主要从数据库的详情、注册、数据下载方面详细解说SEER数据库有兴趣的一定要尝试一番~

一、SEER数据库简介

全称:Surveillance, Epidemiology, and End Results Program

网址:https://seer.cancer.gov/

1、数据信息

包括患者的注册编号、个人信息、原发病灶部位、肿瘤尺寸、肿瘤编码、治疗方案、死亡原因等。

2、数据范围

9大类肿瘤:乳腺、结肠&直肠、其他消化系统、女性生殖、淋巴&白血病、男性生殖、呼吸系统、泌尿系统及其它尚未确指的类型。

3、SEER研究概况

SEER的研究多数与临床相关。

二、SERR数据库注册

①下载SERR数据库的数据需要注册。

SEER Data & Software→Request the Data进入注册页面→填写注册信息(尽量真实填写)

②填写注册信息后接收确认邮件。

③打印、签署协议,并发送邮件/传真确认。

④邮件接收用户名和密码。

三、SERR数据库数据下载

1、SEER Data & Software→Access Options→ASCII text version of the data下载数据包。

2、输入你的用户名和密码即可下载。

链接后台数据库后,开始提取数据,

以Association of Medicaid Expansion With Insurance Coverage Among Children With Cancer. JAMA Pediatr 2020 Jun 01;1746(6) (IF: 13.946)为例子。

该文章的纳入排除标准如下:

在SEER*stat 软件软件中点击Selection, 选择Edit按钮,根据需要挑选患者资料,本例选择年龄为0-14岁、第一次诊断恶性肿瘤的,诊断时间为20071.1-2015.12.31,见下图。

点击Table, 选择需要导出的变量,如年龄,性别,种族等等,然后点击上方的闪电按钮输出病例列表,见下图:

软件运行,数据导出,如下图所示,

全选,复制,黏贴到excel表中。

使用 Excel清洗数据,进一步整理成矩阵格式,方便后续统计分析。

发表评论

邮箱地址不会被公开。 必填项已用*标注