SEER美国国立癌症研究所”监测流行病学和结果”数据库介绍

  • A+
所属分类:医信大学
  • 基本介绍
  • 美国国立癌症研究所“监测、流行病学和结果数据库”SEER是北美最具代表性的大型肿瘤登记注册数据库之一,收集了大量循证医学的相关数据,为临床医师的循证实践及临床医学研究提供了系统的证据支持和宝贵的第一手资料。 SEER数据库全名(Surveillance, Epidemiology, and End Results ),是美国权威的癌症统计数据库,该数据库记录了美国部分州县上百万名恶性肿瘤患者的发病率、死亡率和患病情况等信息。SEER数据库旨在降低美国人口的癌症负担,数据库中肿瘤信息通过SEERStat软件进行统一和规范,并定期更新发布。全球肿瘤研究者均通过申请获取部分数据,这为缺少临床科研数据的临床研究者提供了很好的数据来源。此外,SEER数据库样本量大,统计学效能强*,这使基于SEER数据库的研究具有较高的临床参考价值。
  • 数据内容:人口统计数据,患者ID, 个人信息,原发灶位置,肿瘤大小,肿瘤编码,治疗方案,死亡原因等信息。包括多种肿瘤,按消化系统划分。

数据库所涉及的肿瘤划分为9类:

乳腺、结肠  直肠、其他消化系统、女性生殖、淋巴 白血病、男性生殖、呼吸系统、泌尿系统及其他尚未确指的类型。

yr1973_2013.seer9:该目录保存了1973~2013期间由SEER第九登记站提交的部分州县的肿瘤研究数据。具体州县为:亚特兰大、康涅狄格、底特律、夏威夷、爱荷华、墨西哥、旧金山、弗朗西斯科、奥克兰、西雅图和犹他州普吉特海湾。

yr1992_2013.sj_la_rg_ak: 该目录保存了1992-2013期间部分州县的肿瘤研究数据。具体州县为:圣若泽、洛杉矶、蒙特雷、格鲁吉亚和阿拉斯加农村。

yr2000_2013.ca_ky_lo_nj_ga:该目录保存了2000-2013期间部分州县的肿瘤研究数据。具体州县为:大加利福尼亚、肯塔基、路易斯安那、新泽西和大格鲁吉亚。

yr2005.lo_2nd_half: 该目录保存了2005年期问路易斯安那州的肿瘤诊断情况。

SEER数据下载

SEER的数据构成
SEER研究数据主要由肿瘤发病率数据、人口数据及数据字典构成。


(1)最新的数据库1975-2016年期间肿瘤发病率研究数据(Incidence) 肿瘤发病率研究数据均按照国际疾病分类肿瘤学专辑第三版(International Classification of Diseases for Oncology Third Edition,ICD-O-3)来编码。
(2)人口数据分年龄段的统计情况(Populations) 人口数据的统计情况也遵循ICD-O-3标准来编码,并保存为TXT文本格式。按两种方法对人口数据进行分段统计。①以5年为一个年龄段跨度,共划分为19个年龄段组。②以一年为一个年龄段跨度,从0岁至100岁以上,共划分为101个年龄段组。
(3)数据字典(Data dictionaries) 所谓数据字典,可以看作是数据库中所有成分的定义和解释的文字集合,描述了数据库中每条记录所包含的属性意义和取值说明。因此,在数据字典中建立起严密一致的定义非常有助于用户对于数据库的理解和使用。
作为大型肿瘤登记数据库之一,SEER也具有一定的特殊性。
①病例数据的来源时间跨度长,地区跨度广,且数据来源多源化。因此需要数据字典对其记录字段的属性进行一致化和规范化。例如字典中包括患者的中心序列号、原发病灶部位、肿瘤尺寸、肿瘤等级、治疗方案以及死亡原因等字段属性。以“中心序列号”为例,它在北美癌症登记中心协会(NAACCR)的登记编号为380,字段长度为2。该属性描述了所有可报告的恶性肿瘤、良性肿瘤的数量及序列,这些都是可能贯穿于病人发病生涯的疾病信息。在病人的发病生涯中,该序列号可能会发生改变。比如某病人曾被检查出患有一种恶性肿瘤,后来又被检查出患有第二种恶性肿瘤,那么该病人的中心序列号可能会由001变成002。
②医学研究的进步使得人们对于癌症的认识也在不断修正,这也导致SEER在数据采集时考虑的因素要发生变化,以便对病例记录进行更精确地描述。


3 SEER数据库的应用
SEER主要发布了四类统计分析报告,为肿瘤研究人员提供了完整、权威的分析数据,便于研究者们对全美各个地区、各类人群中的肿瘤患者情况进行系统深入的研究,具有高度的研究参考价值。
癌症的国家年度报告提供了美国的癌症发病率和死亡率趋势,每年更新一次,由美国疾病控制和预防中心(CDC)、美国癌症协会(ACS)、美国国家癌症研究所(NCI)以及北美癌症登记中心协会(NAACCR)联合发布。居住在美国的亚裔及太平洋岛国人口的癌症发病率和死亡率情况报告该报告中,美国国家癌症研究所(NCI)及其合作部门的研究者们发布了居住在美国的亚裔与太平洋岛国人口的癌症发病率、死亡率及阶段分布情况。SEER癌症统计数据回顾是一份可在线获取的年度分析报告,包括大多数癌症发病率、死亡率和生存率的近期统计数据。报告按癌症的不同发病部位或类别加以划分,多以图表形式来呈现。
美国癌症统计数据(USCS)美联邦最全面的癌症发病率统计报告。这份报告统计了源自美国49个州、6个大都会地区及哥伦比亚特区的各登记处的癌症发病率情况,涵盖了全美99%的人口。而癌症死亡率情况更是来全美所有州县及哥伦比亚特区,覆盖了全美所有人口。该报告提供了必要的州县、人口、种族、民族和性别等信息,以便更好地开展全国范围内的癌症预防及控制工作。USCS由疾病控制与预防中心(CDC)、国立癌症研究所(NCI)及北美癌症中心注册协会(NAACCR)联合发布。该数据的年度报告描述了不同人群的癌症发病率和死亡率的变化趋势,为学者们提供了良好的研究基础。
国内外基于SEER数据库的一些应用SEER信息量庞大,收集的肿瘤病种繁多,为深入研究常见肿瘤提供了强有力的数据支撑。故有大量医学研究利用SEER所提供的数据来进行分析研究。

SEER的贡献及尚存不足
(1)作为现阶段美国大型肿瘤登记数据库之一,SEER收集了大量循证医学的相关数据,详细记录了就诊者的基本情况、原发病灶部位、肿瘤尺寸、治疗方案、随访情况及死亡原因等信息,为临床医师的循证实践及临床医学研究提供了系统的证据支持和宝贵的第一手资料,为降低全美及全世界的肿瘤发病率、提升人口生活质量做出了积极贡献。
(2)SEER也存在一些不足之处,主要体现在[2]:

①没有关于家族史、既往史、并发症及手术切缘状况、病理学资料的记载,没有局部复发情况的记录。

②在治疗方面的记录不完全.除了有手术及放疗的记录外,无辅助治疗、内分泌治疗、化疗、生物治疗等记录,缺少第一疗程的后续治疗相关记载。

③没有记载乳酸脱氢酶、淋巴结转移数目、全身疾病、血红蛋白水平等重要的预后因素。

  • HealthIT.CN小程序
  • 产学研医创新平台
  • weinxin
  • 健康数据
  • HealthIT公众号
  • weinxin
admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: