详谈|临床试验数据库XPT格式

2022
11/24

+
分享
评论
法迈新媒体
A-
A+

今天我们就来好好探讨下XPT

在2020年5月6日CDE发布《药物临床试验数据递交指导原则(征求意见稿)》

意见稿中明确规定:申报资料中的数据集通常采用XPT格式,一个XPT文件对应一个数据集,数据集名称需要和XPT的文件名保持一致,其文件后缀名统一为.xpt。例如不良事件数据集(Adverse Event, AE)ae.xpt,合并用药数据集(Concomitant Medication, CM)cm.xpt等。建议采用SAS数据传输格式第5版本(SAS Transport Format V5,简称XPT V5)或以上版本作为数据递交格式。申办方应确保所递交的数据集在不同物理环境都不存在乱码的情形。

今天我们就来好好探讨XPT:

1、什么是XPT?

XPT 是SAS 公司设计的兼容其它电脑系统额数据传输格式;用来导出SAS数据集到其它软件或应用平台,也被叫作SAS XPORT 文件。美国FDA(Food and Drug Administration)在SAS 5版本的时候(目前普遍使用SAS 9.4版本),要求在NDA(New Drug Application)项目中提交的数据库应为SAS XPORT传输格式(即xpt格式)。

2、2017年6月1日前提交给审评中心的数据库状况?

2017年6月1日前提交给审评中心的数据库有多种数据传输格式,包括Excel(.xls或者.xlsx)、Access(.mdb或者. accdb)、SAS(.xpt或.sas7bdat)、SQL(.seq)、XML(.xml)、TXT(.txt)、CSV(.csv)等多种格式。数据传输有多种格式给神评工作带来极大的麻烦!

3、XPT传输格式的要求?

· SAS Version 5 transport (XPT)files

· Filename must have “.xpt”extension

· Created with PROC COPY w/XPORT engine, not PROC CPORT

· No compression of transportfiles

· One logical dataset pertransport file

· Transport file and the datasethave the same name

· Split if XPT file  >1GB

· All datasets should havelabels

· All dataset variables shouldhave labels

· Dataset/Variable Length

Name of Variable length is lessthan or equal to 8

Length of Variable is less thanor equal to200

Variable label is less than orequal to 40

Name of Dataset length is lessthan or equal to 8

Dataset label is less than orequal to 40

· Dataset names and labels mustbe unique across full set of data tabulation and analysis datasets

· Variable and dataset namesshould not contain punctuation, dashes, spaces, or other non-alphanumericsymbols.

· Variable and dataset labelscan include punctuation characters. However, special characters should not beprovided, such as,

1. Unbalanced apostrophe, e.g.,Parkinson's.

2. Unbalanced single and double quotationmarks.

3. Unbalanced parentheses, braces orbrackets, e.g., ‘(‘, ‘{‘and ‘[‘.

4. ‘<’ less-than sign and ‘>’greater-than sign.

4、怎么将不是.xpt的数据转为.xpt的数据?

小编认为分两步走:

第一步:将不是.xpt的数据转为.sas7bdat的数据;

第二步:将.sas7bdat的数据转为.xpt的数据;

5、转.XPT的工作量由哪些?

将不是.xpt的数据转为.sas7bdat的数据,要保证数据在转的过程中,准确无误;

根据前文中提到的“XPT传输格式的要求”,检查每一个数据集以及每一个变量的属性是否符合上述要求。将不符合要求的数据集和变量进行处理,以便达到上述要求。转XPT的工作量取决于不符合要求的数据集和变量的个数;

提供数据从非.XPT的传输格式到.XPT的传输格式的变化的说明文档;例如那些数据集的长度大于8个字节,之前的名字是什么,转之后的名字是什么等;

整理相应的变量说明文件

6、将.sas7bdat的数据转为.xpt的数据的核心代码:

libname xptout xport "xxxPath.\xxx.xpt";

proc copy in=xxx out=xptout ;select xxx;quit;  

欢迎关注法迈新媒体

更多,更及时的干货内容,请加我们的微信公众号:法迈医讯,诚邀业内人士及机构向我们投稿。投稿邮箱:bellama@pharmanews.cn 

法迈医讯作为法迈新媒体矩阵之一, 法迈新媒体是国内一家面向制药行业供应链综合服务平台,致力于服务全球制药行业从业人员。以创新的互网+模式服务于行业用户,形成以“资源整合知识共享”为核心,微信公众号矩阵、社群矩阵为分支的新媒体模式,力争打造国内活跃和具影响力的专业化平台 !

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
数据库,XPT,数据集,SAS,新媒体,格式,临床,试验,矩阵

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • 医生交流群 加入
  • 医院运营群 加入
  • 医技交流群 加入
  • 护士交流群 加入
  • 大健康行业交流群 加入

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!