SDTM submission

来源:互联网 发布:sql查询平均分大于80 编辑:程序博客网 时间:2024/05/12 16:55

Metadata Submission Guidelines: Section 5.5.1.3

Split domains 不是Findings domain特有的, 但是Findings domain由于占的空间过大,有时会被分离成若干的子数据集。 关于Splitting domains的规则在SDTMIG Section 4.1.1.7中有提及。 在提交示例中,相关domain根据QSCAT储存的问卷名称,被分离成3个子数据集。分离QS domain的目的仅在于方便展示其内容。示例的目的是说明如何分离domain,而不是说明分离domain的原理。 变量DOMAIN的值对于所有分离的子数据集都是“QS";但是,子数据集 名称是独立的,并以QS为前缀(QSCG,QSCS,QSMM)。 注释CRF中使用domain名称QS,这与子数据集名称相反。


如果决定分离提交的数据集,推荐sponsor与审阅部进行交流,讨论关于应当包含在提交材料中的内容,即只提交分离的数据集,还是分离数据集和未分离数据集都提交。


SDTM IG 3.2 - Section 4.1.1.7 Splitting Domains

Sponsor可以选择将某个domain按照相关信息分离成子数据集。对于这种情况的处理通常有两种方法:

1)对于基于一般观测类的domain,根据--CAT(必须非空)的值来分离。

2)FA domain可以根据--CAT的值或者--OBJ中与parent domain相关的值来分离。


必须遵守以下规则,从而保证分离的数据集可以再合成回整体的数据集:

1)DOMAIN变量的值必须一致,即其不能被分离(如QS,FA)。

2)所有需要domain前缀的变量(--TESTCD,--LOC)必须使用DOMAIN的值作为前缀(如QS,FA)。

3)在同一个USUBJID内,在所有分离的子数据集中,--SEQ必须是唯一的。(译注: 如同一个USUBJID在QSXX和QSYY各50条, 那么QSXX.QSSEQ可以是1-50, QSYY.QSSEQ可以是51-100, QSXX和QSYY中的QSSEQ不能有交集, 如有交集,Pinnical21会报Error)。

4)当关系类数据集(如SUPPxx, FAxx, CO, RELREC)关联回分离的parent doamin时,IDVAR一般应当原则使用--SEQ。当IDVAR是除--SEQ之外的值时(--GRPID,--REFID,--SPID), 应当注意所以分离domain中的IDVAR的值是否是唯一的,以防关联到错误的domain。

5) 在某个分离domain中的Perm变量不必包含到所有split domain中。在SAS中set数据集时,不存在perm变量的分离domain中,相关的perm变量会自然设成空值。但是,当考虑到变量顺序时,需要注意:在使用SAS set语句时,如果一个perm变量没有被包含到第一个用来Set的数据集中,变量的顺序可能出现问题。

6)分离domain的名称长度最长可到4个字符。如,如果根据--CAT分离,那么数据集名称可以是domain名称加上两个附加字符(如 QS36对于SF-36)。如果关于parent domain分离FA domain,那么数据集名称可以是domain名称加上domain code(如FACM)。4个字符的数据集名称限制约需SUPP数据集关联到分离数据集。

7)分离domain的SUPP数据集也需要进行分离。命名规则是包含附加的1到2个字符来识别分离数据集(如SUPPQS36,SUPPFACM)。而SUPP数据集中的RDOMAIN变量的值仍为2字符domain code(如QS,FA)。

8)在RELREC中, 如果数据集之间的关联有对分离的FA domain定义,那么RDOMIAN可以包含4字符数据集名,如

9)参考SDTM Metadata Implementation Guide中关于define.xml中分离domain的处理。

示例




原创粉丝点击