薛老师的统计博客

EDC是否需要双录入

今天会上有人提问，专家们也给出了回答。这里只谈下我的看法。从理论上讲，数据录入的双录入方式，通过最后的一致性核验，来发现录入错误从而保证录入的质量，也即录入后的数据与“数据源”的一致性。很显然，无论是 ...

2014/08/08 26454 0 0

临床试验数据管理中SDV

DetailSource Data Validataion (SDV)-----------------------------Document - Documentation of Informed ...

2014/06/18 25786 0 0

SAS查找数据集中重复值的3种方法

第一种方法：利用sort过程步的dupout和nodupkey，原始的test数据集将输出为_unique和_dups两个数据集。 proc sort data = test out=_uniq ...

2014/06/09 19347 0 1

[Revised] GCDMP中文版提供开放下载了

2020/03/16 更新：目前官网已经取消了此文件的下载。因为他们正在“修订”GCDMP，已经完成修订的章节，可在[这里免费下载][https://scdm.org/gcdmp/]。------20 ...

2020/07/14 16379 4 0

临床研究与临床试验的区别与联系

临床研究：clinical study临床试验：clinical trial就临床研究与临床试验而言，在书面的使用上其实区分并不明显，在英文中常是混用的。比如ICH的GCP(E6)中，就使用：Clin ...

2018/12/03 15915 0 2

使用plotmath在R的plot中写公式

plotmath中的表达式及其对应的公式如图：例： formula = expression(italic(Prob) == bgroup("(",atop(n, x),")")%*%p[1]^x%* ...

2014/05/26 15288 0 0

哪种EDC系统更好用

会上某位同仁提出的问题。这其实是一个没有答案的问题。因为没有一个客观的标准，可以评价一个EDC系统是否“好用”。我接触的EDC并不多，国外的，OC用过，inform进入系统粗略了解过，Rave看过它的 ...

2014/08/08 15185 0 0

FDA数据提交标准-SAS仍是赢家

开放数据标准[CDISC][1]，作为FDA注册数据提交的标准之一，在国内受到越来越多人的追捧。然而，想要摆脱SAS目前来看几乎不可能：如下图所示：FDA明确要求，按照CDISC标准生成的数据集，需要 ...

2017/07/26 10843 0 0

无限总体与有限总体

Finite versus Infinite Populations----------------------------------从概念上，无限总体指总体中的个体数是无限的，当然没有绝对的无限， ...

2017/02/28 10612 0 0

从美国CDC网站下载NHANES数据并进行整合

为了制作一个方差分析相关的课件，去美国CDC网站下载了几个数据集并进行了整合。过程很简单，记录如下：因为要用到糖化血红蛋白检测结果以及人种、年龄、是否糖尿病患者等数据，所以要下载3个数据集：先进入站点 ...

2022/04/29 10495 0 1

SPSS与SAS的比较

搞统计分析的人估计都能说出几条关于SPSS和SAS的区别。之前主要用SAS，对于SPSS，总的感觉就是界面操作，软件体积不大，安装也简单。当然，SPSS完全可以编程使用。在内部算法上，SPSS与S ...

2014/04/13 9770 0 0

从检验效能角度说说统计推断下结论的方式

对于数据的正态性检验，方差齐性检验，还有重复测量方差分析中的球形性检验，如果P>0.05，则我们就认为满足正态性、方差齐性和球形性假定（也就是接受了H0），但是，为什么进行差异性检验，P>0.05时我 ...

2022/05/01 9665 0 0

临床试验数据质量的评价

这是今天CDMC学组会议的主要讨论内容。过程“非常热闹”，所以多少有点影响效率。不过，整个过程还是收获不小，毕竟在场的有国内临床试验的监管者，也有不少行业的先行者和大腕专家。其实评价临床试验的数据质量 ...

2014/08/10 8229 0 0

今天聊聊数据的分布

对任何数据的统计分析，都是从统计描述开始的。而数据的分布情况，是统计描述最基本最核心的内容。什么是数据的分布统计上的分布，与位置（location）和频数（frequency）有关；在一个坐标系中， ...

2022/04/17 8109 0 0

非劣效临床试验的样本量计算, 检验水准α到底选择0.05还是0.025

这个问题本来也没什么可说的，因为将近10年前，导师执笔的专家共识中已经明确：2016年FDA发布的指南当中也有相关的描述，和上述论文中给出的实践标准一致。可是近些年有一些其他作者，也包括一些国外的SC ...

2024/03/06 7646 0 0

为什么是Fisher精确概率法而不是卡方的连续性校正？

前几天一医生朋友给我发信息，他的文章（SCI）编辑问为什么有的地方用卡方，有的地方却用的Fisher的方法。（估计也不是什么太大牌的杂志，否则不会问出这个问题）统计内容我帮他做的，自然也要帮人帮到底， ...

2018/12/03 7542 0 0

实验室检查的名称要编码吗？

首先，根据我的了解，目前没有这样的编码系统。其次，编码的目的是什么？当然是标准化。标准化之后，可以准确地识别这些信息。而实验室检查的名称是否有必要标准化？个人觉得必要性不大，毕竟现在临床上所做的检查， ...

2014/08/08 7253 0 0

win10最新版SAS 9.4启动期间未能附加至 Java的错误已经修复

在Win10升级到最新版后，SAS 9.4 在启动时出现以下错误信息： ERROR: The Java child process terminated unexpectedly: status ...

2017/07/04 6826 0 0

区组随机化-区组长度的考虑

通俗、简单地归纳如下：1. 区组长度一般是偶数（因为成组设计，1:1的设计最常见），6-10之间；2. 当然也可以是奇数，如果试验设计为两组2:1，那么区组长度应是3的倍数，所以也可以是9这样的奇数， ...

2020/05/18 6698 0 1

轻松搞定SPSS输出三线表

下载这个文件：https://www.trialstats.com/society/old/uploads/2017/10/453166332.rar文件解压后，把文件3linestable.stt放 ...

2017/10/22 6465 0 0

统计推断的实质与内涵

任何抽样研究，抽样误差都是不可避免的。当我们抽取了一个样本，如何知道这个样本的特征，就一定是总体特征的真实反映，而不是由于抽样误差导致的假象呢？比如：正常的新生儿，体重平均是6斤半，某医生收集了35例 ...

2022/03/29 6111 0 4

样本量计算的目的与基本过程

样本量计算的目的：在一定检验效能（把握度）基础上，确定研究的最小规模。计算过程 # 1、明确假设（1）明确研究设计类型，如完全随机、配对或随机区组设计；（2）确定研究的主要终点指标，也就是拿研究结 ...

2024/05/14 5720 0 3

如何高效地设计出良好的CRF

CRF（病例报告表）作为临床试验/研究中，收集数据的载体（可能是纸质或电子化的），重要性不言而喻。良好设计的CRF可以使数据收集工作事半功倍，同时也有助于统计分析工作的顺利完成。一份设计良好的CRF， ...

2019/06/14 5491 0 0

多中心临床试验的定义与理解

Wiki百科给出的多中心临床试验的定义非常简单[1]：A multicenter research trial is a clinical trial conducted at more than o ...

2019/06/21 5208 0 0

SAS报表输出效率 WPS vs WORD

自动生成1000个表格并填充数据，WPS用了35分钟，生成的doc文件将近9M，打开文档进行操作，相当卡顿。同样的代码，用word生成，只要10分钟，生成的doc文件700多k，打开文档进行操作，相比 ...

2014/10/07 5165 0 0

为什么使用Fisher确切概率法而不是卡方检验

Fisher's exact test is a statistical significance test used in the analysis of contingency tables. A ...

2022/03/11 5158 0 4

按照样本量计算结果实施研究，一定会达成研究目的吗

即使严格按照样本量计算结果确定研究规模，实施的结果也未必是达成目的。也就是样本量计算结果的可靠性，它取决于以下几个影响因素：1、在计算样本量时，所选择的把握度（Power = 1 - β ）越大（当然 ...

2024/08/21 4889 0 0

重复测量的数据，一定要使用重复测量分析方法？冒失了

当我们在研究中，遇到重复测量的数据，是否一定要使用重复测量的统计方法呢？答案当然是不一定。对于重复测量的数据，是否需要使用重复测量的统计方法，要根据研究实际和检验目的来确定，以两个降糖药（T vs C ...

2024/08/05 4817 0 0

研究中关于统计学处理的一般描述(通用模板)

参加研究生的中期考评，发现很多人对研究中的统计学内容，表述不清，甚至错误。下面给出一个统计学处理的“通用模板”，在需要时进行适当的修改，就可以放到研究方案或者论文中了。统计学处理：1、统计软件SPSS ...

2019/07/01 4778 0 0