薛老师的统计博客

统计学是什么,需要我们自己探索...;这里是我日常工作的心得体会,主要是临床试验及相关的统计学内容.
StatX的头像

 EDC是否需要双录入

今天会上有人提问,专家们也给出了回答。这里只谈下我的看法。从理论上讲,数据录入的双录入方式,通过最后的一致性核验,来发现录入错误从而保证录入的质量,也即录入后的数据与“数据源”的一致性。很显然,无论是 ...

StatX的头像

 临床试验数据管理中SDV

DetailSource Data Validataion (SDV)-----------------------------Document - Documentation of Informed ...

StatX的头像

 SAS查找数据集中重复值的3种方法

第一种方法:利用sort过程步的dupout和nodupkey,原始的test数据集将输出为_unique和_dups两个数据集。 proc sort data = test out=_uniq ...

StatX的头像

 [Revised] GCDMP中文版提供开放下载了

2020/03/16 更新:目前官网已经取消了此文件的下载。因为他们正在“修订”GCDMP,已经完成修订的章节,可在[这里免费下载][https://scdm.org/gcdmp/]。------20 ...

StatX的头像

 使用plotmath在R的plot中写公式

plotmath中的表达式及其对应的公式如图:例: formula = expression(italic(Prob) == bgroup("(",atop(n, x),")")%*%p[1]^x%* ...

StatX的头像

 哪种EDC系统更好用

会上某位同仁提出的问题。这其实是一个没有答案的问题。因为没有一个客观的标准,可以评价一个EDC系统是否“好用”。我接触的EDC并不多,国外的,OC用过,inform进入系统粗略了解过,Rave看过它的 ...

StatX的头像

 临床研究与临床试验的区别与联系

临床研究:clinical study临床试验:clinical trial就临床研究与临床试验而言,在书面的使用上其实区分并不明显,在英文中常是混用的。比如ICH的GCP(E6)中,就使用:Clin ...

StatX的头像

 FDA数据提交标准-SAS仍是赢家

开放数据标准[CDISC][1],作为FDA注册数据提交的标准之一,在国内受到越来越多人的追捧。然而,想要摆脱SAS目前来看几乎不可能:如下图所示:FDA明确要求,按照CDISC标准生成的数据集,需要 ...

StatX的头像

 无限总体与有限总体

Finite versus Infinite Populations----------------------------------从概念上,无限总体指总体中的个体数是无限的,当然没有绝对的无限, ...

StatX的头像

 SPSS与SAS的比较

搞统计分析的人估计都能说出几条关于SPSS和SAS的区别。 之前主要用SAS,对于SPSS,总的感觉就是界面操作,软件体积不大,安装也简单。当然,SPSS完全可以编程使用。 在内部算法上,SPSS与S ...

StatX的头像

 临床试验数据质量的评价

这是今天CDMC学组会议的主要讨论内容。过程“非常热闹”,所以多少有点影响效率。不过,整个过程还是收获不小,毕竟在场的有国内临床试验的监管者,也有不少行业的先行者和大腕专家。其实评价临床试验的数据质量 ...

StatX的头像

 为什么是Fisher精确概率法而不是卡方的连续性校正?

前几天一医生朋友给我发信息,他的文章(SCI)编辑问为什么有的地方用卡方,有的地方却用的Fisher的方法。(估计也不是什么太大牌的杂志,否则不会问出这个问题)统计内容我帮他做的,自然也要帮人帮到底, ...

StatX的头像

 实验室检查的名称要编码吗?

首先,根据我的了解,目前没有这样的编码系统。其次,编码的目的是什么?当然是标准化。标准化之后,可以准确地识别这些信息。而实验室检查的名称是否有必要标准化?个人觉得必要性不大,毕竟现在临床上所做的检查, ...

StatX的头像

 从美国CDC网站下载NHANES数据并进行整合

为了制作一个方差分析相关的课件,去美国CDC网站下载了几个数据集并进行了整合。过程很简单,记录如下:因为要用到糖化血红蛋白检测结果以及人种、年龄、是否糖尿病患者等数据,所以要下载3个数据集:先进入站点 ...

StatX的头像

 从检验效能角度说说统计推断下结论的方式

对于数据的正态性检验,方差齐性检验,还有重复测量方差分析中的球形性检验,如果P>0.05,则我们就认为满足正态性、方差齐性和球形性假定(也就是接受了H0),但是,为什么进行差异性检验,P>0.05时我 ...

StatX的头像

 win10最新版SAS 9.4启动期间未能附加至 Java的错误已经修复

在Win10升级到最新版后,SAS 9.4 在启动时出现以下错误信息: ERROR: The Java child process terminated unexpectedly: status ...

StatX的头像

 轻松搞定SPSS输出三线表

下载这个文件:https://www.trialstats.com/society/old/uploads/2017/10/453166332.rar文件解压后,把文件3linestable.stt放 ...

StatX的头像

 区组随机化-区组长度的考虑

通俗、简单地归纳如下:1. 区组长度一般是偶数(因为成组设计,1:1的设计最常见),6-10之间;2. 当然也可以是奇数,如果试验设计为两组2:1,那么区组长度应是3的倍数,所以也可以是9这样的奇数, ...

StatX的头像

 今天聊聊数据的分布

对任何数据的统计分析,都是从统计描述开始的。而数据的分布情况,是统计描述最基本最核心的内容。 什么是数据的分布统计上的分布,与位置(location)和频数(frequency)有关;在一个坐标系中, ...

StatX的头像

 如何高效地设计出良好的CRF

CRF(病例报告表)作为临床试验/研究中,收集数据的载体(可能是纸质或电子化的),重要性不言而喻。良好设计的CRF可以使数据收集工作事半功倍,同时也有助于统计分析工作的顺利完成。一份设计良好的CRF, ...

StatX的头像

 SAS报表输出效率 WPS vs WORD

自动生成1000个表格并填充数据,WPS用了35分钟,生成的doc文件将近9M,打开文档进行操作,相当卡顿。同样的代码,用word生成,只要10分钟,生成的doc文件700多k,打开文档进行操作,相比 ...

StatX的头像

 研究中关于统计学处理的一般描述(通用模板)

参加研究生的中期考评,发现很多人对研究中的统计学内容,表述不清,甚至错误。下面给出一个统计学处理的“通用模板”,在需要时进行适当的修改,就可以放到研究方案或者论文中了。统计学处理:1、统计软件SPSS ...

StatX的头像

 多中心临床试验的定义与理解

Wiki百科给出的多中心临床试验的定义非常简单[1]:A multicenter research trial is a clinical trial conducted at more than o ...

StatX的头像

 2013统计学专业排名(美国,世界)

美国高校统计学(含生物统计学)专业的排名比较知名的是US News Best Graduate Schools排名,刚看了下好像仍是2010的排名,3年过去了,不知新排名会如何。20131023142 ...

StatX的头像

 为什么使用Fisher确切概率法而不是卡方检验

Fisher's exact test is a statistical significance test used in the analysis of contingency tables. A ...

StatX的头像

 SPSS SPO文件查看器

在SPSS 16及之后的版本,保存结果使用.spv格式,SPSS 15及之前的版本则为.spo。 虽然SPSS当前的版本已经25了,但这不并妨碍你有时会收到SPO文件。还好,SPSS提供了一个SPO文 ...

StatX的头像

 中国2020版GCP中研究者的定义与ICH无本质区别

新版GCP终于在2020年4月落地了。新版GCP原则上还是以ICH E6 R2为蓝本,并根据国内具体情况进行翻译与修订,最终成稿。我没参与GCP的修订,目前也没有认真去读一遍新版GCP,不过,关于新版 ...

Admin的头像

 相关分析和回归分析的区别?

网上很多文章,讲得过于复杂,甚至有些内容都是错的。这里简单概括下相关分析和回归分析的本质区别:相关分析的两个或多个变量之间,不需要因果关系(可以有也可以无,有的话也无需区分谁是“因”谁是“果”),而回 ...

StatX的头像

 2018美国高校统计专业排名(统计&生物统计)

|Rank | School Name | Address | Score||---- | -------------- | ------ | ----||#1 in Statistics | Sta ...

StatX的头像

 统计推断的实质与内涵

任何抽样研究,抽样误差都是不可避免的。当我们抽取了一个样本,如何知道这个样本的特征,就一定是总体特征的真实反映,而不是由于抽样误差导致的假象呢?比如:正常的新生儿,体重平均是6斤半,某医生收集了35例 ...