总体 Population:根据研究目的所确定的同质观察单位的全体 样本 Sample:从总体中随机抽取部分观察单位,其实测值的集合。
参数 (parameter):由总体计算出来的量,刻画了总体特征,如总体均数、总体标准差; 统计量 (statistics) :由样本计算出来的量,反映了样本的特征,如样本均数、样本标准差; 概率描述了随机事件发生的可能性的大小。
同质(homogeneity):指同一总体中个体的性质、影响条件或背景相同或非常相近。
变异(variation):在自然状态下,个体间测量结果的差异称为变异。 变量Variable:可以测量的任何特征或属性(不同个体结果可能不同),能表现观察单位变异性的某种特征
随机变量random variable:在概率论中称变量为随机变量。指取值事先不能确定的结果。从理论上讲,每个随机变量的取值服从特定的概率分布。
定量变量Quantitative variable:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。
定性变量Qualitative variable:定性方法得到的,通常将观察单位按某种属性或类别分组,不同的属性或类别 即定性变量。
定量资料(Quantitative data):定量资料是以数字形式表现出来的研究资料。
定性资料(Qualitative Data): 定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。 频率(frequency):在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率。当试验重复很多次时P(A)= m/n。 概率Probability:描述了随机事件发生的可能性的大小。0≤P ≤1
频数(frequency):在一批样本中,相同情形出现的次数称该情形的频数。
小概率事件(little Probability event):医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 小概率原理(little Probability theory) :小概率事件并不表示不可能发生,但在某一次试验中该事件发生的可能性很小,可视为很可能不发生。
参数估计estimation of parameter:指用样本指标值(统计量)估计总体指标值(参数)。 假设检验hypothesis Testing:由样本的差异推断总体之间是否可能存在的差异
统计推断(statistical inference):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断
中位数(median):根据观察值从小到大顺序排列后,位于中间位置的数。 极差(range):亦称全距,即最大值与最小值之差
百分位数(percentile , Px): 它表示一组观察值按升序排列,并等分为100等份,位居第x%位置的数。其中,中位数M=P50
四分位数间距(inter-quartile range):是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 标准差(standard deviation):描述正态分布的定量变量的离散程度的指标
变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。 频率型指标(proportion)也称比率或构成比 ,表示指某现象发生的频率,或某事物内部各组成部分所占的比重或分布。
强度型指标(intensity)表示单位时间内某现象发生的频率。多用于随访资料。
相对比型指标(ratio)指两个有关联的指标A与B之比 ,简称比。A和B可以性质相同,也可以性质不同。 标准化死亡比(standard mortality ratio SMR)被标化组实际死亡数与预期死亡数之比.。若SMR>1,表示被标化人群的死亡率高于标准组;反之,若SMR<1,表示被标化人群的死亡率低于标准组。 统计表(statistical table) :用表格方式表达事物数量关系的工具。
统计图(statistical chart):将统计数值或统计指标用图形的方式表达,是用点、线、面积等几何图形表达事物数量关系的工具。
二项分布Binomial Distribution:在总体率为 的总体中随机抽样,抽取样本含量为n的样本中,有X例为阳性的概率: P ( X ) C nX X ( 1 ) n X 称X服从二项分布,记为X~B(n,) 正态分布(normal distribution):概率论中最重要的一种分布,也是自然界最常见的一种分布。该分布由两个参数平均值和方差决定。概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。 正态曲线:其形状为一条高峰位于中央,两侧逐渐下降并完全对称的曲线,曲线两端永远不与横轴相交的钟型曲线 。 Poisson分布Poisson Distribution:描述单位时间、单位空间内罕见事件发生次数。
抽样误差sampling error:由于总体中个体变异的存在,在抽样过程中产生的样本统计量与总体参数间的差异以及样本统计量与样本统计量间的差异。
标准误(standard error) 样本统计量(均数或率)的标准差称为标准误. 它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
检验水准size of a test:在假设检验中,称预先规定的小概率值为检验水准,也称为显著性水准,用 表示。实际为拒绝H0的概率有多大。
检验效能power of test:1-β称为检验效能,它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。
置信区间(confidence interva l, CI):按(1-a)的概率或置信度,估计总体参数所在范围,称作置信度为(1-a )的置信区间。 参考值范围:绝大多数人某项指标的数值范围。
I类错误type I error:拒绝了实际上成立的H0,这种“弃真”的错误称I类错误。 II类错误:不拒绝实际上不成立的H0,这种“存伪”的错误称II类错误。
完全随机设计 completely randomized design:是将同质的受试对象随即的分配到各处理组,再观察其实验效应.
随机区组设计(randomized block design) : 是把条件相同(或相近)的几个受试对象配成一组(叫一个区组),然后把这一组随机分配,分别接受不同处理的设计。
单因素方差分析one-way ANOVA 只分析处理组间有无差别,以说明研究因素对结果有无影响的均数间比较的假设检验方法。
两因素方差分析(two-way ANOVA ) 既分析各处理组间有无差别,又同时分析各配伍组间有无差别,以说明研究因素和配伍因素有无影响的均数间比较的检验方法。
参数统计(parametric statistics)对总体分布类型已知的资料,用相应的统计量来对参数进行推断的统计方法。 非参数统计(nonparametric statistics) 对总体分布类型不确定,或总体分布不满足要求的条件,只用样本资料推断总体分布是否相同的统计方法
直线相关分析(linear correlation analysis) :研究两变量间有无相关、相关方向及密切 程度的方法和过程 直线相关Linear correlation :指两定量变量的数量变化在散点图上呈直线趋势的相互关系 相关系数r(correlation coefficient):是表示两变量有无相关、方向、密切程度的指标
秩相关分析(Spearman秩相关)rank correlation analysis: 研究两非正态分布(或未知分布、等级)变量有无相关、方向、密切程度的分析方法。
直线回归:又称简单回归(simple regression),或者称简单线性回归。
当一变量随另一变量有规律的依存变化时,此依存变化的数量关系称直线回归关系,简称(直线)回归。 回归系数b(regression coefficient):即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。(当x每变动一个单位时,y相应平均变动的数量。 )
直线回归分析(linear regression analysis): 根据实测值建立回归方程式(在图上绘一条最接近各实测点的直线),描述其两变量的数量变化关系的方法过程
因篇幅问题不能全部显示,请点此查看更多更全内容