一、同質(zhì)與變異
嚴格地講,同質(zhì)(homogeneity)是指被研究指標的影響因素相同。但在醫(yī)學(xué)研究中有些影響因素往往是難以控制的、甚至是未知的、如遺傳、營養(yǎng)等。因此,在實際工作中只有相對的同質(zhì),即可以把同質(zhì)理解為影響被研究指標較大的、可以控制的主要因素盡可能相同。例如研究兒童的身高,則要求影響身高這一指標較大的、易控制的因素如性別、年齡、民族、地區(qū)要相同,而不能控制的因素像遺傳、營養(yǎng)等影響因素可以略去。同質(zhì)基礎(chǔ)上的各觀察單位(亦稱為個體)之間的差異為變異(variation)。如同性別、同年齡、同民族、同地區(qū)兒童的身高有高有低,稱為身高的變異。
二、總體與樣本
總體(population)是根據(jù)研究目的而確定的同質(zhì)的個體之全部。確切地說,是性質(zhì)相同的所有觀察單位某一變量值的集合。例如研究某地1993年健康成年男性的身高(cm),則該地1993年全部健康成年男子的身高構(gòu)成一個總體。該總體只包括有限個觀察單位,稱為有限總體。有時總體是設(shè)想的中是抽象的,例如研究用某藥治療冠心病患者的療效,其總體的同質(zhì)基礎(chǔ)是同用該藥治療的冠心病患者,而總體為設(shè)想用該藥治療的所有冠心病患者的治療結(jié)果,這里沒有確定的時間和空間范圍的限制,因而觀察單位數(shù)無限,稱為無限總體。
實際工作中,經(jīng)常是從總體中隨機抽取一定數(shù)量的個體,作為樣本(sample),用樣本信息來推斷總體特征。從總體中抽取部分個體的過程稱為抽樣。抽樣必須遵循隨機化原則,即要使總體中每一個體有同等的機會被抽取*,這樣的樣本對總體有較好的代表性,能根據(jù)其統(tǒng)計量推斷總體特征。
三、抽樣誤差(sampling error)
由于總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小,用樣本推斷總體的精確度愈高;反之,其精確度愈低。由于生物的個體變異是客觀存在的,因而抽樣誤差是不可避免的,但抽樣誤差有一定的規(guī)律性,以后將討論和應(yīng)用這種規(guī)律性。
四、概率(probability)
概率是反映某一事件發(fā)生的可能性大小的量。常用符號P表示,范圍在0與1之間。P≤0.05和P≤0.01分別表示事件發(fā)生的可能性等于或小于0.05和等于或小于0.01。習(xí)慣上把P≤0.05或P≤0.01的事件稱為小概率事件,表示某事件發(fā)生的可能性很小。