統(tǒng)計數(shù)據(jù)
目錄
1.什么是統(tǒng)計數(shù)據(jù)[1]
統(tǒng)計數(shù)據(jù)是統(tǒng)計工作活動過程中所取得的反映國民經(jīng)濟和社會現(xiàn)象的數(shù)字資料以及與之相聯(lián)系的其他資料的總稱。統(tǒng)計研究客觀事物的數(shù)量方面,離不開統(tǒng)計數(shù)據(jù),統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象進行計量的結(jié)果。
2.統(tǒng)計數(shù)據(jù)的類型
統(tǒng)計數(shù)據(jù)是采用某種計量尺度對事物進行計量的結(jié)果,采用不同的計量尺度會得到不同類型的統(tǒng)計數(shù)據(jù)。從上述四種計量尺度計量的結(jié)果來看,可以將統(tǒng)計數(shù)據(jù)分為以下四種類型:
- 定類數(shù)據(jù)——表現(xiàn)為類別,但不區(qū)分順序,是由定類尺度計量形成的。
- 定序數(shù)據(jù)——表現(xiàn)為類別,但有順序,是由定序尺度計量形成的。
- 定距數(shù)據(jù)——表現(xiàn)為數(shù)值,可進行加、減運算,是由定距尺度計量形成的。
- 定比數(shù)據(jù)——表現(xiàn)為數(shù)值,可進行加、減、乘、除運算,是由定比尺度計量形成的。
前兩類數(shù)據(jù)說明的是事物的品質(zhì)特征,不能用數(shù)據(jù)表示,其結(jié)果均表現(xiàn)為類別,也稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)(Oualitative data);后兩類數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,能夠用數(shù)值來表現(xiàn),因此也稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)(Quantitative data)。由于定距尺度和定比尺度屬于同一測度層次,所以可以把后兩種數(shù)據(jù)看作是同一類數(shù)據(jù),統(tǒng)稱為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù)。
區(qū)分測量的層次和數(shù)據(jù)的類型是十分重要的,因為對不同類型的數(shù)據(jù)將采用不同的統(tǒng)計方法來處理和分析。比如,對定類數(shù)據(jù),通常計算出各組的頻數(shù)或頻率,計算其眾數(shù)和異眾比率,進行列聯(lián)表分析和x2檢驗等;對定序數(shù)據(jù),可以計算其中位數(shù)和四分位差,計算等級相關(guān)系數(shù)等非參數(shù)分析;對定距或定比數(shù)據(jù)還可以用更多的統(tǒng)計方法進行處理,如計算各種統(tǒng)計量、進行參數(shù)估計和檢驗等。我們所處理的大多為數(shù)量數(shù)據(jù)。
這里需要特別指出的是,適用于低層次測量數(shù)據(jù)的統(tǒng)計方法,也適用于較高層次的測量數(shù)據(jù),因為后者具有前者的數(shù)學特性。比如:在描述數(shù)據(jù)的集中趨勢時,對定類數(shù)據(jù)通常是計算眾數(shù),對定序數(shù)據(jù)通常是計算中位數(shù),但對定距和定比數(shù)據(jù)同樣也可以計算眾數(shù)和中位數(shù)。反之,適用于高層次測量數(shù)據(jù)的統(tǒng)計方法,則不能用于較低層次的測量數(shù)據(jù),因為低層次數(shù)據(jù)不具有高層次測量數(shù)據(jù)的數(shù)學特性。比如,對于定距和定比數(shù)據(jù)可以計算平均數(shù),但對于定類數(shù)據(jù)和定序數(shù)據(jù)則不能計算平均數(shù)。理解這一點,對于選擇統(tǒng)計分析方法是十分有用的。
3.統(tǒng)計數(shù)據(jù)的計量尺度
對統(tǒng)計數(shù)據(jù)的屬性、特征進行分類、標示和計算,稱為統(tǒng)計計量或統(tǒng)計量度。例如,對工業(yè)企業(yè)經(jīng)濟效益的統(tǒng)計,對居民生活水平的統(tǒng)計,也可以說是對工業(yè)企業(yè)經(jīng)濟效益的計量,對居民生活水平的計量,如此等等。由于客觀事物有的比較簡單,有的比較復雜,有的特征和屬性是可見的(如人的外貌體征),有的則是不可見的(如人的偏好和信仰),有的表現(xiàn)為數(shù)量差異,有的表現(xiàn)為品質(zhì)差異。因此,統(tǒng)計計量也就有定性計量和定量計量的區(qū)別,并且可分不同的層次。美國社會學家、統(tǒng)計學家史蒂文斯(S.S.Stevens)1968年按照變量的性質(zhì)和數(shù)學運算的功能特點,將統(tǒng)計計量劃分為四個層次或四種計量尺度:
1、定類尺度
將數(shù)字作為現(xiàn)象總體中不同類別或不同組別的代碼,這是最低層次的尺度。在這種情況下,不同的數(shù)字僅表示不同類(組)別的品質(zhì)差別,而不表示它們之間量的順序或量的大小。定類尺度的主要數(shù)學特征是“=”或 “≠”。
例如將國民經(jīng)濟按其經(jīng)濟類型,可以分為國有經(jīng)濟、集體經(jīng)濟、私營經(jīng)濟、個體經(jīng)濟等類,并用(01)代碼表示國有經(jīng)濟,(02)表示集體經(jīng)濟,(03)表示私營經(jīng)濟,(04)表示個體經(jīng)濟。并且用(011)代表國有經(jīng)濟中的國有企業(yè),(012)代表國有聯(lián)營企業(yè);用(021)表示集體經(jīng)濟中集體企業(yè),(022)表示集體聯(lián)營企業(yè);用(031)表示私營經(jīng)濟中的私營獨資企業(yè),(032)表示私人合伙企業(yè),(033)表示私營有限責任公司;用(041)表示個體經(jīng)濟中的個體工商戶,(042)表示個人合伙等等。其中兩位代碼表示經(jīng)濟大類,而三位代碼則表示各類中的構(gòu)成。不同代碼反映同一水平的各類(組)別,并不反映其大小順序。各類中雖然可以計算它的單位數(shù),但不能反映第一類的一個單位可以相當于第二類的幾個單位等等。
2、定序尺度
定序尺度不但可以用數(shù)表示量的不同類(組)別,而且也反映量的大小順序關(guān)系,從而可以列出各單位、各類(組)的次序。定序尺度的主要數(shù)學特征是“>”或“<”。在統(tǒng)計的變量數(shù)列中可以確定其中位數(shù)、分位數(shù)等指標的位置。
例如對合格產(chǎn)品按其性能和好壞,分成優(yōu)等品、一等品、合格品等等。這種尺度雖然也不能表明一個單位一等品等于幾個單位二等品,但卻明確表示一等品性能高于二等品,而二等品性能又高于三等品等等。定序尺度除了用于分類(組)外,在變量數(shù)列分析中還可以確定中位數(shù)、四分位數(shù)、眾數(shù)等指標的位置。
3、定距尺度
定距尺度也稱間隔尺度,是對事物類別或次序之間間距的計量,它通常使用自然或度量衡單位作為計量尺度。定距尺度是比定序尺度高一層次的計量尺度。它不僅能將事物區(qū)分為不同類型并進行排序,而且可以準確地指出類別之間的差距是多少。定距尺度的主要數(shù)學特征是“+”或“-”。定距尺度在統(tǒng)計數(shù)據(jù)中,占據(jù)重要的低位,統(tǒng)計中的#REDIRECT總量指標就是運用定距尺度為計量尺度的。
例如,學生某門課程的考分,可以從高到低分類排序,形成90分、80分、70分,直到零分的序列。它們不僅有明確的高低之分,而且可以計算差距,90分比80分高10分,比70分高20分等等。定距尺度的計量結(jié)果表現(xiàn)為數(shù)值,可以進行加或減的運算,但卻不能進行乘或除的運算,其原因是在等級序列中沒有固定的、有確定意義的“零”位。例如,學生甲得分90分,學生乙得0分,可以說甲比乙多得90分,卻不能說甲的成績是乙的90倍或無窮大。因為“0”分在這里不是一個絕對的標準,并不意味著乙學生毫無知識。恰如我們不能說40℃比20℃暖和2倍一樣。沒有確定的標準的“零”位,但有基本的確定的測量單位,如學生成績的測量單位是1分,質(zhì)量價差的測量單位量1元,溫度的測量單位是1℃等等,這是定距尺度的顯著特點。
4、定比尺度
定比尺度是在定距尺度的基礎(chǔ)上,確定可以作為比較的基數(shù),將兩種相關(guān)的數(shù)加以對比,而形成新的相對數(shù),用以反映現(xiàn)象的構(gòu)成、比重、速度、密度等數(shù)量關(guān)系。由于它是在比較基數(shù)上形成的尺度,所以能夠顯示更加深刻的意義。定比尺度的主要數(shù)學特征是“÷”或“×”。在統(tǒng)計的對比分析中,廣泛地運用定比尺度進行計量。
例如將某地區(qū)人口數(shù)和土地面積對比計算人口密度指標,說明人口相對的密集程度。甲地區(qū)人口可能比乙地區(qū)多,但甲地區(qū)的土地更廣闊,用人口密度指標就可以說明相對說來甲地區(qū)人口不是多了,而是少了。又如將一個國家(地區(qū))的國內(nèi)生產(chǎn)總值與該國(地區(qū))居民對比。計算人均國內(nèi)生產(chǎn)總值,可以反映國家(地區(qū))的綜合經(jīng)濟能力。1998年我國國內(nèi)生產(chǎn)總值約占世界生產(chǎn)總值的12%,排列世界第七位,堪稱世界經(jīng)濟大國,但我國人口占世界總?cè)丝诘?1.2%,如果按人均國內(nèi)生產(chǎn)總值計算,在世界各國中又居于比較落后的位次,說明我國仍屬于發(fā)展中國家。
上述四種計量尺度對事物的計量層次是由低級到高級、由粗略到精確逐步遞進的。高層次的計量尺度具有低層次計量尺度的全部特性,但不能反過來。顯然,我們可以很容易地將高層次計量尺度的測量結(jié)果轉(zhuǎn)化為低層次計量尺度的測量結(jié)果,比如將考試成績的百分制轉(zhuǎn)化為五等級分制。在統(tǒng)計分析中,一般要求測量的層次越高越好,因為高層次的計量尺度包含更多的數(shù)學特性,所運用的統(tǒng)計分析方法越多,分析時也就越方便,因此應(yīng)盡可能使用高層次的計量尺度。
4.統(tǒng)計數(shù)據(jù)的表現(xiàn)形式
統(tǒng)計數(shù)據(jù)通常表現(xiàn)為:絕對數(shù),相對數(shù),平均數(shù)。
5.統(tǒng)計數(shù)據(jù)的質(zhì)量
統(tǒng)計數(shù)據(jù)質(zhì)量是一個具有豐富內(nèi)涵的綜合性概念。具體來說,它包括統(tǒng)計數(shù)據(jù)的內(nèi)容質(zhì)量、表述質(zhì)量及約束標準這三大方面。
(一)統(tǒng)計數(shù)據(jù)的內(nèi)容質(zhì)量
統(tǒng)計數(shù)據(jù)的內(nèi)容質(zhì)量是統(tǒng)計數(shù)據(jù)最基本的特征,它包括相關(guān)性、準確性與及時性。一旦缺少了其中任何一個,統(tǒng)計數(shù)據(jù)就失去了轉(zhuǎn)化為信息的性質(zhì)和基本作用。因此,這三個特征也可稱為統(tǒng)計數(shù)據(jù)質(zhì)量的主要特征。
1、相關(guān)性
相關(guān)性是指統(tǒng)計機構(gòu)所生產(chǎn)的數(shù)據(jù)是否正是用戶感興趣的統(tǒng)計數(shù)據(jù)。統(tǒng)計數(shù)據(jù)的相關(guān)性反映了它滿足用戶需求的程度,它與所提供的可利用數(shù)據(jù)是否關(guān)注了對用戶來說最重要的主題有關(guān)。由于對相關(guān)性的評價是主觀的,會隨用戶需求目標的改變而改變,所以統(tǒng)計機構(gòu)所要做的是平衡不同用戶的互相矛盾的需求目標,在給定的資源條件限制下,盡可能的滿足大部分用戶的大部分需求。
2、準確性
準確性指觀測值或估計值與未知的真值之間的距離(接近程度),通常用統(tǒng)計誤差來衡量。它是統(tǒng)計數(shù)據(jù)質(zhì)量的基礎(chǔ)和核心內(nèi)容,也是傳統(tǒng)的“統(tǒng)計數(shù)據(jù)質(zhì)量”概念所考慮的主要問題。一般來講,誤差分為系統(tǒng)誤差和隨機誤差兩部分,有時也用引起不準確性的主要潛在原因(如抽樣誤差、無回答誤差等)來分類描述。完全準確的測量經(jīng)常受到成本的限制,有時甚至是不可能的。所以關(guān)鍵的是誤差是否已降低到用戶可以接受的地步。
3、及時性
與用戶需求相關(guān)的準確的統(tǒng)計數(shù)據(jù)如果沒有在用戶做出決策之前傳遞給用戶,那么該數(shù)據(jù)對用戶來說,是沒有用的。所以,及時性也是統(tǒng)計數(shù)據(jù)能否滿足用戶需求的重要特征。如果該現(xiàn)象本身變化比較迅速,則對該類統(tǒng)計數(shù)據(jù)的及時性要求高;如果該現(xiàn)象本身變化比較緩慢,則對及時性要求不高。
(二)統(tǒng)計數(shù)據(jù)的表述質(zhì)量
對統(tǒng)計數(shù)據(jù)質(zhì)量來說,僅考慮其內(nèi)容方面的質(zhì)量是不夠的。統(tǒng)計數(shù)據(jù)需要表述,特別是將某個統(tǒng)計數(shù)據(jù)同其他相關(guān)統(tǒng)計數(shù)據(jù)相互聯(lián)系地加以表述時,要考慮表述的質(zhì)量問題。比如單個數(shù)據(jù)的內(nèi)容是正確的,但表述不清晰、不充分,就會影響整套數(shù)據(jù)的質(zhì)量,甚至引起誤解。所以,統(tǒng)計數(shù)據(jù)質(zhì)量必須考慮其表述質(zhì)量。統(tǒng)計數(shù)據(jù)的表述質(zhì)量包括可比性、可銜接性和可理解性。
1、可比性
可比性是指同一項目的統(tǒng)計數(shù)據(jù)在時間上和空間上的可比程度。這要求統(tǒng)計的概念和方法在時間上保持相對穩(wěn)定,在不同地區(qū)使用統(tǒng)一的統(tǒng)計制度方法和分類標準,保持統(tǒng)計數(shù)據(jù)的口徑范圍、計算方法在時間上一致銜接,在地區(qū)之間可比。
2、可銜接性
可銜接性是指同一統(tǒng)計機構(gòu)內(nèi)部不同統(tǒng)計調(diào)查項目之間、不同機構(gòu)之間以及與國際組織之間統(tǒng)計數(shù)據(jù)的銜接程度。這要求全國范圍內(nèi)所有專業(yè)統(tǒng)計項目在統(tǒng)一的統(tǒng)計框架體系、分類標準下,按統(tǒng)一的方法編制統(tǒng)計數(shù)據(jù),在統(tǒng)計調(diào)查和數(shù)據(jù)加工整理中使用統(tǒng)一的方法和程序,同時采用國際統(tǒng)計標準,如聯(lián)合國1993年SNA的框架體系等。
3、可理解性
可理解性是指統(tǒng)計數(shù)據(jù)便于用戶正確理解并使用的程度。統(tǒng)計數(shù)據(jù)是提供給用戶使用的,如果某些用戶不能理解,看不懂統(tǒng)計數(shù)據(jù)和統(tǒng)計分析報告,當然也就談不上使用數(shù)據(jù)。為了恰如其分地使用從統(tǒng)計機構(gòu)那里得到的統(tǒng)計數(shù)據(jù),用戶必須了解他們所獲得數(shù)據(jù)的性質(zhì)。這就要求統(tǒng)計機構(gòu)在提供統(tǒng)計數(shù)據(jù)的同時附帶提供對數(shù)據(jù)的補充說明,如提供隱含在有關(guān)概念下面的說明、已使用的分類法、數(shù)據(jù)收集和加工過程中所使用的方法以及統(tǒng)計機構(gòu)自身對數(shù)據(jù)質(zhì)量的評價。
(三)統(tǒng)計數(shù)據(jù)的約束標準
在實現(xiàn)統(tǒng)計數(shù)據(jù)目標的過程中,除了注意統(tǒng)計數(shù)據(jù)的內(nèi)容質(zhì)量和表述質(zhì)量這兩方面外,還必須注意以下兩項具有普遍意義的約束標準,這也體現(xiàn)了統(tǒng)計數(shù)據(jù)的質(zhì)量特征。
1、可取得性
可取得性是指用戶從統(tǒng)計部門取得統(tǒng)計數(shù)據(jù)的便利程度。對于有用的統(tǒng)計數(shù)據(jù),用戶必然要考慮:能得到哪些數(shù)據(jù),如何得到這些數(shù)據(jù)。因此,統(tǒng)計數(shù)據(jù)必須以一種用戶能夠使用(搜尋方便)而且能夠負擔的形式提供給用戶。這要求提供統(tǒng)計數(shù)據(jù)時,必須列明用戶從統(tǒng)計機構(gòu)可以取得的統(tǒng)計數(shù)據(jù)內(nèi)容,同時要應(yīng)用先進便捷的統(tǒng)計數(shù)據(jù)服務(wù)方式,使用戶取得數(shù)據(jù)更為便利。
2、有效性
有效性是指統(tǒng)計數(shù)據(jù)的利用所產(chǎn)生的效益要大于提供該數(shù)據(jù)的成本。如果情況相反,則提供這種數(shù)據(jù)對提供方和使用方來說都是不值得的。雖然目前統(tǒng)計數(shù)據(jù)的效益和成本特別是前者不容易準確地計量,但是,保持這樣一種基本的指導思想是十分必要的。這要求在統(tǒng)計數(shù)據(jù)的其他質(zhì)量不受大的影響的前提下,盡可能降低統(tǒng)計數(shù)據(jù)的生產(chǎn)費用,提高效率。