關燈 巨大 直達底部
親,雙擊螢幕即可自動滾動
第1部分

沒有接觸過統計,也能很好地掌握其中的思想。

回到國內,最近幾年,關於“平均工資”的討論十分熱烈。早在2004年,廣州市人大代表就曾對廣州市政府工作報告中的“全市職工平均工資為28237元”提出了質疑,他們指出在平時接觸的市民中,普遍反映年工資收入基本達不到這個水平,有的甚至相距甚遠。在今年召開的全國兩會上,有全國代表明確指出:“看職工工資不能只看平均數,還要關注那些平均線以下的人群。”那麼,我們是不是不該使用平均工資?其實,關鍵的問題並不在平均數這個統計指標上,而在於人們如何理解並正確地使用這個統計指標。

處理海量資料的常用方法是計算平均數,以瞭解一組資料的平均水平。平均數的計算首先遇到的問題是這組資料的範圍是什麼?用統計術語來說,就是統計的口徑是什麼?例如,廣州市統計局對“全市職工平均工資為28237元”統計口徑的解釋是:“職工統計中有七類人員沒有列入範圍,而這部分人正屬於收入較低的群體。如鄉鎮企業從業人員,私營企業從業人員,城鎮個體勞動者,離休、退休、退職人員,再就業的離、退休人員,民辦教師以及其他按有關規定不列入職工統計範圍的人員。”對統計口徑的說明能夠一定程度上解決市民關於平均工資過高的疑慮。

接下來,第二個問題是計算中採用了哪種平均數?平均數有不同的種類,最常見的有3種:均值、中位數和眾數。關於這3種平均數的概念、計算和分析,Darrell Huff在第二章給出了十分詳細的解釋和相當精彩的案例,我就不羅嗦了。我們平常所說的平均工資基本上都是均值,即所有人的收入相加除以人數。均值具有計算簡單,易於理解的特點,但是它也有自身不足之處:當資料的分佈呈現正偏態時,均值往往偏離一般水平,並且高於一般水平。雖然人人都夢想良田萬頃、豪宅林立,但是達成此夢想的人畢竟是少數,因此就收入而言,往往高收入的人比例偏少,而中低收入的人比例很高,收入分佈是典型的正偏態分佈,這樣一來,平均工資偏高就十分正常了。

為了避免平均數引起誤解,提供更多的資訊是較好的辦法。例如,在給出平均數的同時羅列出收入的頻數分佈,即給出不同收入區間的職工比例,從而對職工收入情況有更全面的瞭解。又例如,在給出平均數的同時給出各組的組平均數,可以是不同行業職工的平均收入,可以是不同職位職工(管理層和職員層)的平均收入。再例如,在給出平均數的同時羅列出最低收入,以及享受最低收入職工的比例。

以上平均工資僅僅只是經濟領域的一個例子。生活中我們還可能接觸到各種各樣的資料,雖然不是每個人都需要練就火眼金睛,或者武裝到牙齒,成為資料打假的鬥士,但是掌握書中的工具,至少不會輕易地受到“全國牙防所”的###。

培根曾經說過:“如果一個人以種種肯定的立論開始,他必將終止於各種懷疑;但如果他願意抱著懷疑的態度開始,那麼他必將獲得肯定的結論。” 我想對資料的判斷和接收也是如此。

《How to Lie with Statistics》可以有多種譯法。可直譯為《如何利用統計撒謊》,這樣基本體現了本文前9章的行文風格。但是為了更加貼近讀者,承續文中活潑的文風,經過與出版社的商議,此版翻譯將書名確定為《統計數字會撒謊》。書中,中國城市出版社的編輯為該書的出版和插畫做了大量辛勤的工作,在此表示誠摯的謝意。

在我看來《How to Lie with Statistics》是一個“一顧傾人城,再顧傾人國”的###美人,而我這個譯者,有點像化妝師,雖然水平不高,辜負了美人的姿色,但是好在美人自身的底子很好,化妝後的效果雖然不能讓人###,但我已經竭盡所能,希望她是個“第二眼美女”。敬請各位專家、讀者手下留情,不要拍磚。剩下的嘛,當然是希望讀者朋友們能夠“抱得美人歸”了。

txt電子書分享平臺

推薦語:

有3種謊言:謊言、糟糕透頂的謊言和統計資料。

——英國前首相本傑明?迪斯雷利(Disraeli)

對於追求效率的公民而言,統計思維總有一天會和讀寫能力一樣必要。

——美國著名科幻作家H?G?威爾斯()

使我們陷入麻煩的通常並非我們不知道的事情,而是那些我們知道得不確切的事情。

——美國作家阿蒂