1人,如果調查全部牧師,轉變信仰的總人數應該約為370000人。
我們這種粗糙的方法產生了一個十分可疑的資料,但是它至少與那個在全國範圍釋出的資料一樣“可靠”,而後者卻是前者的11倍,是的,300萬看上去更加令人歡欣鼓舞些。
內在有偏的樣本(2)
至於奧斯勒先生充滿自信的那句話“考慮到誤差”,好吧,如果他發現了一種方法足以彌補未知量所帶來的誤差,那麼整個統計界都將會為之感激涕零。
在上述背景下,讓我們來研究一則以前的新聞報道:“1924級的耶魯畢業生平均年收入為25111美元”,要知道幾年前的錢是更值錢的。
好傢伙,他們幹得真不賴!
可是,等一等,這個令人印象深刻的數字到底意味著什麼?是否像表面看到的那樣,足以證明如果你把你的男孩送進耶魯大學,或者牛津大學,那麼在年老時,你就不需要辛苦地上班,甚至他將來年老時也不用上班?
在充滿懷疑的驚鴻一瞥後,關於該數字的兩個疑點凸現出來:它驚人的精確;它大得令人難以置信。
對一群相隔千山萬水的人,瞭解他們的平均收入,而且竟然精確到以元為單位,這幾乎不太可能。就算是自己去年的收入,除非全部來自薪水,否則也很難知道得如此準確。但是對於年收入25000美元的階層來說,投資渠道更廣,因此他們的收入不可能完全來自於薪水。
而且毫無疑問,這個可愛的平均數出自耶魯人之口。即使1924年他們在紐海文譯者注:紐海文是美國東北部康涅狄格州的一個城市,耶魯大學就坐落在這個城市。接受過優良的教育,也很難保證四分之一個世紀後,他們還能堅持說真話。當問及收入時,有些人出於虛榮或者天生樂觀而誇大資料;有些人卻故意縮小數字,特別當涉及徵所得稅問題時,往往會猶豫不決,生怕與其他檔案填報的資料不符,誰知道稅務員又看到了什麼?這兩種趨勢——誇大與縮小,也許將相互抵消,但這種可能性很小。一般而言,一種趨勢總會強於另一種,但我們很難猜測哪種趨勢將勝出。
我們試著來解釋這個數字,單憑常識就知道這個數字與現實出入很大。現在,讓我們找找最大誤差的可能來源。是什麼使那些實際上收入也許只有25111美元一半的人們最終會擁有如此豐厚的平均收入?讓我們來揭開這神秘的面紗。
可以肯定的是:耶魯畢業生的報道基於對某個樣本的分析,因為常識告訴我們,沒有人能夠掌握所有仍在世的1924級學生的情況,25年後,他們中的許多人已經消失在茫茫人海中。
並且,在那些能夠取得聯絡的人中,許多人根本不會回答問卷,特別是一個涉及###的問卷。一般情況下,郵寄問卷的回收率達到5%~10%就已經相當可觀了。也許這個調查的回收率會高些,但也不可能達到100%。
因此,這個收入資料建立在一個樣本之上:由能夠取得聯絡並願意回答問卷的耶魯學生組成。那麼,這個樣本的代表性強嗎?也就是說,能否假設樣本與未被樣本包括的那些人——無法聯絡的人或者不願意回答的人——具有同等的收入水平?
那些在耶魯大學畢業生通訊錄上被註明“地址不詳”的迷路小羊羔是誰呢?他們是高收入階層嗎?華爾街的金融家、公司領導層,亦或是製造企業或公用事業的總裁?不,要找到富人的地址根本不難。這個班級最顯赫的人,即使忽略了與校友辦公室聯絡,他們的地址也可以透過查《美國名人錄》(Who�s Who in America)或其他參考資料找到。因此,我們可以較合理地推測,那些被遺漏的人在獲取耶魯文學學士以後的25年間,他們沒能實現自己光輝夢想,他們是小職員、技工、流浪漢、失業的酒鬼、僅僅得以餬口的作家或藝術家……將六七個甚至更多這種人的收入相加才可能達到25111美元。他們不會在班級的聯誼會上註冊,僅僅是因為他們支付不起路費。 txt小說上傳分享
內在有偏的樣本(3)
又是誰會將調查問卷丟進最近的廢紙簍?我們不太肯定,但是猜想他們中大部分人並沒有賺到足以炫耀的數目。他們的心態有些類似於第一次拿到工資的小職員,當他發現工資支票上粘著一張小紙條,建議保密工資並不要將工資作為與同事的談資時,“別擔心,”他對老闆說,“我與你一樣,對這麼低的工資感到羞愧。”
很明顯,樣本遺漏了可能降低平均收入的兩類人。讓我們見識