第四二二章 暫當統(tǒng)計員
因為要照顧到小學教員們上課的時間,人口普查工作往往是傍晚才開始,研究所的監(jiān)察員們白天便有了大量的空閑時間,戴世光先生便跟陳達先生申請讓他們的幫忙統(tǒng)計組的籌備工作。
一九三四年,戴世光考取清華大學的留美公費生,研習“國情普查統(tǒng)計”門,即“人口、農(nóng)業(yè)、工業(yè)、商業(yè)等普查資料的統(tǒng)計整理方法、技術(shù)研究”,在留學之前,戴世光就曾經(jīng)拜訪過陳岱孫、陳達等前輩,聽取了許多有益的建議,為留學做了全面的準備,一九三五年,戴世光赴美留學。
戴世光先是在密歇根大學獲得了數(shù)理統(tǒng)計學碩士學位,接著進入哥倫比亞大學經(jīng)濟系研究院,獲得了經(jīng)濟統(tǒng)計學碩士學位。學業(yè)有成之后,為了提高實踐能力,戴世光以美國國情調(diào)查局作為實習之地,系統(tǒng)研究了人口普查和統(tǒng)計資料的整理方法與技術(shù)。之后他又去英、法、德三國的人口生命統(tǒng)計局調(diào)查和研究人口統(tǒng)計工作的整理方法,在這之后,戴世光去了印度,系統(tǒng)地學習了印度人口調(diào)查局所采用的人口資料的統(tǒng)計方法——“條紙法”。
因為擁有深厚的專業(yè)學養(yǎng)和充足的實踐經(jīng)驗,戴世光先生對這次人口普查的統(tǒng)計工作有自己的考量,他不但要根據(jù)普查數(shù)據(jù)統(tǒng)計出多維度的規(guī)律和面向,還試圖比較不同的人口普查統(tǒng)計方法在效率、準確性和費用等方面的差異,時下國際上比較流行的統(tǒng)計法有四種:“邊洞法”、“機器法”、“條紙法”和“劃記法”。
“邊洞法”是美國人新進發(fā)明的一種統(tǒng)計方法,需要人工和機器相配合,而“機器法”是荷萊里夫(hollerith)所發(fā)明,是英美兩國整理人口普查材料所采取的慣用方法,兩種統(tǒng)計方法效率都很高,但都需要借助所費不貲的機器設(shè)備,考慮到研究所的經(jīng)費有限,戴世光先生最終放棄了這兩種方法,而選擇了單純依賴人工的“劃記法”和“條紙法”。
“劃記法”是國內(nèi)各統(tǒng)計機關(guān)慣常采用的統(tǒng)計方法,如一九三五年的SD省鄒平縣的人口普查中就使用過。“劃記法”是就某一統(tǒng)計表把統(tǒng)計資料中對這個統(tǒng)計表式有關(guān)的項目加以分類計算而產(chǎn)生一個統(tǒng)計表,分類時由一人誦讀各種項目的符碼,負責劃記的人聽了就在表內(nèi)適當細胞中劃上一道,劃記法需要兩人配合,一人誦讀調(diào)查表中的某一項,另一個人用某種固定的方式記錄。簡單舉例的話,選舉中的“唱票寫正字”就是最簡單的“劃記法”,唱票人念出人名,計票人在相對應名字下方劃下一筆,一個“正”字恰好為五筆,方便最終的統(tǒng)計。當然在人口普查過程中使用的“劃記法”會相應復雜一些,但原理是一樣的。
“條紙法”雖然并不為國人所熟知,距今已有將近七十年的歷史,“條紙法”是馬雅爾(georgvonmayer)發(fā)明的,1871年為巴伐利亞(bavarian)所首先采用,隨后被印度廣泛應用。在荷萊里夫(hollerith)機器法沒有被采用之前,美國馬薩諸塞州也曾用“條紙法”來整理人口資料。
戴世光了解到,在此之前,江蘇句容的農(nóng)業(yè)人口調(diào)查就曾經(jīng)使用過“條紙法”,但因為沒有跟國內(nèi)主流的“劃記法”進行比較,兩者的優(yōu)劣至今不得而知。因為對“條紙法”的系統(tǒng)研究,戴世光決定在呈貢人口普查中同時采用這兩種統(tǒng)計方法,在費用、效率、精度幾個方面比較出兩者的優(yōu)劣,雖然一次普查采用兩種統(tǒng)計方法較為耗費人力和財力,但戴世光認為此種做法“磨刀不誤砍柴工”,可以為此后的普查統(tǒng)計帶來非常有益的借鑒,戴世光跟陳達和李景漢講了自己的想法之后,也得到了他們的大力支持。
“條紙法”跟“劃記法”的兩人配合不同,一人即可操作,用一張紙代表一個統(tǒng)計對象,具體方法就是將符號和數(shù)字寫在長八公分,寬三公分的長方形的紙條的兩端,即為“條紙”,分類時,按照條紙上已經(jīng)抄好的符碼,分別插入木表(類似于劃記表)內(nèi)適當?shù)臋谥?,這種統(tǒng)計方法需要統(tǒng)計員按照一定的符碼對每個人進行歸類。
為了后期統(tǒng)計的方便,需要在統(tǒng)計開始之前便設(shè)計好各類符碼,諸如年齡符碼,比如55-60歲的年齡段的人口符碼為14,該人年齡為57,在此年齡段,便在此標注14,再如婚姻情況,實心圓為已婚,空心圓為未婚,同心圓為鰥寡。設(shè)定好符碼之后,統(tǒng)計員只要在統(tǒng)計之前背熟各類符碼,在統(tǒng)計時就可以大大提升工作效率。
除了設(shè)計統(tǒng)計練習生的考題之外,戴世光先生還帶領(lǐng)大家利用監(jiān)察員們已經(jīng)收上來的調(diào)查表進行統(tǒng)計模擬,一組人按照“條紙法”,一組采用“劃記法”,胡承蔭被分在了“條紙法”小組里,胡承蔭的記憶力很好,很快就將所有的符碼背了下來,統(tǒng)計時的速度也是所有人中最快的。
在針對同樣一批調(diào)查表進行統(tǒng)計之后戴世光先生初步發(fā)現(xiàn)了兩種統(tǒng)計法之間的不同,使用“劃記法”時,若是出現(xiàn)錯誤,則無法判斷是誦讀者口誤、記錄者聽誤還是記錄錯誤,追溯改正的難度較大。而條紙法唯一的難度就是要求統(tǒng)計員要對各項目規(guī)定的符碼十分熟悉,而出現(xiàn)的錯誤主要是筆誤造成的,但是因為每張條紙都有編號能夠與原始的調(diào)查表對比,追溯之后也能快速找到問題所在。
經(jīng)過這次小范圍的對比,戴世光對兩種統(tǒng)計方法的優(yōu)劣心中大致有數(shù)了,雖然他們的樣本量較少,跟呈貢全縣最終的統(tǒng)計結(jié)果恐有一定偏差,但戴世光先生對“條紙法”產(chǎn)生了巨大的信心,覺得自己這次對比的嘗試是有很大意義的。
平日里除了幫助戴世光先生做統(tǒng)計工作之外,胡承蔭還主動幫助陳達先生和李景漢先生做一些案頭工作和雜事,閑下來的時候,胡承蔭最喜歡獨自去田野漫無目的地游蕩,路過一片片野稻田,一個個菜圃,沿著水渠一路走到滇池邊,靠著柳樹看天邊的云和滇池中一模一樣的云之倒影,天氣和暖之時就下水洗個澡,倦了便在草叢中倒頭就睡。