March 7, 2009

  • Introduction to research method


    格物致知》,李逆熵,香港﹕經濟日報,2008

    先前提過,在下是李逆熵的擁躉,拙著甚至有一章專門介紹他。(這句當是利益聲明﹖)

    本書乘通識科「專題研習」之勢推出,誠然是個不錯的綜合文章,因為在下先前讀的研究方法課(research method),有大半都在這裡介紹了。正如作者所稱,這本書由中學生到大學生都應該合用。中學生的研究難度較低,本書大概已夠用﹔大學生讀完這本導論,或者需要再找一些參考書,以便深入學習某種自己要用的研究法。

    不過以他過往作品的反應,我不認為欣賞的人會很多。例如他的幽默並非像周星馳那麼惹笑,我想喜歡淡然的人會比較懂得欣賞他。他的書在愛好科普的讀者當中屢獲好評,卻不算很流行,並未得到更多一般讀者的欣賞。
    尤其這本甚至不是科普,而是一本研究法導論,我不敢期望它會成為學生踴躍借閱的書。要用這本書教學生,我想老師可以本書作專題研習的教學綱要,把內容融入教學中,然後要求學生讀某些章節即可。也許有些較勤力或好學的學生,看了後覺得好,就會再讀其他的章節也說不定。

    可能因為現在出版真的越來越匆忙了,書中亦出現少許手民之誤。手民之誤拙著亦不免,但此書乃作教材/自學之用,影響會比較大。
    既然李氏已在書中邀請讀者予以指正,在下自然會送他一個勘誤表。在下面筆記中,真正算得上「錯」的大概六七項,以現時出版物而言,也不算多。

    ---

    筆記或挑骨頭﹕

    p. 12 很多的「」字,自然是表達「性質」的詞尾,但以中文的角度看,其實沒有「性」字意思一樣明顯。「有條理」(條理性)、「全面」(全面性)、「批判」(批判性)、「內省」或「自省」(內省性)、「開放」(開放性),並不會令意義不明。

    p.28 「大家若再細看圖四中的流程」

    先前的一章其實只有圖一和圖二,我認為他想指的是圖二。(如果數字是由全書第一幅圖開始計算的話,這一幅的確是「圖四」,相信是編輯時修改了,卻漏了改這一句。)

    p.44 「但我們必須留意,《維基百科》裏的資料完全是熱心的學者無償地放上去的」

    「學者」通常是指專門從事學術研究的人,一般而言,非全職但有相當造詣的「業餘學者」也包括在內。
    但如果不是把「學者」的外延放得太鬆的話,我想維基百科的編輯者絕大部分算不上是「學者」(至少在下不認為自己是學者)。畢竟維基百科是「人人可以編輯」的,我想「學者」一詞代之以「網民」或「參與者」比較適合。(嚴格而言,無償與否亦非重點)

    p.47 「前者又再分為隨機性調查(如街頭調查)和預約調查(如進行家訪)」

    我想稱之為「隨機」似乎容易令人誤以為這種調查經過「隨機抽樣」。
    事實上街頭調查通常做不到隨機抽樣,充其量只能稱為「隨意調查」(例如後面提到的「隨意抽樣」)、「隨便調查」、「方便調查」、或「隨緣調查」﹖

    p.49 「例如我們假設『金屬的導電率會隨着周遭的溫度作出變化』,那麼溫度這個變量我們便稱為『自變量』(independent variable,又稱因變量或應變量),而導電率這個變量我們則稱為『依變量』(dependent variable,又稱『因變量』或『應變量』)。」

    有沒有發覺「因變量」和「應變量」出現了兩次﹖
    「因變量」或「應變量」都應該是指 dependent variable,所以前一句是誤植。

    (方某做翻譯的時候,independent譯作「獨立變數」或「自變數」、dependent variable譯「應變數」、controlled variable則譯成「控制變數」或「受控變數」。)

    p.54 「抽樣架構可以是學生自發地組織的舊生會(可能不止一個)的通訊錄」

    首先,從邏輯而言,組織舊生會的,當然已經不是學生,而是舊生(校友)。
    其次,舊生會其實不一定是自發組織的。
    八三校友會就是母校籌備週年紀念時,召集校友去搞的(如果學校不要求,根本沒人去搞)。雖然具體工作仍是由校友自己去做,但發起的似乎應該算是學校。

    p.74 「問題是,相比起郵遞地址,不少人會覺得電郵地址屬於更為私隱的個人資料,因此不會輕易透露。不少機構也持有類似的觀點。就以大學的舊生會為例。它們可能知道你在進行一項嚴肅的學術研究,而向你提供歷屆畢業生的通訊地址。但至於電郵地址,它們多會以私隱為由不肯提供。」

    身為一個普通網民,我認為真實地址更為私隱。我不介意告訴人家電郵,但不會隨便寫地址。開玩笑說句﹕電郵地址讓人知道了,頂多是騷擾我,真實地址被人知道了,他可以上門殺我耶。
    當然,就我跟中大學生事情處打交道的經驗,就算聲明可以請教授開證明,他們還是不肯給我電郵地址作研究用途的。(因為我要抽樣調查,其實如果不想抽樣的話更簡單,把電郵樣本交給有關機構,請求他們代發 mass mail 就不涉及私隱問題了。)

    p.82 「同樣透過深入的觀察研究,古道爾(Jane Goodall)則大大加深了我們對黑猩猩(chimpanzee)的了解。」

    台版書有個慣用的譯名﹕珍古德,這個名比較像女人。

    p.95-96 雖然「拉丁方實驗設計」可以減少實驗數目,但文首提出說要一位老師「掌握四種不同的教學法,也着實是太困難」的問題似乎沒能解決。

    p.108 「這種做法稱作『後續分析』(secondary analysis,又稱二次分析)」

    後續分析聽起來很像「meta-analysis」(又稱後設分析、整合分析、統合分析、元分析或薈萃分析),雖然這兩者其實不同

    p.121 「這種條件我們稱為『必充條件』(necessary and sufficient condition)」

    方某孤陋寡聞,沒見過有書寫「必充條件」的,從來只讀過「充要條件」。
    試用 google 大神查看,「充要條件」有1040000個結果,「必充條件」只有186個,可見「充要條件」才是普及用法。

    p.123 文中提及背後有同一因素導致兩件事出現,於是這兩件事看來高度相關。似乎應該說明這叫「干擾」(confounding)。

    p.141 「歷史學家黃仁宇便曾經強調,中國歷代的政治得失,很大程度在於中央政府能否『以數目字管治國家』。各位可以參閱他的《中國大歷史》一書,看看是否同意他的觀點。」

    以在下理解,黃仁宇說的「以數目字管理國家」,只是說國家現代化的必要條件,他應該不是說「歷代」的施政得失都與此有關。正如周朝從來沒能以數目字管理國家(井田九州五服之類是一種圖像式的統治理念,實際的井田當然不是正方形的),卻延續了八百年。宋朝王安石改革失敗,黃仁宇則認為是因為他的改革要求商業經濟社會,政府必須能夠以數目字管理國家才能成功,由於宋朝還未做得到(直到近代都未做到),所以改革失敗。

    p.147 文中的「N-1」開方 [即 (N-1)^(1/2)],開方標誌那條線不夠長,意思變成「N開方 - 1」[即 N^(1/2) - 1]。

    p.148 置信區間方程式的 x-bar (即是 x 上面有一橫)後面,應該是「±」而非「+」

    p.151 「大部分都是由遺傳學家兼數學家費沙(Ronald Fisher)於20世紀上半葉所創立的。」

    台版書籍多譯「費雪」。

Comments (4)

Comments are closed.

Post a Comment