February 26, 2007

  • (小廣告﹕方某人出書——各大書局,均有代售﹗)
    (又﹕訂書已收到,訂了書的朋友請聯絡我取書。)

    -------------

    剛剛把新書進呈御覽。
    然後突然覺得背上涼了一截……
    因為現在才想起,書裡有幾處說我們的學生成績不好、上課不聽話……
    如果讓聖上以為小人「唱衰學校」的話,實行推出午門斬首都似。

    助理說﹕你又不是指名道姓,怎會有問題呢﹖
    我﹕聖上海量汪涵就好。

    就是昨天在座談會討論過,回來才怕有問題。
    何況那些都是舊文,一時都想不起來。

    因為方某就是有個「開口夾著"月利"」的毛病,說話總是可以把人惹毛。
    不算是有意,而是說話率直得橫衝直撞。(不要像子路般被剁成肉醬就好……)

    孔子哭子路於中庭。有人弔者,而夫子拜之。既哭,進使者而問故。使者曰﹕「醢之矣」。遂命覆醢。
    —《禮記.檀弓上

    (子路在衛國被殺後,孔子在中庭為學生的死而痛哭。
    有人來弔唁,與夫子交拜。然後,孔子問來者子路遺體的下落,來者答﹕被剁成肉醬了。
    於是孔子叫人收起家中所有的肉醬。)

    曾經試過在家族聚會中,看到電視說古巨基的花名,於是我插了一句﹕鬼叫佢有個「基」字。
    然後老母就瞪了我一眼——因為族中剛好有位堂兄名「基」……

    人容易口快說錯,搞到面左左,還未算憎我。
    —幸福之家(《甜孫爺爺》主題曲),方力申

    -------------

    入正題,討論一下阿唯的報告﹕
    (阿唯管家)
    心裡浮現要「評談宅人報告」時,還以為自己又再準備「開口夾著"月利"」,上網看才知道原來阿唯已經早一步開設「意見反映欄」。那麼我不談談就對不起自己了。

    對於未讀過這份報告的人,很難詳情討論。只能介紹說,這是阿唯前陣子在網上進行的御宅族調查結果。
    (相信大多數人都沒能讀到,因為本書只在同人活動發售,除非本身就是御宅,否則連見也不會見過。我在阿唯那邊嘆道「如果外頭也有得賣就好」,其實就是這意思。建議遲點把報告內容整理放上網。)

    因為我不是御宅(好明顯不會在現場出現的 ),所以意見大多在於統計方法方面。

    1. 「84」的參加人數,究竟是多還是少呢﹖
    如果純粹就統計而言,若然是隨機抽樣、問卷又經過仔細設計的話,幾十人已經可以得出相當不錯的結果。(如果要把誤差值控制於 5% 以內,受訪者應該有千多人)
    不過,這份問卷是自願回應的,所以可能會出現偏差(bias)。除非我們可以假設「阿唯管家部落格」的常客,跟「一般御宅族」(如果有這回事)是同質的。

    當然,作為一個先導研究(pilot study),這仍然是一個好嘗試。如果以後打算作進一步的調查,也許要考慮擴大採樣範圍。(例如﹕向各大專動漫學會的會員作抽樣,那就可以找到幾百人了。反而要訪問學校以外的御宅,抽樣會比較困難。)

    2. 問卷沒有對御宅族下定義,也沒有任何「關卡問題」來排除非御宅。
    就像作一個性調查,也要講清楚「性行為」的意思,連「御宅族」是甚麼都沒搞清楚,結果就會變得很模糊,因為樣本混雜了「不知是不是御宅」的人。
    正如「問題17」中,有31人說自己不是御宅,另外13人說自己「未夠班」……那麼還填宅人問卷來幹啥﹖

    這問題有兩個解決方案﹕
    a. 設置「關卡問題」,問一些我們認為只有御宅族才懂得答的問題。只有符合「御宅族」定義的人,答案才列入計算。當然,問題是御宅族沒有單一定義,我們有沒有可能找出一些可以當門檻的問題﹖
    b. 依「問題17」的答案,按照當事人自認御宅與否,作進一步的比較,看看「自認御宅」和「自認不是御宅」的人在其他問題上有沒有分別。(這不一定要用 SPSS,Excel 也應該做得到,我們電腦科現在就是教中三學生做這種事)

    3. 「問題3﹕你今年幾歲﹖」的統計,似乎不適合採用算術平均數(mean)。
    幸好有年齡分佈圖,我們可以看出,大部分人集中於16-22歲。左邊的下限是13歲,但右邊的上限是36歲(有幾個離群值)。這很明顯是一個向右偏移的曲線。
    離群值對平均數的影響很大。在非正態分佈的數字中,如果改用中位數,所受的影響較少,比較能反映中央值。
    (在這例子中,平均年齡是20.66歲,中位數年齡則為19歲。)

    這問題在「問題22﹕蘿莉年齡的上下限」中更為嚴重。
    按照阿唯提供的原始數據,下限平均年齡為5.75歲,下限是13.31歲。
    可是,在「上限」中有一個很大的離群值「30歲」(29歲還算蘿莉,那麼我也是正太﹖)。「13.31歲」是包括這離群值的平均數,如果撇除了這值,平均年齡應為「13.08歲」。

    如果改用中位數,就簡單得多﹕下限中位數是「6歲」,上限中位數是「13歲」(是否撇除離群值都一樣)。
    可以見到,改用中位數,結果會比較接近數據分佈的中心。

    4. 一個小問題,第 8 頁寫了一句﹕
    「但據問題4-5得知,大家愛看的作品,幾乎都是輕小說呢。」
    那是在說「問題4」至「問題5」嗎﹖
    原來不是,是第 35 頁的「4-5﹕問題36」。(「4-5」是「第四章第五節」的意思)
    為免誤會,似乎註明是「4-5﹕問題36(p.35)」比較好。

    5. 答案分類
    舉個例﹕「問題7﹕你有甚麼興趣﹖」
    我有點懷疑,某些答案例如「閱讀」、「看新聞」和「漫畫」,「上網」和「用電腦」,會否有重疊之處。(至少,回答「上網」和「用電腦」的人,有可能是在做同一回事)
    這次的答案好像是回覆者自己填寫的,也許下次在答案界定會花點心思。

    6. 不確定數據
    「問題9﹕你每月大概會買多少本漫畫﹖」中,說明統計方法為﹕如果不回答實數,而是某範圍的話,就會先取平均值,再套進統計的 scale 裡。
    這個統計方式比較粗糙,因為回答的人根本不肯定自己做了甚麼。假如有人回答「1-3本」,就會被當成「2」本,其實可能他上月買三本,這月買一本,下月買一本,就是沒有買兩本的(連平均數也不是兩本)。

    建議學習政府統計的訪問方式,問受訪者「過去一個月買了多少本漫畫」好了。因為這樣有一個明確、記憶以內的範圍,可以準確回答,避免不確定數據的出現。
    (我不知道這數字會不會受同人活動「旺淡季」的嚴重影響,如果撇除這效應的話,也是可行的。)

    7. 「問題18﹕你認為身邊的「一般人」對動漫畫的態度如何﹖」
    這問題令我頭腦覺得有點混亂。
    是想問「一般人對動漫畫的態度」﹖還是只問「你睇人地點睇你」﹖
    如果是前者,似乎應該開設另一個「問一般人」的調查。
    如果是後者,這樣的問題似乎意義不大,除非打算代表宅界到立法會抗議,用來作民調。(笑)

    8. 在「喜好篇」那些「你最喜歡的XX」,有很多只有一兩票的答案。
    在喜好多元化的環境,這也是可以預期的結果。
    不過既然御宅們喜好眾多,如果改用「你最喜歡的三位/套XX」會不會給出不同的結果﹖
    (因為只准投一票的話,很明顯票數會集中於某幾個大熱項目。如果一人可投幾票,得票應該會分散一些。)

    9. 純粹個人意見﹕「問題33﹕屬性」,「眼鏡娘」只有兩票,實在太過分了﹗
    (「口嫌體正直」也算萌……﹖不是 H 來嗎﹖)
    (護士更加不萌,不信問問肥醫生 )

    作為人力物力有限之下的同人作品,其實我是頗滿意的(如果我們用觀看一般雜誌讀者調查的角度去看的話),只是提出一些我認為可以改進的地方。我們當然應該有更大的耐性,期望更大規模的香港御宅正規研究。
    這一份同人版報告,就是開端。

    ---

    (下一本討論﹕《誰賺走了你的咖啡錢﹖》(Undercover Economist))