December 7, 2012
-
On statistics
[統計講座]
星期一下午去了中央圖書館聽統計講座。
(除了因為個人興趣,當然也因為要教資訊素養的關係。
在學校教資訊素養,雖說是支援通識科,但要配合時機並不容易。今年通識科IES進度就提前了,我竟然發現學生現在已經要交問卷題目,而我到下學期才教問卷設題……當然,我本來就不認為IES是個適合一般學生的方法。其實不需要給學生自由選題,把整份IES拆成像化學科校本評核般,每次做一種實驗或分析方法。用這樣來評定學生是否把握到這些細節方法,應該會好過一下子要他們自己由零開始做一份完整的,但最後很多人根本搞不到。這點不在話下。)
政府那部分沒甚麼特別,反正就是在下也懂得講的東西。政府官員夠膽拿某團體對港珠澳大橋的引導性問卷(當然是引導人支持它)來開刀,雖然沒有指名,但已經夠我拍多兩下手掌。
之後港大的楊良河博士續講,此君十分有趣,大家聽得很高興。
講義中稱周朝的「司書」是管統計的,我想似乎不準確。司書應該跟老子被指為「周守藏室之史」一樣,都是當時的圖書檔案管理員。不過統計資料當然也是檔案資料的一部分,所以司書自然也要管這些統計資料。不過我想他們的工作是保管和檢索多於去「搞統計」。
至於 statistics 跟 status 的關係,說穿了很明顯(統計不就是反映「狀況」的學問麼),不過之前就是沒想到。面這個詞又是來自德文 statistika,以至楊博士稱現在很多科學期刊中以 -ka / -ca 結尾的是都跟統計有關,例如 Biometrika。
而最好玩的,就是楊博士為了解釋「雙盲」實驗設計和統計數據的關係,拿了七十年代「咖啡因和心跳血壓關係」的研究,在演講廳中做一次。(我想他在課堂上早就這樣玩過了吧)
科技進步,現在竟然有手機軟件(apps)可以透過相機閃光燈來偵測心跳率,所以在課堂上重複更容易。(我想學校老師也可以嘗試玩一次,反正現在很多學生都有手機,叫他們預先安裝就行了)
而無咖啡因可樂,楊博士稱「比較難找」,不過我想如果問朋友在哪兒可以買到就不難了。楊博士以「抽獎」名義抽七個人出來,稍後甚至說「嫌不夠隨機」(因為連續三個都是女人,當然你明白概率的話就會明白這樣不出奇,他只是想大家玩得更高興而已),拿了自己那隻小熊維尼「豬仔」大公仔出來拋,讓聽眾拋來拋去,每第三次接到的人就抽出來。這七個人都有一件小禮物。
七人當中的第一位,負責「雙盲」的重要步驟﹕負責決定哪一組飲無咖啡因、哪一組飲有咖啡因的無糖可樂。他負責把可樂分別倒進兩種顏色的杯中,並把有關的牌放在公文袋中以作紀錄。
可樂在其他人沒看到的情況下斟好了,就由(不知道可樂怎樣分)的博士把其餘六人隨機分進兩組,各飲不同顏色的杯中可樂。可惜的是,其實那個軟件要量度心跳並不容易,而且大部分抽出的都是女士,手指血管比較幼,所以飲前飲後量了很久。
而最搞笑的是……「開估」後發現飲無咖啡因可樂的心跳似乎反而增加更多。(當然,這點其實沒甚麼出奇。一則在眾人面前做實驗本身就令人心跳加速,而每組只有三人,個別人比較害羞或怯場就已經大大影響結果。而且也沒有控制參加者是否經常喝咖啡因飲品,因為喝得多的人反應自然少。
而更大的問題是,飲後一兩分鐘就量,咖啡因當然還未吸收到。如果要重複的話,其實應該一開始講座就做,講了一小時左右再量才知道有沒有效。反正當年的研究也是一小時後效果最大的。
更何況,退一萬步來說,咖啡因和心跳血壓的關係其實有爭議。)然後博士再說說 Big data 的三大重點﹕Volume, Velocity (例如股票的高頻交易) & Variety。
說這個因為博士本身的研究興趣之一就是 Data mining (出名的例子就是尿片、啤酒、星期五的關係)(Data mining 本身很有用,不過必須小心別變成 cherry picking 般,從海量數據中抽出一些看來有但其實不存在的模式。尤其在現今電腦功能「太強大」就更容易出現這種「鑽牛角尖」式問題。
上期《科學人》就介紹了 data mining 並有作者 Yaser S. Abu-Mostafa 在加州理工的網上課程資料。)這些新科技甚至可以用來重新研究《紅樓夢》前後部分作者不同的說法,亦可以用twitter的貼文來預測流感高峰期。
博士另外運用了Gapminder軟件展示香港和美國的老年人口比例和收入變化。
這套由 Hans Rosling 領頭開發的軟件其實很出名,方某之前也介紹過兩段相關片段(世界的四十年進步、二百年世界各國收入和人均壽命)。反正免費,有興趣的看倌也不妨下載來玩玩﹖Hans Rosling 說聯合國和政府統計單位往往不願釋放資料。我不知道香港政府統計處態度如何,不過他們倒也開始為2011年人口普查做了一些類似的互動圖表,展示這些數據(如各年齡男女比例)在過去的變化。
(後話﹕楊博士另外為教育局寫了本《數學的應用投資組合及市場效率》)
---
講座聽完,究竟是立即搭地鐵走,還是等17:35的948﹖
最後我決定先去看看皇仁150周年那個展覽,然後才坐948走。
(不過這其實大誤,因為巴士在金鐘中環塞車,結果用了超過一小時才回到家,如果我早點搭地鐵走顯然只會更快。)校慶展覽當然就是介紹威水史了,但既非皇仁仔,又對名校沒興趣的在下,還是以看歷史背景為主。(展覽介紹的名人,當然大多都是有錢人,不在話下。)
再不然,從當時的成績表看當時的科目也頗有趣。展覽中提及新安縣學,把這個也當官校其實是有點「水份」的。因為明清官學,其實並不真的有教學活動,那些「生員」只不過是掛名(廩膳生倒真的有補貼可領),大部分都是自修或另外找老師。縣學府學的教員也不過定期召集他們考試,性質就像現在學校的「小測」(quiz)而已。在科舉制度中真正影響他們繼續「升級」為舉人進士的,還是中央派人主辦的鄉試和會試。考取「生員」(即「秀才」)的重要性不在上學,而在於這是參加鄉試的資格。
不過「土客之爭」倒是一件當時的大事。而最有趣的,是跟皇仁沒關係,慈禧太后七十大壽時某君寫的一副諷刺聯﹕
今日幸頤和,明日幸海子,幾忘曾幸古長安。億兆民膏血輕拋,只顧一人慶有。
五旬割南越,六旬割臺灣,此時又割東三省。數千里版圖頻棄,每逢萬壽疆無。
(司徒華說傳是章太炎寫的,而其版本「割南越」則為「割交趾」。另一版本傳的章太炎版本又有不同,變了「割雲南」,不過這樣聽起來有點怪。)
見到皇仁校長有個叫「威廉臣」,難怪畢華流《主席手記》曾有「兩個威廉臣」的梗了……
除了舊皇仁的模式外,這幅地圖倒令我駐足良久﹕
整幅地圖都是以港島為主,視九龍一帶如無物。不過地圖上還有很多有趣的東西,例如在船政司(即今海事處)附近就有「些喇堪」,如果你對香港掌故沒興趣,就不知道這其實是水手宿舍「sailor home」(現在還有,在尖沙咀訊號山腳,稱海員之家)。地圖另外有趣的地方,就是附圖除了九龍海面和全港九新界簡圖之外,還有一幅廣州市區圖,可見當年省港關係之密切。
而有一點奇怪的,就是地圖右側標示「西灣河」、「筲箕灣」的位置,其實只不過是北角,連鰂魚涌都未過,又何來那麼快就西灣河筲箕灣﹖要是那麼近就不會有「英雄被困筲箕灣,不知何日到中環」的戲謔了。
不過三十年代的九龍,真的像地圖畫得那麼荒蕪嗎﹖我很懷疑﹕
這幅圖根本非志在畫九龍,而是標示輪船泊位。地圖中九龍的「避風塘」是油麻地避風塘。靠北的是大角咀碼頭。靠南應該有渡船角碼頭的,是我搞錯了那時還未有嗎﹖
另一問題又出現,圖中由尖沙咀伸出的理應是九廣鐵路,但竟然在大約現在太子道的位置轉向東……鐵路走線應該不會偏東成這樣的。這幅地圖的繪製真的很有問題。
後話﹕想不到在這個展覽也可以見到卜博士的大名喔。(結尾「資料提供」那部分)
Recent Comments