how to write a journal paper

Page 1


這本小冊主要討論的是如何撰寫統計學的論文。雖然對於一般的科學 論文有所著墨,但是以統計學爲主,而且是以統計學的方法論爲主。 撰寫論文其實只是末節,研究的本身才是本質。「爲學問而研究」和「爲 發表而研究」是兩個層面。我退休之後有時會選一兩篇經典論文細讀,才 發現有好些以前沒有唸懂的地方。甚至可以説,如果當年眞唸懂了,有些 我自己的研究工作,可以少走不少冤路。道理其實很簡單:功力不足便要 化,總免不了跌跌撞撞。 但是人類的進步,都不是來自四平八穩的工作。如果都要等所有的預 備工作都好了才開始寫論文,恐怕一輩子都不夠做準備的。 這十篇講稿,分別在人民大學和高雄大學講過。簡體版還有吳喜之教 授的參與。應該還加上關於學位論文的寫作事項,將來人民大學出版社也 許會出書。但是事事無常,誰知道呢? 不想買書的人可以去我的網站下載,見 但那裡的檔案裡有些錯字沒有改。 趙民徳


關於統計論文的撰寫

11

目錄 第一章心理建設

1

第二章:好論文的特質

7

第三章:一般論文

17

第四章:動手作文

31

第五章:且先讀幾個緖論

41

第六章:讀一篇要大改的文章

75

第七章:讀一篇關於自助法的論文

93

第八章評審幾篇論文

103

第九章讀一篇關於2^的論文

167

第十章人在江湖

177


第一章:心理建設

在大學任敎,以前除了到時候去上課,學期完了給成績,對於是否要寫幾篇論文, 多半是自願的事。現在時代一變,變成了 「 不 發 表 就 走 路 ( 卯 " ^ 0 1 ^ 洫 ) 上 因 此 , 發表論文,似乎變成比好好敎書更重要的工作。 這本小册,表面上討論的是如何撰寫可以發表的論文,但我想深一點談關於論 文寫作的種種,因爲學術上的功力是本質,而如何撰寫乃是末節。

沒有研究工作就沒有論文 發表論文的背後基礎是硏究工作。做硏究工作有如尋礦:你沿著一條或者幾條線 索,用某一種工具一點一點地挖下去,希望看到有價値的東面。這裡「有價値」是比 較抽象的。開礦挖到了金子、石油就算成功,最多是蘊藏量的差別罷了。但是對硏究 工作而言,「有價値」指的是「新的丄「能承先啓後的丄「替別人開路的」。這裡,「新」是 必要條件。新結果在理論上指的是至今人類都還沒有做過,並且是11011-^^81的結

果。 再好的結果,如果是幾年前被其他人先一步發表了,除非你能夠再弄一些新見解, 那麼你就差不多等於做了虛功。你可以有一點虛榮心的滿足:我所做的硏究和某某人 一樣好。落後別人之後,如果你一再試投也許還可以在較弱的期刊發表出來:希望他 們的評審者學問不深,看不出來。 但這不是正途。發表論文並不是沒有邪魔外道但仍勉強合乎學術倫理的辦法。但 這些方法旣弄不長,也搞不大。靠這一套辦法〔如果你夠小心的話)可以混一口飯吃, 並且可以混得不壞甚至於可以小有名氣,但這些之上,如果還加上「我有一點眞功


2

關於統計論文的撰寫

夫」,那麼這些所謂的邪魔外道的本事,就可以變得名正言順。 這本小册,主要還是先鼓勵大家先有些眞功夫再玩別的遊戲。沒有實力,甚麼都 是假的。

為甚麼要鼓勵學術研究? 1

主要的道理:科學 上的實力,是一個國家最基本的實力。論文發表得多,表示有 很多人在做科硏,表示這個國家有學問有見識的人多,代表這些可以反映在社會和諧 進步,人民生活美好以及船堅炮利。 但這雖是一般領導階層的簡單想法,卻和眞正的科學本質是有差異的。讓我們做 好硏究的基本力量,雖然很大程度上包括了政府和社會的鼓勵和壓力,但能夠讓第一 流人才半夜不睡搞科硏的基本力量,並不是這些。這類第一流人才,如果他要在政府 的獎勵條件之下優化他的科硏成績,根本用不著這樣三更燈火五更雞那樣的拼命。

深入推動研究的力量 眞正的硏究工作是好玩的,是有瘾的。是由興趣,好奇心,探險的精神這類事物 後面推動,才能讓一個智商很高的人2,圍繞著一兩個問題的焦點,東翻西找,千尋萬 覓地想了解眞相。好的科學硏究結果,多半來自探索未知。 我們引用一段散文:

在美國找一個書店是不容易的事,找到一個有點正式的書的書店,更 難。而我信步所之,在這麼個小街,發現這麼多可愛的書。眼前贿有一 片眩目的光芒。掏出一^&倫敦機場換來,還不會用的錢,讓店家挑了兩 先令去,帶回一本《新科學家》來。 三翻兩翻,即看到很熟悉的幾張畫。仔細一瞧,這些書全是中國的東西: 一張是一六零一年湖北的鐡塔;一是一六二一年射的火箭;一是一六一零 年河北的拱橋;最好犹的是一張木刻,是用河水推磨,用風箱吹起旺火。 ~~1泛指較軟性的社會人文^#和物理化學這類傳统的硬##。 2 我們不敢説研究工作者智商一定高,但這一#的確是較一^通過較多的考試,所以至少是一批國家胥

英。


3

第一章:心理建設

這是一個叫做陳之藩的學者,當年從美國到了英國的劍橋去訪問硏究,在那樣的 環境下深思反省之後所寫的一系列散文中的一段。那本書叫《劍河倒影》,曾經給台 灣的學子深刻的影響。陳先生是中文素養極好,而科硏也卓有所成的學者。上面的一 段話,來自他讀了丹尼約瑟的《東西方的科學與社會》【此人在1947-1964間的論文 集)這本書之後的反思。這本書講的是中西科學的比較,中國科學對西方的影響,以 及中國社會與中國科學的關係等。 作者發現很多科學來自中國,而一個自然的問題是:爲甚麼那麼多的發明,卻沒 有導出像歐洲近五百年的科學發展? 這樣的問題,我們中國人何以沒有被認眞地問過?何以沒有被好好回答?我們 時常說「XX中國古已有之」,或者搞出一些四不像的如「中學爲體,西學爲用」的道 理,更簡單或者更浮面的做法就像李鴻章那樣的用銀子去買外國兵艦來建北洋海軍。 但是,近代中國的積弱卻是一個事實,而這個事實在最近20年才開始有所改變。 丹尼約瑟的結論,主要在中國科學在整個發展中主要是爲了 「實用」,而歐洲近 五百年的科學發展,主要是爲了 「好奇」。 中國人太務實了。如果歷代將「奇技淫巧」當作科舉的測驗項目,相信我們的科 學會全然不同。但這樣做,也許可以產生一些第一流的工程師,但還是產生不出學術 上的能引領一代風騷的大師,就像歷代的科舉狀元,他們也許能留下一兩首詩,但對 於學術的貢獻其實並不大一樣。 丹尼約瑟以半生的時間跑完了中國,又淹在劍橋的書海裡,去發掘中國的科學史, 這裡除了 「好奇」,還能說出其它原因嗎?反過來看,我們能不能找到一個中國的丹尼 約瑟,以半生的時間,淹在南港的書庫裡去硏究歐洲的科學史來解答「歐洲近五百年 3

的科學發展,主要是爲了好奇」這個假設是對還是錯 ? 陳之藩最後說:在這種笨人不能產生之前,我們所謂的科學,還是抄襲的,短見 的,實用的。也就是說,眞正的科學,是不會產生的。 類似的反省,在時下的網路小說裡也看出一部分來。這類的小說,算是「架空歷 史」類。多半說的是某一個知靑,忽然回到過去,如何用他們的現代知識來改變古中 國的命運。伹他們的著眼,仍在科學的應用和制度的改革上,對於「好奇」的概念,沒 ~3這一段是陳先生的原文。


4

關於統計論文的撰寫

有著墨。

研究的目的 好奇和實用:這兩點我們不需再說。 明確的了解:把原始論文說得更淸楚,以便後人更易了解。例如1^101定理的 原始證明是很長的,現在任何一本微積分大概都用不到一頁。又如以前號稱世上只有 七個人讀得懂相對論,但現在任何一個物理系的畢業生都能懂。 確識:做科硏相當於人與天爭,因此要步步爲營,以便確認之後的結果後人敢大 膽地用。

國家鼓勵研究的目的 這是使國力強大的投資。智識就是力量,就是財富。這表現在戰爭中尤爲突出。 雖然,搞科硏的人士, 一般都傾向於反戰。他們想看到的是贏在實利:國民所得逐年 增加,01111〖1101^逐年減少。

使國力看起來強大:這是很多學術官員能夠做的。在全國的層面上,他們只能做 一些以論文的數量和質量爲標準的獎勵辦法,但是上有政策下有對策,早晚這類獎勵 發表的政策和計算論文的方式都會被某些人破解。

關於301/3501 亞洲各國的學術官員對於801/8501有一種莫名其妙的信任。伹301/8801的唯 一道理,是「它不由國內的敎授控制」。但這最多只能拿來做過渡的手段來用,不能長 期倚靠。學術最終還是希望在國內有一套有聲望及傳統的學術評鑑機制。一個大國, 必須要能做到「自己說了算」。雖然這一點並不容易,全得靠硬功夫和好的學術倫理 和制度。 下面的信是1962年陳之藩寫給胡適的:

告訴您一個好消息:我又有一篇論文,就在1118印出來了 ,.,,這篇文章 《艮短,^12^乾淨,題我叫「八116^ 0,^100X^1七。1^0111161: 00691016111; ^81118^1011」,


第一章:心胃設

5

您大概數學都忘光了。這是數學上的大問題,我提出個圖解的方法來。有 個數學家說,如果世界上的書全要燒光,該留70111:161 561168 。 我 的 貢 皿 不大,但寫得很俐落。這是照著您在東廠胡同教我的八字秘訣:-一 「開門 見山,水清見底。」開門見山不難,少廢話就行了。讓水清見底是談何容易 的事。

有沒有現代的年靑學者,給他的博導寫類似的信?這是我們傳統裡有味道的部 分。如果他寫成這樣:

告訴您一個好消息:我又有一篇論文,就在印出來了,…這個是 801期刊,以11111)3^

01而論,在同類期刊中排名第四^ ^ ^

這也許還有一些尊師重道的部分,但是深度就差了。但這是現在的遊戲規則4。寫 到這裡,眞免不了有很多無奈。

心理建設 這一部分的目的,主要是讓大家對於「寫論文」一事有一些心理建設:有些事情 是需要了解一下的。 1.能刊載的論文未必好:能刊載只表示通過某學術期刊的評審而已。 1被拒絕的論文未必糟:有幾類論文容易被拒:相當糟的論文,不討喜的論文, 擋著別人路的論文。 501/5501等只是參考:它主要是以某(^仏上的紀錄來決定是否收入,因 此較不含個人的喜惡。觀念上我們別將它們看得那麼大:基本上!!!!!)^^ ^ 0 1 只 是 ?0^18X1*7

!!!^ 。也別將這些看得那麼小:意思是說,亞洲各國的科技官員也並非那

樣的不了解狀況。對於(^(?-^冗的敎授而言,登出一篇301論文,也並不容易一 寫一篇論文的基本功夫你還是要做。對政府的鼓勵和獎助,年靑時不妨積極些,年紀 大了,就該用平常心看待。 這一切全在您把自已看成是哪一類學者。這句話說得比較有鼓勵性。但我的意 4

~~ 這是以西方的價值爲價值的規則。一個大國應该有她自已的志氣。


6

關於統計論文的撰寫

思是:做一個能讓人尊敬的學者,其實並不是遙不可及的事。和最好的學者相比,一 個實在的博士,在專業上也不過是相差在兩三本眞正好書和十幾篇眞正弄懂的經典 論文。如果客觀環境略好一點,有一兩年的「折節讀書」也就趕上去了。但是,維持在 第一線,也需要用心用力。 原則上,寫論文的技術好學,但實質的部分則需要功力。而功力指的是學養、品 味、苦工、眼界和心胸。寫論文並不是做燒餅油條,甚至不也是製造10晶片。在學術 圈,「人民的眼睛是雪亮的」。長期下來,只有眞正的學者風骨才能得到尊敬。 功力的來源:這包括了先天的優勢,自身的努力,師門的敎導和保護,工作圑隊的 合作,秘笈(一個好圖書館),諍友和好學生。

好文章

好文章有很多看法。但是有一點是公認的:前2^。的文章〖而2的値蠻小;1,才 叫好文章。因此,大部分的作者,大多數的時候,都只是在做不怎麼好的文章。這裡並 沒有太多的不滿,因爲沒有那(^(^-^究的普通,怎顯得出那2^的不同?因爲國家 大力要求論文的發表,X的値只會愈來愈小,因爲分母在持續增加。可以這樣說:論 文超過某數的作者,當然是會有好作品的,但多數作品的也不會太好。 別好高騖遠,儘找自己做不出,別人也做不出的題目;別急功近利,儘找一定可以 發表的題目;這兩者都很難增加您的學術地位。前者是因爲多半您也做不出來;後者 則是別人也看得出來您沒有多少貢獻。對您的學術生涯規劃,並不理想。

較佳的選擇 做比自己能力略難一點的題目;這樣才有一點挑戰性,別人也不會覺得您總是柿 子挑軟的來揑。長久下來,會對您產生一定的敬意,自己的滿足感也有一些。 專題的範圍,不要太窄,最好要有中長期的布局;這樣,十年下來,您可以有能「 成一家之言」的機會。 不要東打一拳,西踢一脚。這種亂槍揚打鳥的方法,投資報酬率太低。


第二章:好論文的特質 甚麼是好論文?這是較難的問題,但卻是要緊的問題。學術期刊都在挑好論文, 因此較好的論文才有較佳的機會發表,即做是純粹爲了發表,寫好論文也是重要的考 量。 寫作是有技巧的,但我們還是認爲:內容第一,包裝第二。事實上,能做出好內容 的學者,寫作的本事也不會太差。因爲他們旣然能夠在千絲萬縷的迷宮裡發現出前人 未知的道理,這些人對於邏輯推理以及淸楚表達的能力,應該都是沒有問題的。的確, 有的時候,某些結果是經由作者經由他獨立思考方法東拐西繞之後才得到的,如果沒 有經過淸楚的沉澱,寫出的論文只沿著作者原來幽暗的思路而發展,其他的讀者未必 能懂。有時作者認爲自然的事物,讀者未必也認爲自然。好的結果未必好懂,但是內 容,仍然只有內容,才是論文的本質。 有人說,好論文如美女,看到了就知道。錯!美女一看便知;好論文只有較高手的 同行才知道。因爲學術論文這檔子事不是普羅文學,而是一種精緻文化。 低段的棋手,往往不能看懂高段棋手的布局和收官一這需要足夠的背景資料 的了解。學術論文絕不是通俗文化,它是非常講究的、針對一小部分有足夠知識的讀 者所作的展示、理論上,一篇論文應包含所有能讓讀者讀懂該文的資訊。學術論文裡 不見得沒有錯,但那都該是「誠實的錯(^!!^

」。因此絕不該有故意的錯。

像金庸小說裡郭靖故意搞錯寫一部九陰眞經去胡弄歐陽鋒的事,在學術論文裡就是 犯了大忌的 2 。 ~ 1 因此,學#^文的内容要比教科書上的東西要多缺深。好老師未必是好研究者;論文寫得好但審教得不行 的人也比比皆是。 2 情治人員可以在某磁片上加一點或減一點去胡弄對方的間諜,但是在學術期刊上公開發表的論文就不可


8

關於統計論文的撰窝

讓我們來隨便看一看甚麼叫做學術上的好。我們說「隨便」,因爲自己見識也是 有限,並且主觀也強,是不可能將所有關於好論文的條件都一一列舉的。讓我們從最 簡單的一個公式說起。下面的一個公式是號稱是世上最漂亮的公式:,

這裡面有,6 ^ 2.71828…和冗^ 3.14159 ,,,這兩個各自合乎天人之道的「超越數」, 再加上《^ ^這樣的一個虛數,這三件東西怎麼會巧妙地連在一起? 科學家心中的審美觀也是非常主觀的。我講不出十分有說服力的道理。但是, 6 ^ 2.71828…是來自

的極限,而這成就了 「複利」的概念:生長的速度,和自身的大小成正比。這正是自然 界「生生不息」的描述。,世間有那麼多「6X1)0116111^1 ^ 1 0 ^ 的 模 型 , 並 不 是 偶 然 。 而

另 一 面 , ^ ^ 3.14159...來自圓周率,從這裡造就了多少三角函數這種周期函數。是 的,「周期」是我們的關鍵字,因此冗和我們所知的「循環不息」密切相連。而公式 巧妙地將這兩種合乎天人之道的事物連在一起。 我不是在講《易經》。但公式。是明明白白的可以用最嚴謹的數學講淸楚的事! 甚麼是「好結果」?首先的要求是「並非無足輕重(!^!!-^^^」。大體來說,凡 是能丟給學生做,並且你也相信他或她大概會做得出來的問題,大概就算是。 大部分博導給硏究生的題目,雖然不一定算是^1 ,但也不會相差太多。原因無他, 如果不是長期浸淫於某一專題並有相當的功力,好題目一般並不容易找到。如果有, 博導自己爲甚麼不做?

能問好問題,並解之 年靑時常聽到一些老數學家說:「證明定理不難,難在寫出定理的敍述」。現在年 紀大了,有時覺得寫出定理也不那麼難。玄幻小說裡常提到,修眞的人功力一深,便 漸有預知的能力。做科硏久了,對於自已浸沉已久的專題,甚麼東西會成立,甚麼事 情大概不會對,多多少少是可以猜出來的。 所謂的好問題,是我們一般猜不出答案的。但當你一步步把它梳理淸楚之後,它 以這樣I


第二章:好論文的特質

9

的答案又明白不過。這裡,你的學術貢獻有二: (!),問出好問題;(^)解決它。 古典的統計方法(例如在如!^!^纽,3*118X13 811(1 01^這樣的經典敎本中所列舉 的方法)多假設 义1,义2, ^ ^ , 5 ^

這組資料是給你分析的。基本的想法是別人已做了實驗,取得數據,現在請統計學者 去分析。這類的架構,在五六十年前是標準的。在數學上,因爲 ( ^ ! , ^ , ^ ^ ,,义")6

II

71

其 中 的 樣 本 數 7 1 固 定 , 是 一 個 有 限 維 1 1 * 6 (!!^^!!)的問題。所有的統計推論,是 根據這組數據的聯合機率密度函數 /(^^…,"汐) 而發展的。這裡的要點是:71是固定的。 要打破這樣的架構並不容易。在這架構之下,有些事情是做不出來的。例如即使 在

乂^、…;∼册尋,一) 這樣的最標準的模型下,要算出一個關於IX的長度爲給定値的一個信賴區間,也做不 到。比如說,敎本的做法是利用

來造出 尸[尤一 3 ^ - ^ ̶ 0 / 2 〈 〈 X十5力"̶^一^^] ^ 1

~0:

其中,這信賴區間的長度是 1 ^ 25力"̶"一^ 而因爲52 ^

- ^ ) 2 / ^ - !)是一個隨機量,不會等於任何給定的常數。

且不問爲甚麼我們有興趣去找一個「有固定長度的信賴區間」,至少在幾十年前, 這是個大家都知道的問題。若是誰能解出來,總有一點學術上的功勞4。這裡面有兩條 路可走,第一是設法證明這問題做不出來;第二是換一個條件來把這個問題做出來5 。 3

這是三冊的1116八(!细。"111601:7 。【31^*13^8,初版在1961年。 五六十年前的數理統計和數學非常掛鉤,這類蠻數學的命題,還是有一點市場的。 5 這裡面有一個次序問題。先做出第一點再做出第二點才是高手;雖然多半的人是先做第二點。 4


關於統計論文的撰寫

10

6

證明這件事不可能是可能的。這是(:.8*6111的工作 。這是個好結果,因此可以 刊載在好期刊上。但是,證明「不能做」某件事,因爲別的數學家老早就證明了 「只用 直尺和圓規不能做出三等分一個任意角」,8*6111的結果,就不能那樣的劃時代了。因 爲在三等分角的問題被解決以前,人們根本不知道「某命題不可能做出」這件事居然 是可以證明的! 旣然可以證明在樣本數仏爲固定時做不出來,那麼在孔不預先固定的時候昵? 816111的解法大概是這樣的:先取7^個樣本,做一些計算,再根據這^個樣本所算 出來的結果,來判斷是否我們還需要再取71 2 個樣本一視情況而定。在這樣的安 排之下,8*6111可以造出一個關於^的長度爲固定長的信賴區間。注意到,他所用的 樣本數不固定:有時是^ ,有時是 打1十712 0 針對同一個問題,5*6111就至少有兩篇好論文出來。但這問題並沒有結束:816111 的信賴區間是否可以做得短一點?是否已做到最短?是否可以做到1X^11181之外的 分布…。 這類的問題可以問得更深入。隨著問題的深入,題目也愈變愈窄。解法和所需要 的 數 學 也 愈 來 愈 難 這 在 序 列 分 析 ( ^ ( ! ^ 加 ^ ^^!^)裡,最後成了一個蠻特殊 的專題。 5*6111的工作,吿訴我們在樣本數不固定時,可以做出一些樣本數預先已固定時 我們做不出的事。這個結果在概念上給我們的啓發,遠大於技術面的貢獻。而其它諸 子的工作,就多半只剩下數學上的困難,就味道來講,就不免要弱一些了7。 我們再舉一個例子。在

這樣的寫法裡,我們基本上要要求(?^)是一個平滑函數。雖然我們可以對(^勻的 性質降低一點標準,例如在招 6 11181111積分中,如果6^是一段一段連續的就好。而 在1^ 6 8 6 116^1 6 ^ 6 3 積分中,我們只要求(?^)可以用來定義某一測度。但這樣的條 件不能降得太多。因爲(勻這一個符號,講的就是,如果將0(20 —小段一小段來 看(不論是對X軸還是對V軸),因此對它的某些連續性,總是需要的。 '感謝張源俊教授告域這件事。 '例如,在序列分析裡,因爲數據是(^!,^,...) 6 丑 0 0 , 問 題 的 數 學 結 ^ # ^ 多 。


第二章:好論文的特質

但 是 如 果 0 ^ 二8

11

^ ^ 3,810^111311 1110*1011,這個積分的問題便完全不一樣。這 8

是因爲除了它的隨機性以外,還是一個到處連續,但無處可微分的函數 。 這時,要能夠淸楚的說明白甚麼叫做

就是好結果1^0

9

〕。因爲要做到這一點,你必須跳出原有的對於積分的概念那類

的框框,而重新看到並梳理出一些全新的東西。有了重新的定義,才有所謂的「隨機 積分」這回事。

抓住問題的本質並說明 衍生性商品((^【^^〖^),指的是證券的買權或者賣權那一類的未來合約。這種 合約是可以交易的,而它的交易價通常是針對某一種上市股票的價格的變動而變動。 例如X公司的股價現在是30元,三個用後,我是否可以用每股35元的價格來認購? 如果可以,我現在要用多少錢來購買這樣的權利? 衍生性商品的市場値,現在已大於股市。是目前財務金融市場中最要緊的商品。 那麼,它的公平價格,應該放在哪兒? 這個問題在1973年 10 才有重要的突破。甚麼叫做公平定價? 一個重要的想法是: 這個價格要能使得交易雙方都沒有完全不冒任何風險而輕鬆獲利的機會。在818^ 和3^0163的論文裡,他們將公平這個觀念,用「有效市場中無套利」這個基本條件來 抓緊在一起。而在這樣的條件下用精準的數學來導出所謂的813^-3(^168公式。因 爲他們淸楚地將問題的本質抓住,雖然81^和13^0168所做的是最基本的0^01)6911 0^1011的定價,但這一點突破,卻是近代數理財務學中最關鍵的步驟之一。近十年來, 它都是最火的學科,因爲許多其它的較複雜的衍生性商品的合理定價,基本上也還是 要靠類似的想法來推導。 我們再換一個問題,問一下「甚麼叫做111&)1111^1011」? 8

問有沒有這東西存在?證明它存在,以及真正找出一個這東西,都是好結果。當然,你得是最早做出這些

的人,才有功勞。 9

原始的論文大概是1946年。當然,現在多半的關於31;0011381^〖116661^1011的審都會詳細介紹。例如1

^ ! . 8*6616 (^(^);!). 5100^1(18110 00,1011,1118 0,71(1 ^1710.11010,1 ^^1100,0,110718^ 0^1&1?1;61 6 , 8151111261\ 1 0 ^ 8 1 3 ^ &11^1 ^ ! . 50110168 〈1973》1?116 ^1:101115 0【015*10118 &114 001:口0【61七6 1 1 & 3 0 ^ . 7 7 1 0 , 1 0^ ^00710^

8 1 , 637-654,多半的關於數理財務學的教本都會提到。

?0^001


關於統計論文的撰寫

12

這個問題也不簡單,但我們不能平空來問這樣的問題。一個有效的方法是,先找 到一個有用的架構,然後再試著把這件事說明白。 不同的架構下,111&1111^1011有不同的意義。例如在統計推論的架構下,111& ^1011

一詞,指的是?181161:,8 111&1111^1011 。它的基本想法是,數據是用來做統計推論的,

而未知參數的估計,是統計推論的最基本的部分。因此,^181161:'8 111&1111^1011所看準 的問題是在問:對於未知參數的估計而言,我們最好能做到甚麼程度? 但對於通訊理論而言,問題的焦點就不在於參數的估計,而在資訊的傳達:一連 串訊號從人點出發,經過一個介面,再傳到8點,關注的是:有多少東西送進了八, 又有多少東西由8傳了出來? 爲了淸楚地說明這件事,我們首先得問「在甚麼情況下,通訊介面其實沒有傳遞 任何訊息」一換句話說,我們先得知道甚麼是0 ,然後才能知道甚麼是1 。 至於如何說明何謂沒有!11^111^011 , 一個比較合理的想法是先列舉幾個「不含 111&1111^1011」的合理條件出來。而在這幾個條件下導出61^0^的觀點。 以上基本上是81181111011

(^)的結果",這在通訊理論上是重要的一筆,甚至於 12

發展出一個專屬學術期刊來 。

客觀條件成熟時的總結 人的想和和基本解析能力,其實是差不多的。如果某一類問題經常困擾著我們, 那麼自然便會有許多不錯的學者去鑽硏它。他們的解法,也往往有類似的想法出現。 但每一個人的出發點不同,所面臨的數據結構也不同,因此看到的問題和解法也會有 些共同點,也有些差異。時間一長,功力深厚的有識之士,便會看出這類問題的眞正 癥節,從而能做一個淸淸楚楚的整理。這類的論文,是一種「集其大成」型的論文。 例如!^!!!^!^等 1 3 (^)在已有很多論文討論不完全資料如何處理後,才推出 21^-^011*11111 工1。.

,將計算1^1^的手段,歸結到兩個步驟。因爲這個集大成的工作,涵

31131111011 (!^^).八111^1161118,11081

4116017 。【。01111111111108^011,

3^16171

7601171100,1 70117710.1

27, 379^423, 62孓656, 12 1 2 2 2 IV&118^1011 0【1116)1-11181*1011 111601:7創辦於1953,是186^的招牌期刊之一。 八 . ? . 1)61111)31:61:, !^. ^ ! . 1^1x1 311(1 ! ) . 8 , 11111)111 ( ! ^ 了 ) . ^40X111111111 111(6111100(1 &0111 1 3

2^/1 ^^!:!^!!!!!, X 0! 110^0.11

5 ^ 2 5 ^ 2 0 0 ^ 800^ 8 , 39, 1-21 ^

^ 。 ! ! ! 口 ^ ^ (!&^&


第二章:好論文的特質

13

蓋面非常的廣,幾乎將所有的關於不完整資料的處理方式,一網打盡,從此變成經典 論文。 另一個在客觀條件成熟時才引起廣大迴響的論文是關於自助重抽法^。(^!;!^) ^^(!)的,我們知道,一般的統計推論問題已基本上可以歸納到「求出某統計量的 分布」。而古典的統計方法是利用解析上的功夫(包括大樣本理論)來計算該統計量 的分布。但解析的方法有限,當所有的解析方法都已用盡時,我們還有甚麼其它的方 法? 當電腦計算變得容易時,當幾乎人人都有一台時,當統計軟體變得普遍時, 這時總結出一套「如何利用模擬以計算適當統計量的分布」這便是自助重抽法,見 2 & 0 1 1 (^)1^

,這也是一篇經典論文。

新技巧的引入 有用的新技巧的引入,也是好論文的條件之一。例如&51; ?01111611519115&1111 (?!^) ,可以將一個需要。(^)次的計算,簡化成0(7110 6 一 。 又 如 ^ 9 X 1 ^ ^ 08110

0118111 1^01116

(^^)的想法,基本上將8^681811方法的罩門一後驗分布多半算不出來

―加以解決。這類的結果,當然會引起廣泛的重視。

當有一大類問題需要解答時 設限數據―1180^

是近代常見的數據,這尤其對於描述壽命長短的問題,

經 常 出 現 。 例 如 ! ^ - ^ - ! ^ ^ 6 8 ^ 6 ,這是對於一組設限資料如何找出合理的對 的估計量的論文。見1^)1811 311(1 1^6161 (^巧^

15

。因爲這類問題實在遇到得太多,

而且這也是很多關於如何處理設限數據的基本論文,它差不多是世界上被引用次數 最多的論文之一。 比估計(^〗更進一步,如何對於設限數據來做迴歸分析,那當然是更會讓人用到 的結果((:放1972乂6 。如果數據中還有一部分相依,類似的迴歸又要如何去做(^&^ 2 6 ^ , 1986乂7?這類的結果,是因爲太多組數據是這種形式而變得重要。

^ 14 15

8 ^ 5&011 (^!!). 8001511-^15 11161110^8:八!!。!;!^!1 100& ^ 1116』&01&III&. ^471710^5 (?/ 810.1X811.08

0,乙.1^3.1)1&II &11(1

7, 11-26.

^16161 - (!^已^). 1^011-1)8X2111161^10 68*111121*1011 &0111 111001111316*6 013561^3110115^ X (?/

^ 6 ^477167^0071 810.1181100,1 ^880010,11071 53, 457-481^ 16 0, 11. 0。乂 (^!^). 11661:6881011 1110(1613 &11(111&&&&!)^. 311858 34, 187-201 ^ 17

1 ^ 丫 . 1^13118

乙.26861: (^^^). 1.01161^11(111131 ( ! ^ ^ &11611^518 1151118 861161*8.1126(1 111163!' 1110^618^


14

關於統計論文的撰寫

還類好文章的來處 這類所謂的好硏究成果是如何來的?最自然的是因爲功力到了自然形成。當你 在某一個行業久了,你自然知道甚麼是重要的問題,甚麼是用一點苦功就能做但做出 來也功勞不大的問題。因爲爲了要發表,你需要做新的東西。如果你對當前的一般行 情都摸不淸楚,你能玩這類遊戲的資格還淺。學術發表,就是要走在別人前面。 我們常說,文章本天成,妙手偶得之。這一點,對於學術論文而言,往往不是這樣。 一般來說,妙手很難偶得。基本上,即使你已到了作戰的第一線,你還是不能太鬆懈。 因爲和你競爭的對手都沒有鬆懈。 王國維在《人間詞話》中提出境界一說。謂 古今之成大事業、大學問者,必經過三種之境界昨夜西風凋碧樹,獨 上高樓,望盡天姊。此第一境也。衣帶漸寬終不悔,爲伊消得人憔悴。此 第二境也。眾裏尋他千百度,騫然回首,那人卻在,燈火闌珊處。此第三境 也。此等語皆非大詞人不能道。然遽以此意解釋諸詞,恐爲晏歐諸公所不 許也。 有人說做硏究亦然。我比較相信前面兩個境界,那指的是苦讀和迷惘。至於頓悟 卻是少,畢竟硏究工作是靠邏輯、實驗和計算哪。 這類所謂的好文章很難敎出來18。畢竟,大部分的科硏工作都是苦哈哈地做出來 的。我列舉這些例子,主要是給大家看看:甚麼叫好。如果你覺得這些離你太遠,也不 要灰心傷志,因爲其它的大部分文章,都不是這類水平。 我甚至覺得,若是在所有有硏究計畫的學者中,有2艽的學者能到這種程度,則 國家獎勵學術的經費,就沒有白花。要國家獎勵學術的經費沒有白花,談何容易啊! 最後,我用一小段引文來結束這一段。第一段來自《東周列國志》: 姬平乃歸燕都,修理宗廟,志復齊仇。乃卑身厚幣,欲以招徕賢士,謂宰 相郭隗曰:『先王之恥,孤日夜在心,若得賢士,可與共圖齊事者,孤願以身 73, 13-22. 這一章的例子,我都是「取法乎上」。這類的好結果如果做出一個,在海峽兩岸都應該可以當選一個院士。

8107116^(1 18


第二章:好論文的特質

事之,唯先生爲孤擇其人。』郭隗曰:『古之^,有以千金使涓人求千里之 馬。途遇死馬,旁人皆環而嘆息,侍從官問其故,答曰:「此馬生時,日行千 里,今死,是以惜之。」涓人乃以五百金買其骨,愛負而歸。人君大怒曰:「此 死骨何用?而費吾多金耶?」侍從官答曰:「所以費五百金者,爲千里馬之骨 故也。此奇事^1务競傳,必曰:『死馬且得重價,況活馬乎?』馬且至矣。」不 期年,得千里之馬三匹。今王欲致天下賢士,請以我爲馬骨,沉賢於我者, 誰不求價而至哉?』

國家出錢買科硏成果,是不是這樣想的呢

15


第 三 章 . 一 般 論 文

在功力不足時寫好論文較難,但前面說過不能等一切都預備好了再寫論文。這樣 做眞可能一輩子都只是做講師助敎授。因此,新手上路是必須的。並不是說新人就寫 不出好論文,世上大有聰明的人,極年靑時就光華燦爛,引人注目。我們當然希望最 後大家都有較大的學術貢獻,但目前我們且把身段放軟,將目標別定得那麼高。 如何寫論文是次要的,如何找題目才是眞的。現代網路發達,只要蒐尋的方向是 大略正確的並且妥善利用圖書館和它會間的館際合作,年靑學者並不難找到相關的 學術資訊。

別做學位論文的推廣 畢業論文裡往往有最後一節:未來的工作或今後硏究的方向。你當然會很自然 地去做原論文的推廣,不論怎樣,這是你還算熟悉的專題,何況你的博導說不定還會 給你一點指導。 我的建議:別走這條路;或者,至少你別希望靠這條路多寫幾篇論文。 理由是有一些的:第一,這往往是沒有多大前景的題目。學位論文是用來訓練硏 究生的硏究方法、態度和寫作技巧用的,而訓練的意味大於硏究的意味。你的博導知 道你大概做得出來,或者至少他自己知道他一定會做得出來。這樣的題目做練習可 以,做硏究就有一點不夠難。第二,如果你仍然倚靠你的老師,請問論文將來要不要 掛上他的名字?如果要掛的話,是你排第一還是他排第一?我其實並不十分反對老 師和學生合寫,畢竟老師在學生身上用了不少時間指導,因此在學生的論文上掛一個 名字也算應該。但我覺得三篇以內還算可以,超過此數就有一點過了 一學生更要


18

關於統計論文的撰寫

考慮升等,硏究項目等世俗上的事,聯合而寫的論文,尤其是和自己的老師合寫的,在 學術評鑑上是會被打折計算的。道理很簡單:升等的最重要的要求是「該員有沒有獨 立硏究的能力」。獨立者,不靠別人自己單幹也、第三,老師的題目,如果他是這個專 題的專家,你多半做不過他【和師兄師姐〕。靑出於藍談何容易?別忘了這些人都是 链垂去 挪甲《。 簡單地說:要長大,先斷奶。

數據和論文 統計學的論文分爲兩大類:有好數據的和沒有數據的2。做沒有數據的問題比較 簡單,作者基本上只要提出,對這個問題,入做了甚麼,6又做了甚麼,但他們都沒有 做 出 結 果 0 。你只要把0做出來了,當然就算是硏究有成果。這在人,8都是有名氣 的學者或敎授時,你的理由就更充分了。做這類問題,最要緊的是你手上的數學計算 的功夫要好。海峽兩岸出身的統計學者,在國外好期刊上經常有論文的,幾乎沒有人 數學不強的。 只要數學夠強,你可以放心大膽地一再把條件減弱或者計算得更精細。例如某 人證明了弱收斂,你就做強收斂,或者進一步去算它的收斂速率,甚至大離差^^伊 (!^^。!!)的結果…0 下面我舉一個例子,是關於1^1)1811-^6161 68*111121*6

(^^)的,前面已大略提過。

的故事 給一組「隨機設限(!:^&!!! ^^(^(!)」的數據: (!!^!^6^, ^ ) , 11(1《1, 2, , , , , 71 其中乂《∼?;

∼《^ ^

。若^ : 1 , 則 我 們 只 看 得 到 & 的 値 , 此 外 ^ ^ 0,

我們只看到的値。主要的^的是尋找^的估計量。 如 果 所 有 的 6 = 1,則我們能看到所有的&的値。此時,沒有因設限而丟掉的 1

在某些單位,「沒有811181611*110!" 口叩6!"」是研究能力的重大瑕疵。 如果你只用某些老掉牙的數據,如81111 9901: (!^&, 1118 (!&1∼^116 1^61: 6&1&等,不算是有數據。

2


19

第三章:一般論文

値。那麼 71

^ 1 3

是最傳統的估計量。關於压的性質,已經太古典了 ,而這由二項分布和丁及相 關的大樣本理論就知道。簡單地看,這是以X的形式出現的統計量,能夠做的數學, 大概都已經做完了,如果還剩下甚麼,都難得要命。 但 是 對 於 而 言 , 因 爲 有 幾 個 ^ ^ 0 ,有些&是看不見的【實務上的說 法是我們知道不〉6 ,我們只看到^

的出發點反而是風險函數

^!!!^!!)。若X 〉 0∼?是一個不會爲負的隨機變數(例如壽命、則

、,

X〉。

叫做X的風險函數。利用微積分可求出

如果將上式中的積分用一段一段的求和來表: & ( ^ 《 ^ ^ ( 巧 ) 厶

則有 ""厶

00

3

是一個由「求連乘積」的方式來表現的。的結構,就是一個由引出來的連乘 積的形式

^ ^ ^ [ ( ^ ^ ^

(^)

其中^-!!!!!^&,^^,;^ 1,2,∼,71 公式的源遠流長,但之前的工作,如涓涓細流,可是到此之後,氣勢一變。關 於對設限數據求^(^的估計的問題,甚至於一般地對於設限數據的統計推論問題, 都有了開朗的看法:原來我們得從風險函數入手,而不是從「算術平均數」的角度來 看問題!這就像人類一直都在用模彷鳥類的角度來設計飛機,一直沒有成功過。直到 3

~ 意思是,別在裡面找題目了,因爲幾乎都挖光了。


20

關於統計論文的撰寫

萊特兄弟的定翼飛機機成功了,人類才忽然懂得:不能學鳥4。因此航空工程才能突飛 猛進一樣。 ^-皿和^ 6 1 6 1的文章,好像是忽然將問題的「任督二脈」打通一樣。自然後面 就跟了一大堆補強、加註、推廣的文章。那是五零年代的末期,搶做論文的風氣還不 太烈。下面我舉的例子,多多少少可以讓大家看一下怎樣去搶(還不算太糟的)題目。 有了 !0^6:這樣的公式,甚麼時候可以大方地用它? ^ 的 1 9 5 8 論 文 中 的 條 件 是1:811(10111 0611801111 6

,這並不能一定保證,在實用上能不能更寬些? 一個較好的結論

是:如果「設限」這件事不會影響到未來的壽命,則的公式是可用的。用數學 講,就是 ^

6 [力,力十^]!^

?(义6 [^力十IX ^^0^力).

(^)

這樣的條件有明白的直觀意義,比^!!&!! 06118011116 要寬鬆 5 ,這是蠻有意思的結果,

當然値得發表6。 但這樣的結果就沒有問題?記住,「找題目來做」的技巧,有一部分就是挑毛病。 要挑毛病,即使別人沒有毛病,也要努力去挑。有人問:這樣的條件(^)是不是可以從 所給的數據裡撿驗呢?這不是無聊的問題,即使答案是負面的,也有它的意義。答案 眞是負面的,當然能講淸楚這一點,也是可以發表的7 。這個結果當然重要,因爲它, 我們只能利用數據的背景來討論是否可以用。因此,取樣前的行政作業規範, 就變得重要。 你可以更進一步,挑出估計得很差的情形來說8。這樣的論文,當然需要 ^已經被公認重要時才有價値。否則,我隨便發明了一個估計量,或者一個根本 用不到的估計量,好或不好都不重要,有甚麼好討論! 較容易問的問題是它的數學性質。這裡有一大票論文 9 。最直接的是110^181叩4 5

7

另一個原因是當時的工業水平不夠,機^:率太差。 並且,很多其它的設限方法,在這樣的餅下也可以用。 &11)11618011 911(1 1 ^ 8 0 ^ ^ ( ^ ^ . 5 1 0 7 7 1 6 ^ 0 9 87-90, ^51&418 (^^).尸^5

8

?61;615011 ^197&).尸^45

9

72, 20^22,尸』、^5指的是美國科學院的期刊,1011)301;

0『是很高的。

73, 11-13. ^ 名 人 行 爲 不 撿 , ^ 有 市 場 的 。

這我就不一一列舉了 , 找 一 篇 較 近 的 關 於 ^ 1 4 8 在 1 8 上 的 文 章 , 從 它 引 用 的 文 章 裡 向 後 找 , 總 能 找

到一大群論文。


第三章:一般論文

21

5)10X11113,^1011 0: ^ ( 乡 " 0

~ 分 。 ) ) ― 0 3 , 1 1 8 5 1 3 1 1 ^1:00655

證明某統計方法數學性質的工作是可以做的。但愈來愈難做,愈來愈難發表,而 且學術上的影響愈來愈小。那樣難,除了那幾個不太識人間煙火的象牙塔中人,誰看 哪當然,如果你眞的快手快脚,又有幾下獨門絕招,這遊戲還是可以玩的。 做這類學問,需要效率。你需要眼明手快一眼到、手到、心到。這是因爲有極 大一批學者在幹類似的事12,因此只要有一點有氣味的風吹動,這批人(包括他們的 學生)就可能撲上來搶做。你若是慢絲條理的,這口飯就有點難吃。 跟別人搶快的另一個條件是題目紅火的程度。一個好專題在開始的時候,尙待開 發的部分還多,你只要夠勤快,機會也會有。過了一陣,這個專題中容易做的部分很 快地被一掃而空。也許這個問題已經被充分了解,學術期刊的編者會覺得這個題目不 再有趣並且還有更重要的熱門專題要討論。聰明的人就會考慮下車,尋找下一個目標 ―以上是「業績掛帥」的幹法。對學術不是沒有貢獻,但一般沒有大貢獻。愛因斯 坦說,他最不想見的,就是一大堆學者拼命在軟木頭上鑽洞! 當然,即使在問題的晚期,你也可以做出一些能發表的結果。但僅就投入卩產出比 來看,是比較不合算些。有時你也可以做出相當重要的結果出來:如果人,8, 0 … 等 作者,在討論別的部分都很淸楚,但到了某處你想弄淸楚的地方,言詞就東閃西躱沒 一句有氣力的話時,你就知道那是一個需要突破的關鍵點:如果你能將它搞淸楚,做 得出(包括證明做不出、總是會有好處的。

先拿到數據再做問題 首先我得說拿到新數據並不容易。工業上的數據難拿到,因爲廠家有業務機密 要保護 13 。其他科學家辛苦由實驗而得的數據,更是他們的寶貝 14 。而過去已發表在 10

8 1 6 8 1 0 ^ &11(1 0 1 0 ^ 1 6 7 [ ! ^ ) .

汾"^., 437-453,到了現代這種題目已搶不到了,因爲作者若是

自己不證,多半論文就登不出去。研究工作者的日子是愈來愈難了。 11 又一説法是:很多期刊是掌^&這類學者手上的,因此這類論文反而更有機會。 12 這是支持學術期刊的主流人群,因爲要做有眞貢獻的工作不易,做看起來有貢獻的且又挑不出毛病要容易 多了。數學暗示困難和嚴謹,這至少就是11 0 1^1^皿。 13 —種是眞的機密,競爭對手可能因此而得利;另一種是假的機密,他們其赏是在用簡單的手法,但也不想 讓外人知道。 14

實驗室間的競爭,因爲和項目經費有關,也很厲害。


22

'論文的撰寫

公 共 領 域 ^ 1 1 0 ^!!!^)的數據,多半是原始的資訊,都已搾乾。拿來驗證你的新方 法可以,但對於原來的科學問題,已貢獻不大。因爲別人的功力也不會差,你不見得 會分析得比前人要好。 較好的數據是來自你參加別人的硏究圑隊。這樣,你就在問題的早期就切入,參 與數據的規劃蒐集,和專業人士直接對話。何況眞實數據,即使是經由統計學家的設 計蒐集,也很難不會發生問題:取樣的獨立性不能保證,資料未必完整,套不進現有 的模型,殘差的變異過大或者全然不像是常數…。只要你投入,就會發現敎本上的 技術都用不上,而這就是你發展新工具的機會。 這是一個統計學者的正途:在別的科學硏究裡找到硏究的生命力。一開始要打 入別人的圑隊較難,但等到你漸漸有了聲望、名氣和口碑,上門求敎者會讓你有做不 完的項目。但你要注意到別做簡單的工作,那樣你只是別人的雇用人員。已故的名生 物遺傳統計學家李景均15說:"! ^ 0 1 1 ^ ^ 0 ^1-8^3X6,,,意思就是說:要挑嘴,不要甚麼 都吃。 最糟的事是:辛苦做出一點結果,投稿時評審問:有沒有1681 (!^?你東翻西找, 哪裡可以找到剛好可以套進你的新模型的實數據?這在你做純理論的工作時還好,至 少還可以模擬。在你做號稱應用的統計問題時,這就夠你喝一壺了。初入行者最易犯 此病,切記切記! 有眞實數據的論文,其實是比較有意思的。所謂數據,最好有重要的學術上的或 者生活上的背景。例如你如果弄得到中國衛星掃描而得的數據,或者奧運選手的訓練 數據,就算你用較淺的統計方法來分析,只要基本正確,英文再淸楚些,發表不難。如 果是神六數據或者關於靑藏鐵路的數據,當然就更別說了。 數據最好不要太標準。如果套進迴歸軟體就有好結果,這樣的論文誰會要?你需 要複雜些的、有結構的、可以至少用好幾種近代模型的、最好背後還有一些有科學意 味。一開頭,模型簡單些不妨,然後漸漸放寬條件,做較複雜的分析一有一組好數 據,可以玩好幾年呢。下面我舉一個自己的例子。

15

李 景 均 ( 匸 ^ 0,

^^^),原是北大教授,1949年後因爲規定要用唯物的觀點教遗傳學,跑到美國

寫論文固然重要,執著於學術的本贸,才是眞科學家。前人遗風,心街往之。


23

第三章:一般論文

火工件的故事 火工件指的是有火藥會爆炸的東西。爆炸通常由某物的引發,如通電。電有大小 強弱,因此引發與否,是和^688有關的。這問題是和計量嚮應(^皿^ ^ ? ^ ^ ) 是 16

一類的,只是火工件的對象是爆炸,後者是白老鼠餵藥 ,看幾週後腫瘤是否夠大。 對於計量嚮應,有興趣的部分是分布中間的部分:多少藥量,可以讓50^的老 17

鼠產生夠大的腫瘤 ?對火工件,有興趣的部分是分布的尾部:多大的電流,可以讓 99.99^0的火工件都引爆? 我能拿到一組眞實數據是因爲手上有一個項目。關於!±1^7 ^ ? 0 1 1 3 6 的 數 據 , 至 少有一甲子的硏究了,書都有好幾本18。因此在一九九幾,理論上可做的硏究不多19。 有了數據,如何寫論文?應付原來的委託單位(^)不難,我們只是把近60年 的東西捕足了,告訴他們到目前爲止最好只能做到哪兒,再出一册中等長度的報吿就 好了。不論怎樣,原委託單位只是靠一本美軍手册,而那手册主要的理論根據是1948 的一篇論文 2 。。我們先將問題套進一個^8X1^ 0118111中(看起來就較深了,因爲沒 有〖11(161)611(16^6

^然後再發展理論,用自助法(^⑨^!:叩)來做所要的信賴區間,並

爲了提高模疑的效率,弓I入!!!!?^^^ ^ ^ ! ^ 的 觀 念 , 搞 出 一 個 自 己 叫

11111501*9111;

16-581111)11116的法子來做。經過模擬,用傳統大樣本方法所得到的95冗信賴區間大約 只有90冗左右,而我們的法子眞的差不多做到95冗 2 1 。 這有甚麼了不起?學問上是沒甚麼:論文裡很多部分的技術都是在文獻裡找得 22

23

到的 ,但我們有眞數據 ,眞問題,發現老方法的不足,並合成一些較現代的方法 ( ^ ( ^ ^ 叩 和 ^ ! ) ^ ! ^ ! ; ^^!!!^來改進老問題,這些「功勞」就足夠我們覺得可 以寫一篇不錯的論文了。這就是先有數據再動手硏究的好處。 這只是一組小型數據的故事。但如果你參加了一個3-5年的計劃,其中有5000 16

藥量就是5^638 。 這叫1X^-50 。 18 國内有劉资光(!^^):《敏感'1^1:據分析與可靠性詳定》,國防工業出版社。這書蠻實在的。 17

1 9

^ ^ 1 1 有 幾 篇 從 0 0 8 的 觀 點 來 做 1 ) 1 1 1 ^ 168 ? 01186的文章。這也是選題的一法:硬套進鞋裡,套

得進就是結果。 20 0 ^ 0 1 1 311^ ^100^ ( ^ 必 ) . 1 ^ . 3 ^ 4 3 5 109-126.所以,你該有一點僅,所謂「機密」,有時會是甚麼事吧? 2 1 0 1 8 0 31101 ^ (^。(^). 31(1滅0(1 517110^ 11, 1-21. 22 其赏,論文大體都如此,哪能全都是新的?有一兩點新意就不錯了。 23 指首次使用。


24

關於統計論文的撰寫

份問卷,分三年完成,那你可以拿來玩一下的數據就夠用好一陣子了。

需讀書時要折節 關於科學意義,如果這個科學有較大而長期的潜力,你就該考慮用心補上一些足 夠的背景知識。例如生物遺傳是近年來最紅的專題,就有些極好的華人統計學者,自 己找生物敎本來弄淸楚基本生物學一因爲這樣你才能面對著生物學家來談他們 的問題。更重要的,你較會知道他們的問題裡面,生物學的意義有多少。

氣不可衰 一般論文指的是雖不見得是最好的,但最後還是在最好或中等以的期刊上能發 表的論文。因此,請勿小看它一沒有這許多一般論文,也襯托不出那少數幾篇突破 性的結果。古人說千軍易得,一將難求。像岳家軍、戚家軍這樣的精兵是可以訓練出 來的,但岳飛、戚繼光卻是天生的將才,這種菁英自己會成長,用不著我們去擔心。硏 究的結果也一樣。好結果難,多半的結果都是一般的。但它們做了一件重要的事:把 問題週邊的枝枝節節都淸掃乾淨,因此留下未做的部分都是較難啃的部分。 因此,即使你也在做這類「搶食大餅」的工作,也不必輕看自己。因爲你畢竟還 有些貢獻。何況這類工作並不容易,世上的高手如雲呀。 做硏究除了本身有趣之外,就是還得撑著一口氣別放鬆了。做一些大家都做得來 的工作並沒有太糟,但你不能一輩子總是這樣幹。 你也許在想,等我升到敎授,就改走行政路線,系主任、所長、院長…一路幹上 去。話是不錯,的確有人的生涯規劃是這樣的。但是世事難料,別忘了在大學,敎授是 本職,其它行政業務都是兼任^4。如果你到了五十歲,爭取某一個行政職位失敗,前一 個職位任期已滿,不得已還是得回到本來的系,那時候年靑的學者已趕了上來,正是 「長江後浪推前浪,前浪死在沙灘上」。這時,若是沒有一些有功底的作品,你在那個 單位裡如何走路有風? 在學術單位裡,學問是一輩子的事。

倣較難的問題較有成就感 起碼台灣是這樣。


第三章:一般論文

25

這話當然不必我說就懂。你可以做幾篇或甚至幾十篇搶快型的文章,但心中最好 還是有一兩個較難的、希望能突破關鍵的問題擺著。在某一個專題久了之後,週邊的 問題都搞淸楚了,偶然來一個突破還是可能的。 我一般不鼓勵年靑學者做大猜測(^!!』^!!^)25或有名的未解問題(。^!! ? 1 0 ^ 。小敎授提出的01)611 ^ 1 6 1 1 1 ,學術上的份量也許不夠,做出來功勞也不大。大

敎授提出來的,往往眞正困難。他做不出26多半你也做不出。下面的問題是0?611的, 感謝林國楝敎授給我這個題目。

給一個小題目 令 卩 ② ^ 〔1十^-勺-1, 3; 6 II 。 這 是 所 謂 的 分 布 的 。 取 ^ , 义 2 , ^ 3 ∼ 11(1 ? 0 再 令 〈 ^(^) 〈 ^ ^ )

爲它們的次序統計量(。!^枕"^!&^)。取 ?7 ^ ^ ) , V ^ ^(^(!)十^)) 則可以證明V, V有相同的分布。但這個命題的逆定理是否成立? 1.6.,若設^,义2, ^ 3 ∼ 肘 ? , 取 & V如前,如果卩,V的分布相同,問7是否恰好是10615*10 ? 這題目我不建議你去做,道理很簡單:林敎授在這類問題上至少有二十年功力, 他若是還做不出,肯定是難的。當然,你若是能嚴謹證明,發表應該是沒有問題的。 新意 競爭的目的是汰弱留強或者變弱爲強。光是要求301/3301期刊,已相當能夠汰 弱了。這些期刊對於海峽兩岸的學者而言,大都沒有甚麼人情可講,如果論文沒有太 多的新意,英文講述能力再差一點,這對於國內上千個大學裡的學者敎授,已經是較 難的障礙。這裡面,最難的部分是新意。新意有大有小。好論文有大新意,前已述之。 一般論文多半只有一點點的新意。 你怎麼知道你所做的東西是新的 27 ?主要的是:你必須知道你現在做的硏究專 25

好在統計學裡沒有甚麼大猜測可以钹人一夜成名。 多半他的門人弟子也做不出。 27 —個方法是先奩一下1^012 &11(1】011115011的^710^010^1(1 0^ 510,1131100,1 3016X10^計九冊,是一個蠻中肯 26


26

關於統計論文的撰寫

,的現^況,才能知道你想做的方向、你的點子(〖(!^),是不是已經被別人做過了,是

28

這在大家不怎麼重視論文發表時 ,情況還好。但現在大家一窩蜂要求發表論文, 競爭的對手太多。別人不見得笨,壓力不見得小,硏究資源和環境不見得差,你看得 出想得到的點子,別人也多半能看得出想得到。如果問題的難度不大,除非你的速度 比別人還快,你的機會也不見得有多高。國人所佔的便宜是數學訓練較強。這在以前 是大便宜,但現在太多的華人學者在搞統計〖和相關學門)的硏究了,這些人也不見 得人人在前五名的期刊上發表,因此競爭下來,國內學者也未必在「數學較強」上佔 優勢。 所謂「新意」,因爲人人都在要求,所以一般對於新意的要求,其實也不可能有那 麼嚴:一你只要能淸楚說明你的新意在哪裡就是。重點是你得說得明白,而且在論 文的前兩頁就說明白。

緒論的重要性 這裡說到了論文中最要緊的部分:摘要(^&!:^^)和緖論(!^^^^!!)。摘要 因爲短只要說重點就好29,問題不大。緖論則不然,這是最難寫的。 當學者埋頭做問題的時候,往往是當他循著某些思路一路向前,尤其是在有一點 靈感的時候。如果你做到某一個深度,做研究基本上還是有趣的事,有時顧不得去找 是否別人有類似或相反的想法。但這在論文的緖論裡,你就得在兩三頁的範圍裡講淸 楚這個題目從第一篇論文起到目前爲止的概況。概況不是目錄,你得說出(用較乾淨 的英文)誰做了甚麼,結果有沒有影響,誰貢獻最大,誰又跟在後面但也有功勞,這些 與你目前論文的關係一一這一切只是要表現你是如何的專業。要用明白的話說明你 的貢獻在何處,但又不能用自己誇自己的句子。這一方面是禮貌,一方面是規矩:論 文要用大心機寫,但得表現出平常心的樣子。平常心,指的是客觀和不帶感情。 這裡面學問可大著哪,一時也說不完。當你漸漸有名而在較好的期刊上投稿時, 別忘了你面臨的評審者都是這一行的專家,並且,更重要地,他們都是你的競爭對 的開始點。可找到很多專题過去的關鍵掄文。再去反查0^^071 /^幼,便可回溯到近年。這兩種資料都贵, 要靠一個好闼書館。^現在別的競爭者的工作,那就全靠你自已的本事了。 28

如五十、六十年代。

29

據^大要求學位論文的摘要至少三千字,是有點多。這樣,讀論文的本文哪?


第三章:一般論文

27

手。「行家一伸手,便知有沒有」,^你拉出來的架勢,已差不多決定勝敗。因爲大概由這 裡已可看出你是一個靑澀的菜鳥還是一個戰鬥經驗豐富不可輕侮的高手。何況這裡 面還包含著學門和學派間的恩怨30,因此有些文章你是要捧的,有些是你是要罵的。 捧的時候你要維持做一個學者的尊嚴,要恰到好處而不帶諛詞31,罵的時候要尖酸刻 薄不留餘地地突顯別人的缺點但還得顯出溫柔敦厚純學術本位的樣子。你以爲只要 結果好就沒有問題,是的,眞正的好就大概就沒有問題。一般的好,還得看江湖上的 朋友是不是肯高抬貴手。 同理,別人文章的緖論,也得好好讀。第一次不妨馬虎些,讀完全文以後,如果你 覺得這文章還有點意思,再回頭讀一次該文的緖論。問自己三件事:第一,這文章的 主要賣點在哪兒?第二,作者怎麼想出來的?第三,現在你已經「懂了」,請問若是由 你來寫,這緖論該如何寫? 這和硏究學問的關係不大,但和你的論文接受率有關。懂得化妝的女子,找到愛 情的機會大些。投稿相當於「求售」,即使是和氏璧,在未打磨包裝前都一再碰壁。文 章不注意潤色就投出去,等於穿得一身邋遢去做面試會談。一便縱有千種風情,更 待與何人說? 一篇論文的緖論,和一個人的面孔一樣:別人第一眼就要看的,而印象 好不好對下一步決定的取向,可是有極大影響的。

要 有 所 影 響 ( ^ & ^ ^ 311 !!!!口^) 最好的論文開創新域。大如相對論,對整個的科學投下重磅炸彈。小如前述的 &1111^1011 ^ 6 0 1 ^

,也開拓一個特殊的專題。其次的論文,在突破一個重要的關卡之後,

前面是一馬平川。例如11X^3

16111111^

,爲隨機積分舖下定石。再次是當某類問題已日

漸成熟,經過深思熟慮的梳理之後的集大成之作。 能做這類論文的學者,根本用不著我們去擔心。但即使是一般論文,也該極力地 求新求變,希望能對原來的學門產生影響。我們且不談眞正的科學貢獻32,只是爲了 世俗的目的:爲了能在較好的期刊上發表,得到較多的引用一^^!!),得到同儕的 認可,得到國家的獎助,得到學術上的榮譽等等,你就得出盡絕招,求新求表現求有所 影響。因爲「是不是有影響」才是我們對學術硏究是否有意義的基本考量。 30

你以爲拒絕過某人或某人學生的文章,別人眞的不知道?學術國子其實很小,有些人眞的不怎麼上道。 有一次某文章提到我的某論文,説我做了八又做了 8 。但我確實沒有做6 ,反而因此拒絕了那篇文章: 他沒看懂我嘛! 31

32

—般的論文,本來貢獻就不可能大。貢獻大的都是好論文,這是定義。


28

關於統計論文的撰寫

判斷一篇文章有沒有新意,可從幾個簡單的角度來看 33 : 是否有新的資料,新的 觀點,新的切入點,新的分析方法,新的發現。 判斷一篇論文是否有賣點,也是看它是否能有所影響。因此作者要用心去強調他 的論文確有影響。當然,有沒有影響是在論文登出來之後,別人才會去讀,而且讀了後 會去用才會漸漸地爲學界所知。因此目前誰也不能眞的確認,也因此你就該誠實34地 極力鼓吹35。 在論文裡不要謙虛。不要說自己的結果不重要,儘管你心裡也許會覺得如此36。 外國人常明白地吿訴學生:^6

1)031^6

!",多講你的成功,別說你的失敗。

懷疑論 做硏究時的基本態度是誰也不要相信,甚麼也別相信37:例如一般的論文中號稱 的好結果,別人給出的(^!^&!!^ ,論文裡的定理和應用,你的系主任,院長甚至博導 所吿訴你的事。因爲他們可能會錯,會不周延,會省掉某些條件,會條件太強,應用範 圍不廣。 爲甚麼要懷疑?因爲如果這些人都是對的,都已做到最好,那麼你除了趕快換題 目之外,還能做甚麼?因此你必須用有色的眼光來讀別人的論文,用懷疑的態度來看 科學的命題38,用別人沒有問過的問題來拓展自己的深度。題目要自己挑,因爲別人 給的,可能眞是殘羹剩飯。 但天底下甚麼題目都能做,甚麼都不能做。明明是死棋,你也可能走活;明明是 活棋,你也可能走進死胡同。信心和硏究能力都是靠跌跌撞撞培養出來的。

33

以下幾點由管中閔教授的一篇講稿中引用。

34

不要講你自己都不信的話,專家還是很多,還是要回到學術面。因此,沒有狼,不可以^了 ;但若有狼,

可以説大惡^^了。 35

中山先生革命時,若是《艮搛虛地説滿清#雖然腐敗但仍擁有極大的資源,參加革命多半會死,誰會

去玩命?但若是將建國大綱,五權憲法這些搬出來,再説滿清是唯一的阻礙,且已千疮百孔,則前景就完全不 同。七十二烈士有幾人讀過三民主義的全文?他們多是只聽到了孫先生的111忱0^^1011! 36

這在你原來有一個大目標,但只做出來一個次要目標時,心中多待覺#^此。

37

這一^I:利用#進教授的講稿改寫的。 例如在某演^^到某問題可以做或者是01)611時,就要多考慮:多半是雞肋。

38


第三章:一般論文

29

再說懷疑論 這等於是上一段話的(^^^^

。因爲別人論文的好處別人自己會說,因此他們

不提的部分一也許是忘了,也許是沒有想到,也許是故意39 ― 才 是 你 該 注 意 的 。 1^3,1)1311和^616【沒有說在隨機設限之外,是否可用,這就成就了 !^^^&61811和 的文章;而1^811^61811和1\^01^7也沒有說出他們的條件,是否可由1^1^^ 的數據來檢驗,這就成就了 7 8 1 ^ 8 的 文 章 。 這些文章的題目都由懷疑而來,這類的結果,不是挑錯4。,而是補強、拓展和更淸 楚的說明。因此即使文章交給原作者去審,多半也不會引起反彈。

39 40

包括他自己還留一手預備寫下一篇論文。 理論上,如果你説某人的結果是錯的,他應該「聞過則喜」才對。可我就聽過這類文章被一票人圍堵的故

事。江湖中,固然有俠士,也有拉絮結派的黑道。


第 四 章 : 動 手 作 文

沒有硏究結果就沒有論文。有了之後,寫論文只是將你的硏究結果,淸楚地吿新 別人而已。對學術論文而言,你的讀者是學有專精的人士,你的結果是實實在在的科 學結論,因此你不是寫詩,不是寫散文,甚至不是一般的論文I學術論文要說得淸 楚明白,沒有不相干的話,基本上要以容觀的立場敍事,而且遣詞用字以不帶感情爲 宜2。 邏輯次序 假如你已得到人3,0三個結果。你在做硏究時,因爲你對於問題背景的熟悉,思 想方式可以跳來跳去。但是讀者雖是專業人士,卻並不是你。因此你得將結果的邏輯 順序弄淸楚。 簡單地可以這樣想:如果你要將結果講給學生聽,你該用甚麼次序?是不是先弄 懂8,才能弄得懂人?在0中所用到的的幾個名詞,在甚麼地方引入最好?「你的學 生」是還不錯的模擬對象。因爲他們有點懂,又不眞懂。至於讀者的程度,可以假設 他們有一個計量方面的博士學位。 先粗具規模 寫論文也是作文,但目的是講故事:將你的硏究結果講給別人聽。因此,成果第 一,故事第二。先將成果依邏輯次序列出來,然後用文章將它們連起來。將想講的其 1 2

例如報紙上的社論,或者《古文觀止》上的那種古典論文。 有時,像「感謝某人的討論」、「慶祝某人七十生曰」之類的句子是可以加上的,但不在正文。在正文裡還

是 要 一 本 正 ^ 學 問 。


32

關於統計論文的撰寫

他各要點一一列出,試著替它們安排適當的出場點。前幾次的稿子可以疏漏,但你得 一遍一遍地潤色,到最後打磨光亮爲止。 這樣的方法,適合於你自己用電腦軟體來打自己的論文。因爲在軟體上修改和打 印都十分容易,所以你才能一次一次反覆地修改到滿意爲止。這和幾十年前,你要把 手稿交給打字員完全不一樣。因爲那樣一來一往,至少一個星期。我們要儘量發揮近 代科技的優點。世上有些學者的本事大,他們第一遍的手稿就和最後的定稿差不多。 如果你有這樣的本事當然最好;如果沒有,不妨學我。自從開始用軟體寫作以來,一 篇論文1^(1^6十次,是常有的事 3 。 初具規模就去動手拉開文章的架勢的好處是:它讓你「下決心去寫」這個步驟, 變得容易 4 。 萬事起頭難。若要不難,胡亂起一個比總不開始要好。

從第二節開始 寫論文要從第二節開始寫,用心讀論文也是從第二節開始。何以故?因爲一般的 論文,第一節的緖論只是誇說自己的結果多麼好,別人是如何有缺點而已。眞功夫在 後面(有時甚至在某一個放在附錄的16111111^裡)。緖論需要用心化裝舖排,但化裝舖 排也會掩蓋缺點 5 ―要眞懂,還得自己去用心讀。 最後才去寫緖論。緖論(!^^^^!!)指的是「介紹」一將你的內容介紹給讀 者認識。因此先有內容,才能介紹。 基本格式 論文的基本格式,大體相同。雖然各期刊都會有一些要求,投稿之前,去找一本 近期的目標期刊,讀一下它的「 1 1 1 ^ 1 1 ^ 0 1 1 10 ^015」,就差不多知道了。你其實還 得去讀一下該刊的「編輯方針(^叩叻」,他們多半會說明他們喜歡哪一類的文章。 論文多半以節(幼&^)來分,而不是以章(^叩^)來分。章比較長,在專書裡 3

當然,八4的紙就用了不少。可是^I:你項目經费城該花的錢,並且不能算贵。

4

我做學生時,老師的教導是:沒有好結果就別寫一寫爛文章是丢人的事,有尊嚴的學者是不做的。但

現^^如此推動發表論文,大家有甚麟法?我現在只能主張大教授別甚麼論文都寫,總要有點品味骶? 5

記住,誰也別信。


33

第四章:動手作文

常用;而節較短,因爲一篇論文,一般只針對一個專題。 節之下可再分小節(^!^^。!!)。有些人還要分小小節(^!!^^!^^。!!),我覺 得是太細了 6 。好一些的論文,在某節節尾,常會說下一節會討論甚麼一語氣是隨 著本節的內容來說的,給人的感覺是:每一節都有1110*1^1^11 , 一個忌諱是:某節的 標題後面,沒有說明就加上小節的標題,如 4, 1)8七11112^1011 1^006(1111*6 4 . 1 &5^1118111011 6^11^1011 下面的寫法較有樣子: 4 , 1)8^1111211:1011 1*1:006(1111*6 ^

168181 0116 ^910,^8,1^1

0【1^6X1; 11616.

0116 5 ) 8 X 3 ^ 8 ^ ) 1 1 0 【 ^ 6 X 1 ; 11616. ^ 0^ 1:6X1; 11616. ^

16981; 0116 ^9X0,^0.1^

1688七0116 ^010,^3^1

0 ^ 1^6X1; 1161:6, ^

0 ? 46x1; 11616. ^

16951; 0116 5)819^811)11 0 ^ 116X1; 11616. ^

16351; 0116

16831;

^ 3 1 ^ 8 ^

16351; 0116 1)8X3,^1:8,1)11 0 ^ ^6X1; 11616^

4 . 1 1)8^11112111011 6^11^1011 不少人不懂得這事,雖然現在已不那樣講究,但是一連兩個標題連在一起,當中 甚麼內容也沒有是蠻難看的。另外,節或小節的內容都不要太短,因爲印出來的版面 也不好看一好期刊是非常重視他們的版面的,因爲學術論文的目標是「藏諸名山」, 如果不夠講究,就表示他們自己都不在乎自己的內容。而學者們肯去投稿,除了升等 之類的壓力外,另一個原因則是「好期刊是要被好圖書館收藏的」一一這和在網站上 隨便貼一下完全不同。 至於圖和表在文中該放在何處,才較好看,你不必去擔心,因爲這是排版者的專 業。你不妨將圖和表都放在文章的最後,只要在正文中用一行字說 (工!!祐!:七1^1)16 3 3,130111; ^ ! ^ )

就可以了。 ;

如果有3.4.4節,多煩哪,


34

關於統計論文的撰窝

文章是給人讀的,因此要有次序。學術論文也是要給人讀的,但讀分兩種:粗讀 和細讀。 你的論文摘要,要能讓讀者有興趣進一步去讀你的緖論。你的緖論,應該能讓讀 者去粗讀你的正文。至於細讀,只是針對那些可能用到你的論文的人和你的競爭對 手。刊登論文的主要目的是留下紀錄(^^^^!!),是先驗證過(所以要學術評 審)再給人查的(所以圖書館才收藏〕。因此別太希望有人會用心細讀你的論文,但你 7

得希望有人會粗讀它,抓住你的結論。因爲極少人會從頭到尾將每一個字都讀到 。 一個方法是以論文的主體作爲讓人粗讀用,而將較細膩的細節,放到附錄。如果 期刊是,聲望的,多半的讀者會覺得附錄中的東面是評審查證過的,因此,除非必要,

同理,不要把你的每一招每一式都寫出來。我有一篇文章8 ,其中的一個公式的 手稿就有100頁,而我算了四遍。但寫入文章,不過九行。我只是淡淡地說: ^ 1 1 6 。。!!^)!!^!。!!, 311^011211 1)6(110118, 0811 111 ^01

1^6 08X116(1 0 1 1 ^

(以下爲推導的概

略方法及最後公式) 沒有這個公式,這篇文章大概不會接受。但若我寫上20頁,恐怕更難被接受。

平等的精神 在科學之前,人人平等。這表現在論文裡,就是一般在我們提人名時,不提他們的 職位、榮銜或者尊稱。我們說3^11

(^),指的是此人在1999年所發表的一篇論

文或者專書。但我們不提此人是大敎授、小敎授、新出爐博士、某科學院的院士、還 是某國國王所封的爵士。因此,文章中別用01. 1^11吐1,

? 1 0 & 5 3 0 1 1*0, 0 1

811 ? ' ^ !

一一要讓他們的文章著作自己說話。即使是提及自己的老師,也是一樣。文章裡不作 興拉關係,說誰是我的師叔,誰又和我在某會議中相談甚歡云云气雖然,圈子裡對大 家的關係都略知一二 一你以爲大家去參加國際會議只是去聽別人演講?

7

8

現在的論文真是太多了 ,誰有那個美國時間哪?

0!1130 (^?).

9

81071161X1^1

74, 426-429^

這些人拿到的榮譽已經夠多,用不著我們來湊熱鬧。

10但文章中可以感謝某人提供建設性的建議之類,這類事该放在「感謝」這一小段,不可放在正文中。且不 宜感謝期刊的總編和副編,因爲有拍馬的嫌疑。

9


35

第四章:動手作文

這並不是說我們不承認好文章的權威^。但別人的^^化要靠他們的論文來展 示,不是靠頭銜。「平等」的另一個意思是:至少在表面上,你的文章是和大家站在同 12

一標準來評量的,不因你是新手,就該「讓幾個子」 ;也不因爲你聲名赫赫,就不敢懷 13

疑你的結論 。

嚴謹的態度 在所有的嚴謹中,最要緊的當然是學術推理的嚴謹。當它有漏洞而被評審人員抓 14

到時,除非你能夠補救 ,否則你只好摸摸鼻子走路。 其它的嚴謹就表現在許多小地方了。我們列舉一些。

英文要正確 英文的文法別錯15。該加上5的地方,別忘了加上。單字別拚錯了I6,因此自己細 讀幾遍是必要的,千萬不要以爲評審人會幫你一一挑出來,他又不是你的博導 17 !拚 法對的字,未必是正確的字。實在不行,找個英文好的老外〖包括付費)將它順一順。 國人的英文多靠上課所學。學得好的人,寫出來可以讓老外能懂。但英文的精微 細緻處,沒有十幾年功力是不行的。比如說,你知不知道,0811

1101;和08111104

,哪一個

對? 1)18(11181166(1否1111(111311&6(1有甚麼不同?

另外的要求是一致性。例如我在文章中說,1998年,八做了八1 了 81

; 2002年,8做

。這兩個句子,動詞的部分,可以用過去式〖98和02都已過去);也可以用現在

式(學術上的結果可以以眞理視之〕。這兩種寫法,現在在論文中都可以用。但是,在 同一論文裡,不要在某一句裡用現在式,又在另一句裡用過去式18。這是文法上的不 11 12 13

我們對好結果還是有敬意的,文拿中不妨適當表示。但別過分。 有些期刊對博士論文較鬆,這是他們的政策:不要嚇壞了年青人。 有些期刊採用「寄出評審時將作者姓名塗去」的辦法,以免有名的學者有較高的機會通過。但這其實不易

瞞過内行人。 1 4 如重!^明,換一個雌的餅,或綠明評審錯了。 15 我們假設你是用英文作文^你要501/8301是嗎?雖然,中文的論文,對文法的要求是類似的,你只 是沒有問題而已。 16 現在的軟體都有815611 011601^9 一定要用!雖然用過之後還會有錯,^好得多。 17 有一個故事是這樣的:某生在他的論文某處加上「若老師讀到此處,請找我,有义0 —瓶爲謝,以感謝老 師的用心細讀。」^據説乂0還在。 18

即使兩句是隔了

20頁也一樣。這個毛病在作者麥考了幾篇別的論文後再寫緒論時常犯。你以爲洋人都

是對的。不錯,他們分別都是對的,但你一合^:寫就錯了。


36

關於統計論文的撰寫

嚴謹。 若是你要更講究,那麼就該注意到美國英文和英國英文在小地方是有差異的。選 一種,全文保持在你選定的那一種。 關於英文,寫到此處。我推薦一本極好的小書。當年我極爲受惠,而且至今還是 經典。網路上一查便得。 ^11118111 8*111111^

31.

71\6 ^167^67118

0^ 8化1氐

我只是將它的目錄列在下面: 6161116111;&1*5^ 1*^165 。【118&86

攀1^01111七116 1)0536881^6 5111511181 0【11011118

,8

# III ^ 861168 0 ^ 1111:66 0 1 1X1016七611118 ^1*11 21 8111616 0011】1111(^1011, 1186 21 00111111& 8 ^ 6 1 63X^1 1;61111 6X06^)1; 4116 188七

#

2 1 1 0 1 0 3 6 1)8X6111:116^10 6X1)163810115 1)61^6611 0011111185

#

?18-06 21 0011111131 1)6&)16 &11(1 0 1 1)111; 1111)10(11101112 811 !!!^^^^!!^^!!^ 013,1186

9

1 ) 0 1101』0111 111(161)611(16111; 018,11868 ^

9

0 0 1101; 1 ) 1 6 8 ^ 56111;611063 111 1 ^ 0

# 八 1 ) 8 X 4 1 0 1 ^ 1 8 , 1 1)111356 9^

:01^1(16

& 001111118.

4116 1)65111111118 0 ?

& 36111;61106 1111131; 1 6 & ] : 七 0

^ 0 1 ^ 5 8.1; !!^^-^!!^, 111 3X3001(181106

1)116

^81111118,1:10811

111611 &)11118,1:1011 811(1 1)10111111018111011

016111611七脏乂 1)1^11011)168 0 ^ 001111)03111011

9

^ 1 8 ^ 6 1116 1)31*8^81)11七]16 111111; 0【001111)0511:1011: 0116 5 5 8 X 8 ^ 8 ^ 1 1

肇 ^ 8 玖 1 1 1 1 6 , 1366111 63^11 ^01&^:9^ 1)116 1)6^111111112

40 68X^1 1:01)10

21 ^0^10 86111:61106; 611(1 11: 111 0011&)]:11111;7 ^1*11


37

第四章:動手作文

# 1186 ^116 8^1乂6 ^ 0 1 0 6

# ?111; 8*3^61116111)8 111 ^ 0 5 1 * 1 ^ 6 & 1 1 1 1

# 011111; 1166(11688 ^01(15 ^01(1 0 811006331071 0^ 10086

#

^3^)^635

00-07^,1710^6

9

1^66^ ^61(1^6(1 1007*^5 10^&1^16^

5671^671063

1(1,6(18 171 817^111(1^ /07711

攀 1 7 1 5"?7177107^65,化66卩I。 0716 167186

肇1^1(106仏6 6711^0,110 71)07x18 0! (! 8671^67106 0,1仏6 671(1

入 V

1112^61:8 0? 1*111

^ 。 1 ^ 8 &11^1 6^^1 63510113 001111110111^ 111131156(1 1

^01^3

0011111101117

1111831)6116(1

其它細節 細節是常忘但忘了的結果就是510??7 的東西。我列舉一些於後。

一字一義 在全文中,一個學術上的名詞指一件事。不要在第二節裡,你的意思是八,到了 第四節,你又指8 。爲了英文顯得活一點,你在文章中可以用一些同義字,但不要在 有技術性的字彙上搞這一套。 同理,一個符號只代表一件事。如果你用/(勾來表示X的!)^,那麼後面的文 章 裡 , 你 就 不 能 用 同 樣 的 / ( 勾 來 表 7 的 9 & ,除非X, V是同分布的。理論上,全文 的符號都要一致。這毛病在你組合不同時期的手稿時會犯,自己往往都不會覺得。

新詞要交待明白


38

關於統計論文的撰寫

所有較難一點的詞句,在第一次出現時都要給定義19。不一定是非常正式的定義, 但要能說明白。

相互引證的事情要一一對應 例如正文中若是提到^3!1 8 。。(^),那麼在最後的116&161X^8裡,就該將該文 (或該書)列入。反之,若後面的116&1^11068中有^8118

(^^^),則正文中某處需提到

以文章或書一兩邊誰多一個誰少一個都是不嚴謹。這原則也用在同一文章中的圖 和表上。若有圖三(或表四),則正文中需有某處明示「見圖三〈或表四〕」。 有些較好的期刊甚至要求你只能引用有第幾卷、第幾期的論文或專書2(5 ― 某 某單位的技術報吿是不行的,因爲它們往往沒有經過學術評審,份量不夠(也許竟是 錯的21〗。至於網站上的資料,現在尙無定論。我自己的期刊,主張用一個&)0*110^來 說明出處就好,暗示這類的引證,份量要差些。並且,網站有時會消失不見,較沒有 「立此存證」的意思。 至於文章中用到甚麼電腦或軟體,以前是有人會提的,但現在已不重要。因爲現 在幾乎人人都電腦和軟體,就傾向於不提了。這些都已是必需而不希奇的工具了,和 原子筆、人4的紙一樣。誰在乎你用甚麼牌子的原子筆哪?

事事來歷明確 論文用字,如老杜的詩:無一字無來歷。自己發明的,就要明白說出是自己發明 22

的 ,若不是你發明的,你得吿訴別人是誰做出來的一別打馬虎眼。這裡若是交待 得不明白,將來說不定會有人來檢舉「抄襲別人的硏究成果」一這在學術界是大 忌,那時說不定敎授的資格都被吊消。 來歷明白的更進一步的意思是:你需要適當地給016(1^ ―

—般是引用最早的

有突破性的、關鍵性的論文。這是你表現功力的時候:有些論文是有錯的,有時,這些 錯內行人是知道的。若是你不查或根本不知道錯而引用,遇到內行的評審,效果適得 19

謗自行判斷何謂「較難」。例如^冗,^;^,^^义)可以不説明便逕自使用,但办(^, 1^的1x10就可

以考慮説明一下。^然已十分通用,但尚未1009&被認可。 20 而且最好不要是不見經傳的小書店的專常。 21 這就是前面所説的「誰也別相信」的另一#現。但若是眞有名的技術報告又當別論,這時引用反而顯得 你有學問。 22

而且還得大聲説,生怕評審和镄者看不到,漏了你的功勞。


第四章:動手作文

39

其反。 在你說明甚麼還沒有做出來的時候,更該用心。文獻蒐尋(^^!!^

868X0^本

是16868X011的一部分,甚至是較重要的一部分。這是初入行者的通病,尤其在他們附

近沒有一個好圖書館時,更是吃虧。

不可跳號 論文中的公式、圖、表都有編號。通常各期刊都有自己的規定,參考一下就好。你 的編號系統也許和該期刊不同,這一開始沒有關係,多半在論文要排版時,講究的期 刊會要求你改(或他們幫你改)。這些不會影響到你的論文接受與否。 但是跳號就會。例如你原有表一,表二,表三,後來你自己刪掉表一,那麼,刪掉 後原來的表二,就該晉升爲表一,原來的表三,就該變爲表二。如果你不改正,文章中 只看到表二表三,但不見表一,這樣的跳號,明顯地表示你不認眞用心。

拉丁文 爲了表示有學問,有些拉丁縮寫是可以用的。例如 2

1.6.5 " ^ " 3 ^ 1100^ 6 1 31.,

86,

11)1(1,

6 | , , , ,

但是,別用錯了 〔尤其是標點,甚至要用斜體字)。

不要隨便就出來一個縮寫 其它的縮寫,應在第一次出現時給出全名。例如「1118X111111111 11^111100(1 (!^)」, 「861161:31126(1 111163^ 1110(161 ((^!!!!^)」。

總之,英文並非你的母語,英文不好是不能避免的問題。下面的法子有所幫助:

^寫不了長句子,就用短而文法不錯的23 。 。不會玩花樣就別搞花樣。 23

其實最好用長短不一的句法,才不單調。


40

關於統計論文的撰窝

,文字上旣然贏不了人家,就要以內容取勝。搞淸楚你的賣點在哪兒,別人的缺點 在哪兒。科學畢竟不是文字遊戲,雖然,文字好還是佔便宜。 #實在不行,先用中文寫出來再翻譯成英文再改。 ^對於技術性的論文,其實需要用的句子不多。讀別人的論文時,不妨將別人的句 型抄下來。若有10-20條樣版句型,也就差不多了 一一畢竟我們不是寫小說、 散文或者劇本!

強調緒論 我們一再強調,一篇論文中緖論最重要。從編輯和評審的角度來看問題24:第一 印象大體上就決定了他是用正面的角度還是用負面的角度來處理你的文章。他是正 面地幫助你呢,還是負面地快快幹掉你的文章? 我通常在兩個小時以內就有了看法一不論我懂還是不懂論文的內容。當我是 正面的時候,我才會用心地設法了解內容,這篇文章就有了機會。一半以上的時間我 是負面的。如果小錯誤一抓就一把,你會覺得這文章會好嗎?我覺得我還算是夠負責 的讀稿人。當我挑到第十個錯(大和小:)時,我就會停住了 一這個作者已吿訴我他 不用心。光是310^7這一個缺點,就夠拒絕它了。

最後建議 寫稿及投稿前應去跑一跑學校的專業圖書館。親自去瞧一瞧你的目標期刊是甚 麼樣子的25,別人的文章是怎樣的?副編都是甚麼人26?這樣,你比較會知道你的文 章是否適合這個期刊。 至於它們是不是3(31/8301 ,上網一査就知。大體來說,有名氣有歷史的學會和 大學所支持的期刊,多半是有水準的。現在有很多由某書店支持的期刊,雖也有好的, 一般就較弱。 有些期刊上,有時也有由編委寫出的吿訴大家的應注意事項 27 。 24

別忘了這些人都是較有名的學者,他們的一個共同特點就是沒有時間。 否則你的文章是寄給何人,寄到何處? 26 主要是去查一下這些人最近的著作是否和你的文章有關。 2 7 例 如 ^ ! . 8011111111^6 ^ ( ^ ) . I I & 1 8 1 1 1 3 化 1)81111)00 0 1 1 1 ^ 8 1 化 ^00.6.6.7X1^ 25

6

310-314.就有參考價值〖感謝劉長萱教4曼告訴我)。

0! 14(1X10.0&1716711 ^0^X110.1

47,


第 五 章 : 且 先 讀 幾 個 緒 論

在這一部分,我們在較好的統計期刊上挑了幾篇論文,將它們的摘要和緖論抄下 來和大家討論一下。我在挑選時沒有先讀過論文,我只是跑到圖書館,將架上最近的 一期的第一篇論文挑出來。期刊選了四種:乂皿&5, 8《0饥滅∼1^5^】11838 。因此 不能算是隨機挑選,但也不能算是100^0的立意挑選。這四種期刊都可算是「第一排 」的國際統計期刊。意思是,如果你有兩篇文章在這類期刊上被接受,拿下 一個硏究計畫甚至升等就有點把握了。習慣上,主編往往會將他覺得較好的論文,排 在每期的第一篇。 回應前面我們對於「緖論」的強調,我們試著來讀它們的摘要和緖論。這些文章 討論的專題我們不見得懂。但是,就是因爲我們不懂,才値得細讀:看看這些寫得好 的文章的緖論,有沒有讓我們覺得「後面的文章有內容」? 01:6611和IV[&171(110的文章 這 一 篇 登 在 3 1 0 ^ 6 1 ^ ( 1 ^200^ 93, 2 3 5 ~ 2 5 4 這 個 期 刊 在 1 9 0 1 年 創 刊 , 已 有 1 0 5 年,是一個有悠久歷史傳承的學術期刊。標題是:116^651311庙^!^瓧1181116 031 1110(1618,叩卩!!。^。!^ 111 ^1:01;6111 1)10111&!!]!^^" 0 這裡用了幾個名詞。6^1311至少大家都聽過。指的是將未知參數當作『911(10111 ^8X1^16而給一個?1:101:的一套想法和做法。^1161111161^意指對齊,如士兵的排成直線。 01618X0111^1

1110(161則是某一類的統計模型,這裡從字面上看不淸楚,雖然可以想像,

反正是有點複雜的模型就是了。最後說到了應用,用了 "'!^0化111 (蛋白質)",^10111~ &1111^108〖生動資訊)"而個非常當紅的名詞。因此,光是標題,就十分有科學味了。


42

關於統計論文的撰寫

摘要是這樣的,其上的註,是我加上的。

八II 11111)01:1:8111; 0101)16111 111 811811)6 8,1181^813 1 8 七 0 111^011 。011651118^10118 。 【 1)0111*5 111 8^8,06 8^61: 61*61:1116 011七801116 ^601116*1:1081 1131136)1:1118,^1011 ^ III 11115 1)8,1)61观1111)10(11106 11161810111031 1110(1618

(註一〉

5\1011七&8^8 111 ^111011

1)011118 111七116 00116^!]:8^10118 8X6 61*1161: 11111811)611601 01: 118^6 3^ 11108^ & ^181 13,136111112 00115^181111115 ^ 6 1118.10111118 811(1 111 " ^ ! 8 0 1 1 1 6 1)01111)8 1118,7 &01 111 0116 0【1)116 00116^1118,1:10118 ^ (註二〕 ^ 6

& 。^^

4 6 1 1 ^ 1^006(1111:68 161 81-

111111131160118 111&161106 8,1)0111:1118,110111112 811(1七116七18118&)1111&11011, 1131112 & 68,^681811 0^1)108X^1 ^ 〔註三)0111 11161810111031 010(161 18 1)886(1 011 81 ?0188011 1)100638【01 111(1(1611 1^1116 1)01111; 1008,110115; ^1118 169,(18七0 001181(161&1)16 1118^116~ 111^1031 811111)11608^1011 811(1

。【11111)16111611*8,111011 0【2^/1 311(1 ;\18^0乂

0110111 ^011|;6 。 8 x 1 。 8150111:111118^

611(1 81110^11156【01 018531031 ( ! ! 瓧 ! ^ ! ! 七 ! 。 ! ^

&0111 01116(^101131 5*81*18*103 111 & 0011(11*10118117 0011,111^6 8^)601608^1011 &)]:七116 0886 ^11616 1116 2 6 0 1 ^ 6 ^ 1 0 8 1 1^8118&)1018^1011 1110111(168 911 \1111010^11 1013.11011. 〈註五)^1110116110111; ^ 6 &)0113 0 1 1 0 8 5 6 0【&01116 0 1 1 ^ ( 1 1110*1011七]:8118&11118^10118,【註六)1111(161 81 1)1084 ^81811161;110 & ! ! ^ 乂 。【1035 ^1110111011 01)1111131 88,7681811 1)01111; 65111118,1:6 0 ^ 1 1 1 8 , 1 0 1 1 1 1 1 5 ! ! ! ^ ! ! ^ 0811 1^6 001181511101:6(1 ^3,1; ^61)611(18 01117 011 81 5111216 ^0X01^,^1 111113*1:3,1:6(1 \^ ^0 1118,^0111116 1)10*6111

0^ 1;116 ?811111^ (註七〉0^11 1116七110(18 8X6

9^)^03^1011.8 &0111 1)10111&)1111811;103^ 1?116 6151; 1)101316111 13 0 ^ 111 ^ 0 011111611510118 811(1 1116 860011(1 001131315 0 ^ 8115111112

8^*1^6 51168 0 ^ 1)101:61118 111七111:66 (!!!!^!^复。!^. III 1116 13,^1)61 0856 ^ 6 81&0 1186 ^011118^1011 1618,1)6(1 I 。 ^ 6 ^

1

0

" ? ^ 。【仏

6

91111110

3X^(1, 88 311 6X3111^16 。 〖 &

11101:6 661161*81 。31)8^1111^ 。【0111 11161:110(101067力。1110111(16 ^0X^18,1 18,1)6111118 &)【1118^1011, ^ 6 出 8 0 1 1 8 8 801116 。1)611 1)101)161118 31101 8\126631 411:^10118 6)1 ^ \ 1 1 6 ^011^

〔註八)

註 一 : 在 這 裡 提 出 8 1 1 叩 6 81X81^818的問題,當然大家不會懂。因爲畢竟這不是如 01,8等耳熟能詳的東西,因此要說明一下。重要的問題是111^011 0011^1811:10118 0 ^ 1)011118 111 3^)8106

&1*611115 0\11 501116

^601116*11081七【^!!^。!:!!!^。!!"這不~~^定是最

重要的問題,但他們敢說11111)01*8111:,總有一些根據。此外,在技術面上來說,^8118~ 【011118*1011,,

一詞也提出來了。


43

第五章:且先讀幾個緒論

註 二 : 此 處 立 刻 跳 入 問 題 。 本 文 是 用 ^ 而 ^ ^ 1110(1615來架構工作的,而數據中還 有標籤(^^^)的問題,還有兩組要對比的點,數目可能不相同的問題。這說明了問 題有難度。 註三:

這裡面,何謂 4 4 111&161106 3,1)0111; 1116 !!!&比!!!!^",何謂"!II&161106 3^)011力

1X8115&1111^101!"都沒有提。但這是只是摘要,是被允許的。 註四:在這裡提出模型,其中"!11(1(1611 100^101!",當然有一點像以^的味道,因此 用到5^就合理了,至於1\10^0 ,則是因爲8^681811的原故。他們更指出,因爲模 型取得巧,才能有簡化。 註五:再於此處提出他們還用到了

^6^01131

^中的本事,而這又關照了前述的

41:3115&)1111811;1011有一種是轉軸(!:。!;^^。!!)。 註六:指出只做兩種&1111^10118,至於8&116和1:16^

11X0^011,

一個需要你回到

高等幾何,另一個卻是物理。暫時需要想一下,其實是不那麼重要的。但用了較專業 的名詞,就會顯得高級一點。 註七:這裡吿訴我們,111^0111116

〖當然,後面的本文一定要定義)是本文要估

計的對象。 註八:最後歸到兩組應用。都是有科學意味的數據,這又關照了標題中的6^116^ 1113^。 一詞。

整個摘要吿訴我幾件事:第一,問題是空間中兩組點是否可以相切合?因爲這些 點指的是蛋白質和胺基酸,所以這是一個當紅的生物資訊問題,這就有了 「吸引目光」 的效果。然後,作者提出方法,用1^88011 1)100653來布空間的點,雖然太普通但尙可 接受,因爲我們也不知道還有甚麼好用的^06833 。但他們提出了 111(1(1611 ^^。!!,就 把問題的架構弄得較難一些了,但他們還能夠簡化,就暗示著「有內容」。第三,他們 還從空間統計裡借用工具,並說明他們最得得到的是"叩!;!!!^ 6 ^ 6 8 ^ 0 1 ^ 0【1;116

1118^111115

68*1111811:6

!^^!^"。最後,他們還說:他們用的是眞實數據。

摘要給人的初步印象是「有不少東西」。但我們應該看他們沒有說的。例如"^^111131 8 ^ 6 5 1)01111: 68*1111^6 0 ^ ^ 6 111^0111118

是不是科學上有意思的問題要點?

或者只是統計學家能做出的東西?從這裡,我們看不出來,11181*0111116做得是好是壞,


44

關於統計論文的撰寫

與是否能最優地做估計是同一件事還是根本不相關?注意到兩個作者都不是生物學 家,這是引起我一點懷疑的地方。有兩組數據給兩個統計學家玩,總可以搞些看起來 有料的東"^出來。估計和磁^!^是同一件事嗎?我怎麼好像覺 得作者沒有交待? 現在且看一下緖論的部分。

\^3110\18 1 1 6 ^ 0^18111611^118 ^0^161118 111 8118^6 11181^111118 118^6 1)6611

^!)^^

1112 &0111 (!!&!^!!^ 801611*1110 8X638 1110111(11112 1)10111&)111181*108 811(1 11118^6 7318. III 81 01858 0【1)101)161118 111 8118^6 3,11317813 0116 3381111168七118^七116 1)01111:8 111 1 ^ 0 0 1 111016 0011651118,110115 &16 18,156116(1 311(1 1;11686 0 0 1 1 & ^ 1 8 ^ 0 1 1 8 3X6 1;0 136 11181*0116(1 3 ^ 6 1 61*611118 0111 801116 ^18118&)11X18.11011# 1)311811^七116 1)18115&)]:" 1118^1011 15 81【1^1(1 418118^0111181*1011 0 1 81111113X11^七1:3118&)]:1118^0化86^6131 1 1 6 ^ 1)1013161118 8X6 81^1)6811116 111 ^111011 61^1161: 1;116 1)0111*8 0【。。!^^!!!:&七!。!! 3X6 110七 18,1)611601 0 1 1116 18^6111115 15 811115121101135 311(1 111 ^111011 801116 ^01111:5 ^ 0 1101; ^^^?^

111 68X211 0^七116 。011丘^113^10118,人II 6X81111)16 0【31111312110118 18,136111115

&11868 111 1111(161:8^311(11112七860011(13X7 81^11(^1116 0 ^ 01:0七61118, ^1161:6 ^ 6 8X6 51^611 110七0111^1111:66^(111116118101131 11101601113^ ^ ! ! ^ ^ ! ^ ! ^ ! ! 15111; 8180七116 1;7?65 0 ^ 81111110 3^1(1 8,1; 68X^1 1)01111: ^人呂61161:10 ^101)16111 1 8 七 0 1118,1)011 1 ^ 0 511011 0 0 1 1 & ^ 1 1 1 8 1 ^ 1 8 , ^ 6 ^ 6 1;116 1118.1:0111115 ^133七0 1)6 111^8X18111; 1111(161 301116 1;1:8115~ 6)11113,1:1011 ^ ! ! ^ ) . 1)650111)1)10115 0【511011 1^01)161118 0811 1)6 &)1111(1 111 4116 16\^16^

^ 6 110^ ^ ^ ! ^ ^

17^0 ^311;8861;8 1618,1)6(1 1)0 ^10*6111 81;11101;1116^ 0116 18 0 【

1^^(111116118101181 ^ 1 6.8^^ ^ 6 1 : 6 681011 1)01111; 18 311)10*6111辻86辻3,11(11116 ^13118~ 【01:1113^1011 ^ ^ ! ) 18 81&116. II11^18 0836 ^ 6 118,^6 811)8X^181 1113*0111118, 1(16111:166(1 31168X17 ^

6^^61^5 7 1^8^ ^76 0311 1186 1)0 858688 0111 ? ! ^ ^ ^ ^ ! ! ^ . III 1;116 360011(1

6X81111)16 ^ 6 118^6 &七111:66"(!11116118101181 00116^1:8,1)1011 0 〖 ^ 0 8^*1^6 81165 0 【 1 ^ 0 1)10*61118 ^111011 8180 1183 8X1(111:101181 0^161111081 111&11119,1:1011 ^ 11616 1116 ! ! ! ! ^ ^ 1115 ^^8113&)]:!]!^^]! \;0 1)6

61*616(1 011^ 18 1151(1 11101;1011^ III 1;1115 1)101)16111, 0116

0【1;116 1118111 811118 13七0 1;8^6 & ^1161:^ & 0 * ^ 6 81^6 811(1 &11(1 1118^01163七0 & ^ 6 1 1 ^8^8^0861

111 501116

。 【 ( ^ . 17116 11181*01168 ^111 ^ 6

301116

。【4116

^1110*10118 0【1)116 \111^110\^11 1^01;61118, 169x11112七0 4116 ( ! ^ ^ ! ^ ! ! 0 爹 1 1 6 ^ 6112711168,

1?11616 8X6 0*1161: 1618,156(1 6X31111)165 &0111 11118,26 81181^315 311011 38 1;116 1118^011-


45

第五章:且先讀幾個緒論

1118 。【^1111(111185 ^ 6 1 1 0116 1138 1X1111*11)16 ^0(111116118101131 ^ 1 6 ^ 5 0【七113:66~ ( ! ! ! ! ^ ! ^ 。 ! ! " 0 ^ 6 0 * 5 ; 566 & 1 6X31111)16 0 1 0 5 5 & 11311000^ ( 朋 ^ ) .

丁116 1)101516111

11616 16(1111168 0116七0 61*61 0111; 1116 口10』601;1乂6 1;1:9118【011118^10118 1)66)16 1118^0110^1161: 6X91111)168 ! ! ^ 。 ^ 1113,1)0111115 0111:111168 0 1 5111:&^68; 8 6 6 【 0 1 6X81111)16 011111 &; 1181163X8,38111 口 。 。 。 ) 2111(1 311 11111)1115118116(1 ^60^1111031 11111^6181^ 0【1)611111811^ ^ 15 ^ 。 ^ ( ! , 311(1 ^ 6 3X6 016311115 ^ 仏

2002 ?11.0,

1^116813 &0111力116

? ^ ^ ! ^ ^ ! ! . 9 6 1 6 110 18,1)6111116 0【1)01111:8 8

1

00111:111110\15①II七0111 0 1 5111&^6 18^1161:

1:113.11 & 61111:6 11111111)61 0 【 ! ^ ^ ! ! ! ^ . 8\1011 1)101)161115 3 X 6 110七&3(116886(1 111 ^1115

1116 ^1111011)81 111110^8,1)10115 111 0111 ^^!^&^ 8 X 6 1116 0,^108^1

1110(161-1)336(1

10 8112111116111;? 七116 & ^ 七 ^ 3 , 1 ; 七 1 1 6 1110(161【011111113^011 811(^8 118 1;0

111156^3,156 0 1 1 七 1 1 1 0 1 ( 1 6 1 1 1)01111; 1008^10118, 1)116 1)1101 51)601609,^1011 & 1 : 1116 101)9,^1011 1213^1:1^, 811(1 1116 ^ 1 3 X ^ 0 ^ 0^0111 ^0111)6 0 8 x 1 0 ^!^)!:!!;!!!!!.

一般的摘要只是緖論的子集\這篇文章兩者都要唸,因爲緖論裡說得並不多。它 先提出除了 610111&!!!^比之外,還有1腿86 看!!^^

6 力 8 1 . ^200^

811817318

,但是語焉不詳,只是要我們去

0

然後直接跳到兩組數據。在有數據的論文裡,數據最重要,因此得先介紹。但其 後戶斤說的問題"!II 1^18 611(1 1118,^01165

1)101)16111, 0116

。【1116 1118111 811118 18 ^0 1;8^6

61 0[!161^ 8^*1^6 51*6

311(1

1;0 31 ^ 6 1 1 (!^^^^, 111 801116 19111^116 01^61\,,似乎本文根本不曾去碰。因

此看起來只是花招。 然後他們提到三篇文章:1998, 2000和2002的博士論文。但全沒有提這些文章 和本文的關係,好像它們只是111^6 ^318 9 問題類型雖然類似,所用的技術和本文 全然不同的樣子。 最後談到本文的賣點:幾乎全都是技術性的。得到甚麼結論呢?似乎看不出來。 緖論裡連II提都沒有提,爲甚麼要估計它,估得準是不是等於 1118就做得好,還是說根本只有一種!^^丄巧,好不好我們控制不了,最多只是量測 一下1113^111118 的結果而已? 這是可以去讀的文章,因爲它似乎留下很多空間讓我們去問新的問題。此外,相 ~1但最好要文字有所不同。


關於統計論文的撰寫

46

關的文獻似乎不多,這暗示問題也許還新,下功夫搞淸楚了就有機會。 關於2116112, 5816&111^ 0X1^ 061111811的論文

這篇文章刊在2006的^0117710,1 0 / ^ 6 ^77167^00,71 81(^181100,1 ^550020^071 ? 101, 409~

423,這是美國統計學會旗下的招科期刊。三位作者都來自001111111^大學,其中,5816

8111^是社會學的博士生,其他兩位都是統計系的老師。 標題就十分搶眼:"!1。\^ 1113117 1^601)16 (!。

10101^ 111卩118011?: 1181116 0^61(1181)61:81011

111 0011111; (1^^9, ^0 63*11119^6 800131 511101)1116 111 1161^01:128,,,光是憑這個標題,很多人就會

來讀一下論文摘要2。標題已抓全要點:正面的使用(朋!^),而不是將0^8181)61:81011 當作數據中的缺失來小心處理。這樣的態度是値得一提的,而標題中將它反應出來。 文章的摘要如下:

1^6*^01:1&3

86*8 0 ^ 。1^6(^8 。011116(^6(1 ^

1618,1:101181111)8

8 X 6 1111-

1)01*3111; 111 & 11111111361 0 【 1 * 1 1 6 8*11(1^ 。【116^01:^8 1135 10112

06111;1:81

七0 800101027, ^1161*6 16868X01161:8 118^6 8^1)61111)1^(1七0 1111(1615*811(1 1^6 03,11863 811(1 0011860111611068 0【1;116 8*1110*1116 0 ^ 16181*101131111)5 111 18X^6 ^!"0111)8 。 【 ^ ) ^ ^ . 1181112 111812111; &0111 1)16^10118 1 1 6 ^ 0 1 : ^ 1636810115 ^111^01:1;11 6 七 8 1 6七&1.

811(1 ^ 。 。 8 X 1 ^

118^6 ( ! ^ ^ ^ ! ^ ^ ^ ^ 811(1 6^81118,1^601 & 1116*110(1 6)1 681)11118^1115七1^6 81268 0【

!^^!-!;^"(:01111七1)01)1113^10118 1181112 1 1 6 ^ 0 1 ^

001160*6(1 &0111 21 811111)16 1811-

^0111 881111)16 0 ^ ^11161108118 ^ III 41118 8X1)1016 ^ 6 3110^ 110\^, 1181112 0^61(1181)61:86(1 ?0188011 16^6381011 1110(161, ^ 6 3 6

81

111111*116^61

& &130 0811 1^6 1156(1七。68~

1:11118,1:6 851)60*5 。【800181 8*111(^111:6 1111)01)1118^1011 ^ 0 \ 1 1 观 ^ 0 6 5 1^011(1 111051 口16\^0118 16868X011 011 1 1 6 ^ 0 1 ^ 8 ^

1151112 ^8X13^1011, 38 ^611 3 5 3 ^ 6 1 8 ^ 6

『681)011868, 8 5 21 8011106 0【1111118^1011 ^ ^ 6

0111 1116^110(1七0七116 38^81

0 【 ^ ! 。 。 8 X 1 ^ 64 81. 811(1 611(1 1^118,1; ^11161108118 ^ 8 ^ ^ 5 1 6 8 ^ 1 ^ 111 1^11611: 11111111)61 0【 ^(!!^!!!;^!!^.

! ^ 七 ! ^ , ^11161108115 8110^

^3X18,111011 111 1)101)61181^ ^ 0

&)1111七163 1;0 ^601)16 111 801116 2^0111)5 (^.^., 1118165 111 ^ ) ! ^ ! ! , 1 1 0 1 1 1 6 1 6 8 8 , 8,11(1 ^11161:10811 II1^118I18), 1)111; 111^16 ^3X18,11011【01 0^1161 ^0111)8 (^-^., ^ 1 1 8 ? 060卩16 11811116(1 ^[!0^13^1 0 1 !^!。。^).

^ 6 3,130 6X^)101:6 0*1161 &8,1:11165 0【1^11686 ( ! & 仏

811(1 001181(161: ^ 3 ^ 5 111 ^111011 8111^67 ( ! ^ ^ 0311 1)6 1156(1 1;0 68*11118,1)6 116^01:1^

當然是因爲一般的統計論文,不止是内容,連標題都十分乏^


47

第五章:且先讀幾個緒論

它強調幾點:(!) 8 0 0 1 9 1 1 1 6 1 ^ 0 ^ 的 硏 究 , 有 其 歷 史 ; 作 者 用 " 賺 化 1 ^6 1 ^ 枕 ^ 1)6156^ ?0155011 1621:6831011 010(161,,來做分析;〔3〉對於估計!!&^^)11(1群體大小的方

法,是參考了

1011^01^1 61 91. 811(1

61; &1.(注意到,在摘要中不必將論文的 3

年份寫出來》(句利用^1^1011是本文技術上的創新,和以前的論文,皆有所不同 ; 卬)證明美國人的社交傾向,變異極大;(^)甚至考慮到如何估計116^01^ ― 雖 然 沒 有 說 明 如 何 定 義 一 個 被 估 計 的 1 1 6 ^ 0 1 ^ 3*1110*1116

5^110*1116

這個摘要比較平實。主要是因爲3(^181 116^0^是生活的一部分,即使不知道科 學上的定義,也可以有一些感覺。這摘要給我們的印象是,作者也做了不少工作,並 且有些工作還是創新的。他們正面地面對0胃(!^^^!!,並且有趣地處理了眞實數 據。 緖論是這樣的(中文的部分是我加上的》

11606111)17 & 8111^67 ^ 3 8 七 8 ^ 6 1 1 0【^11161:108118 881^118, 20110116 0七1161: !^!!!^ 8 , " ! ! 。 " 111811^ 1113168 (!。 ^011 1^110^ ^ 犯 仁 ^ ! : & ^

4

111 8七3^6 0 1 ^6(16131 1)113011?"

1116 1116311 0【4116 1635)011863七0 11118 011168*1011 \^33 1.0. ^ 0 8^ 169x161 。【1;1118 』。1111131, 1113,1 11111111)61 1118,7 866111 81100^111呂1乂 ! ! ! ^ . 1)101)8,1517 ^ 0 1101; 1^10^ 31170116 111 1)115011 ^ III &104, 0 【 乂 0 1 1 1 " &1611(18 。 0 110七1^110^ 31170116 111 1)118011 611;1161:^

^0111(1 ^ 6 8 8 1^11611; ^ 0 1 1 ^0111(1 ^ 1 6 8 3 1)118,1; 11105^ 11111111)61: 1113,7 366111

七0七8!1乂 111001111)81*11)16 \^11:11 ^0111: 5001&1 ^011(1

這一段就開啓得不錯一你的朋友裡有多少在坐牢?平均數是一個人?怎麼這 樣高?這樣豈不是一半的人都在牢裡?美國的治安眞可怕啊!有了這樣驚人的數據, 然後再輕鬆地爲你解套:本文的讀者大概都是敎育程度好,社經地位較高的一族,多 半沒有認識坐過牢的人。於是你心情愉快,好奇心起,這個「平均一人」是從哪裡出 來的? 3

其實,正面面對變異,統計學者早已覺醒。如贸量問題中的田口方法,還有如八11011之類的時間序列模

型都是。 4 這個字指的是「被監禁」。


48

關於統計論文的撰寫

8 0 1 1 0 ^ ^ 8 8 1:116 1116811 0 ^ 4116 1651)011868 1 ? ^0001(11112七。七116 ^0,1^ 70^0 0^ 1:116 163^011(1611*5 161)011:6(1 1^110^1112 0 1)601)16 111 ^118011^ 150^6^1:, 1116 1681)011568 8110^ 21 ^1(16 131126 0【乂211:18^1011, ^1)11 31111081; 3 ^ 16^)01:111116 ^118,1; 1 0 1 0 ^ 8,1; 16854 10 ^1:1301161:5^ 11681)011865 1)0 301116 01^61: ^1168*10113 0 ^ 1116 581116 6)1^118^, 6)1

^义^!!!!^, "!1。^

1118117 1)601)16 (!。 ^011 1^110^ 1181116(1 1^10016?" 8110^

II!"(^! 1688 乂&!:!^。!!.

這一段明白吿訴讀者數據中的胃1^1011極大一有些人認識一大堆坐牢的

人5。儘管,70^0的人都不認識坐牢的人。

1*1118 011961:61106 111^8X18,1)1111^ 0【1681)011868 1 。 411686 " ! 1 0 ^ 1113117又,3 ^ 0 ^011 1^110^?" ^1168^10118 18 1;116 1118111&8七3*1011 0【^1111(13111611*31 800131 1)10068865

8,1:鶴!^. 1?111:011^1 0316^11 6X81111118,1)1011 0【1^18 !^1;6111, 38 \^611 38 0*1161:5 111 1116 38^81, ^ 6 03,11 163111 0^0X1^ 11111)01*3111; 0^18X8,0116118*108 0【1;116 800181 116^011?: 001111601:1116 ^11161108113? 8 8 观 1 1 88 1^116 1)10068863 1)118,1: 0168,1)6 1^18 11617^01:1^

前面兩段話都沒有技術用語。但這一段開始使用了 80(^1 1 1 6 ^ 0 ^ 以 及 它 的 形 成

過程一社會科學硏究的味道就進來了。

1 ^ 1 8 811317318 &180 611*1161:3 0111: 1111(161:81)811(11112 0【313,1)181:1081 1110(1618 0 ^ ^0-^8-7 6 . 9 ^ ^

41681*1115 0^61(1181)6181011 88 81 8011106 0【!116)1:1118^1011, 1101:

』1181; 311 188116化"16(11111:68 001160*1011 ^ ^ 0 1 6 ^ ( : ^ & ! ^ , ^ 6 1110111(16 。 ^ ] : ^ 1)6181011 &8 61 1)8X811161:61 1\18^ 11168811165七116 ^81118,151011 111七116 1618,^1^6 ^)!。!^!^!— 1163 0【111(11^1(111818力0【01111七168力0 81 2^611 800181 ^ ^ ^ , 811(1 8,110^ 11;力0 ^ 3 X 7 81110116 500181 ^ ^ ^ .

1?111:011^1 511011 1110(1611115 。 【 ^

^311811;1011 0【1;116

11乂6 1)1:01)611811)163, ^ 6 ( ! ^ ! : ^ 81116^ 111683111:6 0【800181 8 七 【 1 1 ( ^ 1 1 1 : 6 1 1 8 6 8 0111^ 8111^67 1681)011865 &0111迕881111)16 0【111(11^1(111818 , 1101; 6^8^01 011 1116 001111)16*6 116^01:1^

這一段特將"!110111(16 0^61(1181)6181011 88 & 1)8X8,11161:61: ^8.1; 111685111:68^3X19,1:1011 111 1;116 1618,11^6 ^101)61151*163 0 ^ !11(11^1(111318,,力口以說明,並申明我們禾0用"!110(1611116 0 【 ^ 6 5

當然不是指牢頭。


49

第五章:且先讀幾個緒論

^8X18,1:1011 0 ^ 1^6 1619,1:1^6 1^01)61181七168,,,才導出116\^ 111638111:6 。【800131 5七1*11(^111:6 ^19^ 11868 01117 5111^67【685)011868,,,

8210^^1:01111(1 1111(161313311(11115力116 8^1\101;111:6 0 ^ 300181 116^011^5? 811(1 1;116 800181 ^10068568 ^118^ 6)1111七116111, 13 81 06111;1:81 0011061:11 0 ^ 5001010^7 ^01 150*11 111601:61;1081 311(1 ^18^*1031 16850115 ( ^ ^ ^ ^ ! ! ! ! & ! ! 311(1 1^1181; 1994; 1^66(1111311 2 0 0 4 》

800181

1161^01:1^8 118^6 1)6611 &)1111(1 10 118^6 11111)0)^3111; 11115)1103,1:10115 ^01 1116 300181 11101)1111^ ( ! ^ ! ! 1999)5 8 811(1 533111011

6

力 & 打 呂 ( ( ^ ^ ( ^ ^ 力 ! ^ ! : 1995〉, 1116 (!^19111108 0 ^ ^ 8

2002〉, 8^1*11(16 &)11119,1:1011 ([枕,1^3X1611, 311(1 1^111^ 2 0 0 4 》

911(1 4116 51)168X1 。【111&0*10118出86386 ^。11:18 311(1 ^.!0111X101

這一段選用一些關於300^1

1995》

116^01^的一些文獻,注意到沒有太老的東西。這雖

不是一個完整的文獻蒐尋,但至少資料都還新。表示作者還知道最近發生了甚麼6。

^11611 1:8110115 8,130111; 800131 1161;怖1^8, 8001010515*8 0^611 1156 4116 1;61:1114 1 5 0 0131 ^!;!!!^!!!^," \^111011? 111 ^!^^,

1183 13^611 011 1113117 41迁616111; 01631111188,

5011161;111168 11110168^ 0 1 00111;184101;01^

III 1;1115 8X^0:16, 38 111 1)1& 31*1016 \ ^

3 6 0 ^ 1 1 0 1 1 1 811(1 ^ 6 5 1 6 ^ ( ^ 。 ( ^ ) , ^ 6 ^61161:31126七116 0011061)1:1011 1)111; 6)1*11 \ ^ 818,11 (!^了斗)1118.1; 500131 5*1110^1116 1 8 ( ! ! & ! ^ ! ! ^ ^ 111 81&1121*1011 1)3.^61115 &0111 ^113^ ^0111(1 1)6 01)361^6(1 15 ^60^)16 5011116(1 &1611(151111)8 6111^1617 !:^!!^!^)!!^,

用文字說明本文中所謂的3^181 交友」當作3^181

5^0*1116是甚麼意思。觀念是相對的:將「隨機

3*1110*1116爲0來看問題。當然,這裡還沒有明確的定義,只有明確

7

的想法 。

80010105181;5 3X6 1101七116 0111^ 5016111;181;5 111*61:6546(1 111 4116 5^1:1101;1116 0 ? 1161琢 。 ! ^ .

1^6*110(18 5)168611七6(1 11616 08,11 1)6 9^116(1 1(3 & 111016 ^611619117 ^66116(1

1164\^01^, 35 3117 861; 0卩01^6(^8 (^^^^) 00111160*6(1 10 68,011 011:161 \^ 3 86^ 0卩 ~ 6 引用十年以前的文章時,最好只引用那些經典的,才顯得你有學問有品味。 7 如果你有相關^數據,可考慮做「論網路交友的社會結構」。


50

關於統計論文的撰寫

1111158 (^(!^)'工打8X1^11:1011七。800181 1161^01158 (&!^!!^!!!!) 116力\^01:1^ (^!!^^)。!^— 1;1011 116^01:103 0【8。16111;181;8, 86X1131 ! ^ ! ^ 。 ! : ! ^ ) , 6X81111)168 1x101x1(16 1;601111010510811 1161)^0!"^8 (^.^.,力116 111*611161; 1)3,0^130116? 1)116 1^011(1-^1(16 , ! ) , 1^116 1)0^61 ^ ( ! ) 311(1 13101021081 1161^011^5 (^.^., 1116^3.150110 116^01:1^85 ^10*6111 1111;618^1:1011 1161;~ ^ ! ^ , 11611131 1 1 6 ^ 0 1 ^ 3 ? &)0(1 ^ ! ) ^ ) ; 16\^16^8 118^6 1)6611 1)10^(16(1 ^ 口 。 。 ! ) , ^6^111811 ^

^

)

8^102^2

, 811(1 ^ 8 ^ 3 ( ^ 。 ( ^ ) .

這一段是可有可無的。只是說「可以有更廣的應用」,一般人都不會去查的,但作 8

者應該眞的讀過所列的幾篇文章 ,否則就是不負責任。

III 1:1113 8X1)1016 ^ 6 8110^ 1 1 0 ^ 40 1186 " ! 1 。 ^ 1113117 乂 , 3 ^ 0 ^011 1 0 1 0 ^ ? " 0011111; 1^0 168X11 8,1)0111; 1116 800181 8*1110*1116 0【8^^^11^^1I11;8I1^65111I) 1161^01^ 111 1:116 1)111*6(1 8七8^68^ ^ 0 1 6 ^ ^ ^ ( ^ ^ ^ ! ! 乂 ,

0811 168X11 10 ^118,1; 6X^6111; ^601)16

^317 111 111611 11111111361 0【310011181111;811068? 1;0 ^118.1; 6X46111; 1)601)16 ^03:^ 111 1)11611 1)1:05)611311^ 4 。 &)1111 1;168七。。601)16 111 31)60160 ^ ! ! ^ , 811(1 3 1 8 0 七 0 ^118,1; 6X46111; 5^)60160 8111)1)01)1118^10118 ( ^ 【 " ( ! ! ! ^ 1^086 1:118,1 816 01:1161^86

1 0 。。!!!!七)

^01^ 111 1:11611 ! ) 。 ! ) ! ^ ^ ^ ^ ^ .

先提出數據的基本形態:由某一特殊問題"!1^ 1118117 X 、 ^ 戶斤以是001111^

7

0 1 1 1^10^?"而得,

0

^116 33*81 113601 111 ^ 1 8 81*1016 ^ 6 1 6 001160*6(1 ^

^ 0 0 1 ^ 1^111^01^11,

661:I1^X(1,』。11118011, 311(1 81161167 ^ ( ^ ) 811(1 00118131;。【8111^67 1651)011868 &0111 1,370 111011^1(1118113 011 111611: 810(111811111311063 \^11;11 ^0111)8 ^66116(1 ^ ^110118^1, 0111:13*18119

! ^ ! ^ ^ ) ,

( ! ^ ^ ! ) , 6*111110117 (^-^"

000111)8,1:1011

(^^.,

1181116 (^-^., 11

1)05*81 ^ ! : ^ ! , 1)1101;, ^ ! !

^21*1^6八11161:化肌),01 6X^61161106 (^.^., ?118011619

8.11*0 &001(16111; ^ ! ^ ! ] ! ) ; & ^ 21 001111)161:6 1151; 0 ^ 1;116 21*0111)8, 566 1^51116 4 111 860*1011 4.2^ 0111 681111181*68 001116 &0111 6**1116 21 1111111;116乂61 ?0135011 16^6381011 ^1111 ^31131106 001111)011611^3 0011681)011(11112七0 8111^67 ^ 卩 。 ! ^ ! ! ! ^

811(1 3111^

1)0^)1118*10118 811(1 811 0^61(1181)61:81011 &10*01 1118,1: ^3X168 1)7 6^0111^ ~\^6 6七1^116 ~~ 8 至少他也得用細讀過它們的緒論。


51

第五章:且先讀幾個緖論

1110(161 1181116 63^681811 111&]:61106 811(1 1;116 011)1)3-^164101)0118 ^

0

1

^

1

1

1

, ^11^

1(161^1& 501116 9X688 111 ^111011 1;116 1110(161 6七00111(1 1)6 11111)1:0^6(1 1181115 1^6(110 4 ^ 6 01160158. ^1*1)1112 1^6

^1*11 81 111111*116^61 1110(161 3,110^8 861)8X8,111011 0【

111(11^1(11131 811(1 8111)1)01)111811)1011 6 迁 6 。 1 ^

0x11 811917515 0^七116 ^10001^

6^ 81.

5^68【6380113^16 1681111;5 311(1 1)10^1(165 21 1186^111 6X^611181 0^160^ 011 0111 膨 七 ! ! 。 ^ 1*0*611^181 3X638 0 ^ ^111)1161 ^ 0 1 ^ 1110111(16 11101:6 ^ 。 ! ) ! ! ^ ^ ^ 1111;61810~ 11011 1110(1613, 9^1108^1011 10 6.9^& 001160*6(1 ^

1 1 6 ^ 0 1 ^ 88111^11113 ( ! ^ 。 ! ^ ! ! 。 ! : ! !

1997, 2 0 0 2 ; 881^3111^ 811(1 156(31^11001 200^ ^ 311(1 9.^1)11081151011 1;0 0011111; 111 0^1161: ^ ( ! ^ .

這一段說明數據的來源(^(^紅矽,^111^0^11? 861:11811(1,】011113611, 811(1 31161167 口。。:^ 和一般說明。所用到的模型111111*116^61 ?0158011 16616831011 1^1*11 ^3X181106 。01111)0 !^!!坫),所用的工具(^&^!&II

111&161106 811(1 1116 011)138-^16^1:01)0115 "^)!:^!!!!!)及甚

麼時候可以做得更好(!^!!!;!^ 501116 8X633 111

^116 1110(161 6七00111(1 1)6 11111)1:0^6(1

1151116 1)16(110*1^6 ^ 6 ^ 5 ) 0 至 於 這 對 於 5 0 0 1 3 1 116^0^硏究的影響,倒是看不出來。

主要的結果似乎仍然是導出了

116^ 1116981116 0 ^ 300181 8七11101;111611568 0111^

5 1 1 ^ 1681)011868^ 。這對於社會學的意義是甚麼?似乎沒有著墨,甚至不知道這個所 謂 的 1 1 6 ^ 1116851116?是用來量測甚麼性質的。

61111111101111的文章

這 文 章 發 表 在 2 0 0 6 的 4 7 1 7 1 & 5 0/810,1181103 3 4 , 559-581 ^八1111918是國際數理統計 學會的旗艦期刊。要求證明嚴謹,是技術性要求很高的。當然,這篇文章是蠻理論的 (否則不會投進來^。讀它的摘要和緖論,除非你是相當夠格的專家,根本就搞不淸來 他做了甚麼工作。我是一直讀到9.565才把此文的「成就」搞明白9。但還不算數學證 明。

這是爲一刁、撮人寫的!&文。標題是 60051;1115 ^01 1^1^1-6^X11&113101131 11116611: 1110(1618,, 11

。這裡只用了一個較生疏的名詞:1^081:1116。這個名詞來自所謂的機械學習(瓜^!!!^ ^!!!^),原意是指將一個較弱的〈預測)方法,經過某類處理之後〔處理的方式叫 13005*1118

10

變得更好 。

9

~ 因爲好幾個名詞到後面才明確定義。這對於摘要和緒論是可以的,對正文就不行。對這類文章,作者並沒 有希望你第一次就讀懂。這種摘要和緒論,是爲了讓專家留下深刻印象用的。 10 我曾以爲如果我有51^0的機率猜到明天某股票的漲或跌,則我應可用1500^115的辦法,提高我的猜測


52

關於統計論文的撰寫

統計學家對150(^1118有興趣,因此也有不少學者加入硏究。但此文光是從標題 是看不出甚麼的,所以先讀一下它的摘要:

^ 6 1)1X^6 1:113,1 1)005151115

七116 8(111816(1 61101: 1083, 1/2^008^111^

18 0011-

51816111; & I ^ ! 乂 111611-^11116115101131 1111681 1110(1618? ^11616 1;116 11111111)61 。《^1:6~ 0110^01: ^8X18,13168 18 8 1 1 0 ^ 6 ( 1 七 。 6 3 8 6 1 1 * 1 8 , 1 1 7 38 & 3 七 8 3 0(6X^(83.1111)16 8126》, 855111111112七118^七116 1;1\16 1111(161:171115 16516831011 ^1110*1011 18 5^)8X56 111 1611115 0乇 七116《1-1101111 0〖1116 16^6881011 00691016111;5^

這個摘要太專業了,我要從論文的1^.559讀到9.565才知道它第一句在說甚麼。 基本上是這樣的。在 2;二义^十6,

^

71X^^(3

^^^!)

這樣的線性模型中,一般都要求0

2,因爲否則「自由度不夠」。但如果2 〉 71 ,請

問如何估計這個迴歸函數?

一般當然是不行,否則我們讀到的初等統計都錯

了。但是,如果大多數的0的値都很小時是不是有可能? 這裡,「大多數的/?的値都很小」的條件,叫做31)8X86

。這篇文章所證明的是,在

81)8X86的條件下,是可以得到^(训义)的「一致估計量(^!^^然&!!!^^」的。

III七116 18115118,66 0 ^ 8121181 151:006881112? 1^1118 11168118 00115181)61107 &^1: 110181116 1181116 81 8*101121^ 0^61001111)16*6 31(^1011317 151111(161:13'!118 31^1181 18 31)8X86 111力61:1118 0 ^ 《 1 - 1 1 0 1 1 1 1 . 11161:110(1

~\^6 &180 1)101)086 11616 811 ^10-1)356(1

七11111115, 113111617【 0 『^0051118 4116 11111111)61: 0【1)0081:1112 11;61:3^10118,

171118 1113^68丄28003七1116 001111)111:3^10118117 8^*1:8X^1^6 811106辻18 110七16(111116(1 七。11111七116 318011*11111 1111111111)16 1;111168 & 1 : 01038-^811(18,1:1011 85 0011111101117 1136(1 8 0 &11.

這一段說,在做1.003^116時,有一個「每次疊算的次數」要交待明白。作者說他 有辦法。 率 到 9 0 7 。 , 15005*1116當然沒有這樣利害。


53

第五章:且先讀幾個緒論

( ^ ! ! ! 。 ! ! " ] : ^ 1^8008*1112 &511111113,156(1 ( ^ & , 111 ^ ) ^ ! ^ ^

^11616 1116

1)16(1101:01 ( ^ ! ! ^ ! ^ 。 ! ! 18 18X^6 111 001111)9X18011七0 831111)16 3126? 811(1 &)]: & 3 冊 ( ^ 让 ^1111101-013331603,^1011 1)101)16111

^6116 6X^)16881011 111101:08X18^ ( ! ^ ^ , .

這一段對數理統計的論文是蠻標準的,先講方法,再做模擬,最後再套入眞實數 據。這裡,眞數據來自生物微晶片,雖然不是作者自己測出的,但這個問題仍然紅火 (事實上,我們會去對71〈?的情形如此關注,這類數據的大量存在是主要原因^。 這個摘要寫得算中肯一反正只是寫給內行人看的一它只是明白地講出所 做出的主要結果。 它的緖論則較長。其實只是摘要的加強版。內容如下:

^61111(1 811(1 ^ ^ & ^ ) ! ^ ^ [!!] ^ ^ 9 3 0 0 8 1 ; 31^01:11:11111 & ^ 013851608,1)1011 1138 8^^181016(1 111\1011 3^*611111011 111 ^ 6 III&0^11116 163X111115 00111111111111;^ (^.【20】311(1 1;116 16&1611068 ^ ^ ! ^ ! ! ! ) 85

38 111 1619,1:6(1 8X638 111 8*8,1)18*108【1,13】,111311117

13608,1156 0【11)5 ^00(1 61115)11108,1 5)616)111181106 ^1*11 61 ^ 8 X 1 6 ^ 0【384;3861;8, 8008^~ 1116 1116^110(18 ^ 6 1 : 6 01151113117 1111:1:0(11106^ 38 1111111^1)16 1)16(11(^1011 8011611168, 613,51116 68*11113,1)6(1 1)16(1101)10118 &0111 ! ^ ^ ! ^ ^ ^

( ! ^ . 乙 8 ^ 6 1 : , 6161111811【1, 2\

110*6(1化&七1)116 ^ 9 3 0 0 3 1 8^01:1*11111 0811 1)6 ^161^6(1 8 3 81 ^

1

^ ! ^ 016806111;

01)1:1111128^1011 1)601111101116 111 ^11110*1011 ^ ^ ^ ^ . 1 ^ 1 8 11111)0^*9111; 1118151115 01)6116(1 81 116^ ^ 巧 ^ 。 ! ; ^ , 11311161^ 1)0 1186 1)005*1115 1116七110(18 111 00111)6X^5 0*1161: 1:11811 0185816。3^1011, ? 0 1 6X31111)16, 1^16(1111311【12】46^610^)6(1 1)003*1118 1116*110(18 6)1: 16616881011

3X6 11111)16111611*6(1 38 811 0^1;111112;811;1011 1181112力116 5(^113X6(1 61-

101 1083 ^11110^1011:七1118 18 \ ^ 1 3 ^ ^ 6 03|11 ^26。031;111^ 1七18 653611*181117 ^ 6 831116 35 1\4811^ 811(1 2113118,8【19】1118^011111^ ^11181111; 812011*11111 111 31^1181 ! ) ! : 。 ^ ^ ^ ! ^ '

這一段是給關於13 0 0 山昭的背景資料。主要是說誰做了甚麼工作。因爲指明了 ^ 6 0 0 5 ^ 是 本 文 的 手 段 ^ 先 別 管 & 80 0 ^ ! 1 的 定 義 , 對 這 類 數 理 統 計 的 文 章 , 早 晚 2

6

會給出明確定義的〗,此段只誇獎了【1, 21兩篇文章,說"!?1113 11111)011;^

1 1 1 5 1 ^ 0^)6116(1

61 116^ 96181)6(^^6,,。至於其它的論文,都不帶褒貶。他並提出1 8003力1116和1113^11 2

^511:是同一回事^。注意到,他這一段只提了七篇論文,這都是有選擇的,這些都是 11

這 是 暗 示 「 本 人 學 問 不 錯 」 的 手 法 , 要 學 ^ 尤 其 是 他 不 僅 提 [ ! 9 1 還 要 提 1 ^ 0 0 6 8 8 1 1 18 , , , 這 秀


54

關於統計論文的撰寫

關於1^00^118的重要文獻,充分表示作者是否內行。

11606111;175 2 & 0 1 1 ? 3 3 5 * 1 6 , ^0^11540116 811(1 111)511118111【10】1113X16 8^ 。0111160 11011

111168^ 1110(1613 1)6*^6611 & ! ^ ^ ^ ^ 8 1 ; & 6 ^ 3 6 11116611: 16^6581011

( ? ^ ^ ) ,

^111011 3661118 0105617 1618,16(1七0厶28008*1112, 811(1七116 ^1-^61181126(1 1(8580【22】 0 1 1^8818 1)11181111; ^ ] . 1 1 0 1 1 ^ 1 7 51)68^1116: 1111(161: 301116 16811101)1^6 888111111^10118 0 1 1 1 1 1 8 1 ^ 1 1 ^ 0【21 1111631 1110(161, ?81)11 8-151)1:0X11118,1)617 7^1(18 1)116 86七 。【811 1)8880 80111^10118 ^11611 ^81^1112 。 乂 6 【 ^ 6 1)61181^卩3181116七^!:) , ^1118 1^12111115 1 1 1 5 1 6 ^ 迅 ^ 1)6 1186^111力0 ^

21 1011511 1)10*1116 3^0111:丄280081)1116 ^ 8 1

118 16181*6(111688七0 781(11: 11: ^ 0 6 8 ^8X18,1316 86160*1011 811(1, 31111111^6, 81111118^ 1;0 1^116 1(8580^ 0 0 \ ^ 6 ^ 6 1 ? 11 8110111(1 1^6 8*8,^6(1 0168x17 4118^ 4116 11161110(18 9X6 1101: 1:116 581116; 311 6X31111)16 8110^1115 21 (!^!!。!; ( ! ! & 化 ! ^ 1^6^6611 1 ^ 8 0 0 8 1 ; ! ! ^ 811(1 七116 1.8580 18 1)1686111:6(1 111 86011011 4.3, ^10160^61:, ^ 6 ^)。!!^ 0111; 111 860*1011 2.1 ^118.1; 1^81^11 811(1 ^22005*1116 8X6 (!!&!^!!^ 812011*111118 83 ^611^

這一段又提了一些相關的論文,說它們似乎和12 8 0 0 3 1:1^做同樣的事。作者的 結論反面的:這些都不等於丄28008*111&)他明白地說:^8110111(1136 31^6(10168X171)118^

化 6 1116*110(18 8X6 1101; ^ 6 831116,,。這一段所給人的印象是:此人將1280081;1118的事 情已弄得十分淸楚了。也澄淸了一些大家或以爲對的事情。而這些都是學問,新的知 識 -

八 8 1116 1118111【681111;, ^ 6 ^ 1 0 ^ 6 11616

1/28005*1118 6)1 1111631 1110(1613

3^161(18 0011318*6111; 68*11118,1:68 111 1;116 乂61乂 ! ^ ^ 1 ^ 1 1 1 6 1 1 8 ! 0 1 1 8 ^

0011*6X1;, ^11616

11111111361: 0【016(11(^01 ^8,118,1)168 18 8110^6(1力0 ^ 1 0 ^ 683611*13117 8 8 【 3 3 七 & 8 0(6X^(331111)16 ^12;^)), 885111111116 ^118,1;七116 1^116 1111(161:13'!116 ^6^1:6851011 ^11101;1011 18 8^8X56 111 1;61:1118 0 ^ ^ 1 ~ 1 1 0 1 : 1 1 1 0【4116 16^16581011 0060101611*5 ^

這裡強調本文的主要結果。

11118 1631111; !8, 10 0111: 1^110^16(156, 1;116 &18七8,1)0111; 13008*1116 111 ^116 1)16561106 0 【 ( & 5 。 ^0^1115 ^111161151011 0【七116 1)16(110*01: ^ 出了 「格局不止在111&0111116 168,1111116^0


55

第五章:且先讀幾個緒論

並且說明別人沒有做出這類型態的結果一該說自己好的時候就大方地說。

801116 0011813*61107 1:631111;5 & I 1)005*1115 ^ 化 6 x 6 ( 1 1)16(110*01 (!!!!^!^!。!! 1

8

1110111(16【17, 1 8 】 3 8 ^611 38【25】,2X061)1; & I ^ ! ^ ^ ' [工了]【681111;, 411686 8,11*11018 001151(161: ^61810115 0 ? 1)005*1116 61*1161 ^1*11 ^ ! - ^ ^ ! & ! ! ! ^ 8 ^ 6 ^ 3 ^ 1 0 1 1 0065501611*8 。!:, 85 1 1 1 【 2 5 】 , & ^111011 ^ 6 6)1111(1 乂 6 ! 7 出 迅 4 。 1156 111 ^1^10&

^01 1^16 1)008^1116

1*613X6(1 ^61751011 0【1)005*1116 6.11& ^0 1116 11011015^10118

0【1)116 1613^8^1011, 1:118,1; !8, 110^【951七116 13005*1118 ^ ^

1

6

^!

0

1

1

00655016111;3

8110111(1 (!&03^^ 7116 1681111; \ ^ 2113116 811(1 丫 11【25】1218,7匕 6 8 6 1 1 6 1 : ^ 2 6 ^

^ 化 。 ! ^

1;00 11111011 6 9 6 ^ 1;0 81 86^*1115 ^1*11 11101:6851116 ^111161151011 0亡1116 ^16(110*01 乂3^13^16, 1)114 1:11611 1;1160161;1081 ^ 0 1 ^ 1110111(168 0111^ & 118010118 11:69^111611七0【 1)116 013881&09,111011 5)101)16111 ( ^ ! ^

1)116 8,1)0^6 111611*10116(1 (118^^1V^I11:^^6 0 【

1)11611 1613X6(1 13003^1115 ^ ! 呂 。 卩 ^ 辻 瓜 ) ^

這裡說其它似乎相近的結果都不夠好。注意到作者的理由都很明確,不是空口說 白話的。需知這樣的內容最易讓同儕生氣。文字不要帶火氣。

156116^6 1^.9^ 11; 18 111311117 & I 4116 0856 0【111611-^11116113101131 1)16(110^013 ^11616 1)00311118, 81110116 0^&I

11^1&^)10^ 1195 31 8111351:811*1811 8x1^31118^6 0^61

111016 0185810&1 3,^1)108,01165^ 801116 6^1(161106 &)]: 1;1113

1)6 5^^611 111 860*1011

4.1, 311(1 0七1161: 5111)1)01*1112 61111)11:1091 163111*5 118^6 1)6611 16^0116(1 111【3】111 1116 41361:611七0011*6X1; 0 〖 1 。 ^ - 01 ^ ! ^ ! 脂 ^ 。 ! ! " 81(1(111^6 1110(1613 6)1 001111)3X1115 1.22005*1115

111016 1)1:3^1*101181 1X16*110(13 811011 35 1)8,01^1:151115 0 1 IV[厶!18

( ^ ! ; ! ! ^ ^ ^ 4 。 3X1(111)1^ ^11101:1011 ^ ^ ^ ! ^ & ^ ) ^ 1^01^1)1^ 1113117 1:631 ^8,1598613 110^3X18^8 8X6 0 ^ 111511-^11II16I1810I181 11611;111:6^

6681(168七116 ^611-40(31111161^6(1

200(1 61111)11:108,1 ^61^01:11181106 0 ? 1 ) 0 0 ^ 1 1 1 呂 , ^ 6 1 ( 1 6 1 1 * 1 ^ 钍 8 8 ^ 1116*110(1 ^ 1 0 1 1 0311 0011818*6111:17 1600^61

!!!呂!!-^!!!!^!^!。!!^!, 5^3X56 ^11110(110118 ^

此處說明高維的問題才是主要的應用,並且因爲有、811133^11^1^ ^311^ ^ 6

013851081

0暫

^^0^1x65,,,世上有太多這類的數據(這一點其實大家都知道、並且,

最主要的,作者又將主結果再提一次。


56

關於統計論文的撰寫

^ 6

1118,7 3180

1181116 1/23008*1115

0111: 1*681111; &8 9^ 00118181)61107 1)101)61^7 6)1: 36"!10181116 七!! 81 8^1011217 0^61001111)16*6 ^101;101181^ III 0011*1851:七0

81 001111)16116 31(^10118X7,【01 6X81111)16, 1^0111161~ 0 1 ^8^6161-1)8518 ? 3 * 1 0 1 1 2 1 ^ 0^61001111)16116 110137

0 3 5 6

8

1 1 0

力^11

1111(161:8*00 ( ! . 0111 1681111; 3^61(18 8^ 16831;

1116 1)8810 5)10^)61:1^ 0 ^ 00118181;6110^

這一段,作者又將本文與其它事物拉關係。這類問題的結構大同小異,多半在不 同的架構下運作。作者說 0\11 1681111;力61(18 0,1 16881: 1)116 1^81810 ?!。^!^ 。〖00118181;611。7,,, 44

但這一段話有「想當然耳」的味道一這些東西是可以給學生做的題目,有作者這 樣的專家猜應該會成立,但眞正寫出來卻是另一件事。

8681(168七116 1)11601:6*1081 00118131:6110^ 16811145 ^ 6 ^101)056 1161:6 81 001111)111:8^ 11101181117 6^&016111; 3^1)1:081011 & I 1)116 1:11111112 1)8X81116*61 111 1^00841118, 4118,15 18, 1116 11111111361 0【130051;1112 1*618,1:10118^ ^ 6 ^ 乂 6 311 638117 001111)11*8,1)16 46&1111:1011 0 【 ( ^ & 鄉 0 【 6 : 6 6 ( 1 0 1 1 1 6)1 1,2^008^1^

811(1观七11611 。101)086 118 1186 111七116

001160*6(1 ^ 1 0 0111;611011^ 111111^6 01038-^811(18,110115 0111 ^10-^11111115 ^

0 6 3 1 1 0

16(111116 1)0081:1118 1;0 1^6 11111 111111*11)16 1111168. 11118 1118^68 ^116 0111^611 1)008*1112 001111)11*81*10118117 8,1^1810*1^6: ( ! ^ ^ ^ ! ! ^ ! ! ! ^ 011七116 3 8 ^ & , 11: 18 3011161)111168 3 8 【 8 3 七 3 8 ^ 6 1 ^ 6&016111; 1/^118 81^01:11;11111【011|8530 ^1*11 ^7辻

8

( ^ & ^ 比 & 1 ( 1 01038-^311(18,111011【6, 10】,

這一段說明計算的效率。作者也有做法:用八10來做。到此爲止,論文的理論部 分都已介紹完畢。此文其實只有一個主定理,伹作者洋洋灑灑地用了 25頁的八1111818 主要是靠此人確實對相關的問題知道得夠多夠深入,所以才寫得出這些旁徵 博引的話。需知說這類話最易出問題,因爲你的看法不見得就是評審人的看法。這時 深度就變得重要,如果你眞的言之有物,那些專家也會懂的。

^ 6 0161110118111:8,^6 011 501116 811111118^601 6X81111)168 110^ 0111 1^8008七!!!呂!^卜 &)1:1118 !61 " 。 ^ - ^ ( ! ) 1118111117 111611-^11116115101181 1111631 1110(1618, 1 1 1 ② ! ! ! ! ) ^ ! 8011 1 0 1 ) 3 8 8 0

31(1 ^8X13,1516 86160^011, 11(156 16516381011? 01(11119X7 1698七

80[!18X63 311(1 81 11161:110(1

丘 9 8 1)6611 ( ^ ^ ^ ( ! &1x121x111116118101131 16-

^ 6 5 8 1 0 1 1 【 1 4 】 , 8 1 8 0 001181(161: ^ (!!迅。!!^ 1;1111101:~019851|10811;1011 1)101516111 ^1*11


57

第五章:且先讚幾個緖論

56116 6X1)16881011 11110103X1:8,7 (!^1;116 1)16(11041^6 8.00111:8,0^ 0【1/28005*1116 15 00011)5116(1 ^111〖0X11 0*1161? 0011111101117 1156(1 013851661:8 6)1 11110103X1:3.7 6.3^^ 811(1

1306&7 ! ^ ^ ^

1;116 111*611)1:61121*1011 。 【 1 ^ 8 0 0 3 * 1 1 1 6 & 4 310116 1^6

111165 。【81 111168^ 1110(161 &!;.

最後說明模擬和眞實數據的套用,以及與其它類似方法的比較。

這篇論文的摘要和緖論都算是標準的寫法,它沒有奇兵突出(像2116118 6^ 81. 一 樣),但平舖直敍,立刻進入主結果,並大力地和現有的文獻比較,以宣揚自己的優點, 坐實別人的缺點。這是數理統計論文的通常寫法。 81:1611和8&11^的論文 這篇文章登在^0117710,1 0^ 1116 110^0,1 51(11181100,1 500161^7

867^168 8 ^ ( ^ )

68, 571-

609^這是英國皇家統計學會的招牌刊物。 標題極短:"^1111;巾1 1:911(1011112^011,,,只有兩個字。一般只有自認是高手者才會這 6

樣取論文標題。這暗示本文並不針對某一特定的小範圍而討論。它的摘要是這樣的:

^11111111616(1 6X1)611111611*5 8X6 0^13X3^1)61126(1 \^ 111^01^1115 1111111^1)16 1:3I1^101I11281110118? 111 81 561156 1113^ ^ 6 1113,^6 ^ ^ ^ ) ! ! ^ ! .

^ 6 001111)3X6 311(1 00111;1:851; 8 ^

1^1)65 0【111111111)16【311(10111122^10118 , 1131112 & ^ 1 ^ 6 181186 。《6X81111)168, 311(1出501185 111611: 1156 111 ( ! ^ ^ ! ^ ! ! ^ 6X1)61111161113 ^

011111116 21 3^5*6111 0 ^ 01630111)1115

1;116 1811(10111123,1510118 111 1611118 0 ? 8615 0 【 0 1 ^ 6 ( ^ 8 , 111611 3880013,16(1 1;1618 311(1 1:116 ^8,0^01 11681;1118, 1181112 18,11(10111128111011 (119,^2^II18? ^ 1 1 1 0 1 1 呂 3 ^ 6 ^ 0011^61116111; 311(1 163x1117 38511111181^6(1 5111111118X7 。【311 6X^61111161111811(10111128111011 ^ ^ 6 3180 111(1103^6 1 1 0 ^ 1^0 &)1111111&6 & 1311(10111123^1011—1)386(1 1111X6(1 1310(161 !61 1116 311817315 。 【 & 0 1 1 1

811011战!)^!!^!^.

這裡用了 ^ 一 , 一詞,這並不是一般的實驗設計(!^巧敎本上常見的。此處就 特用來和化11(101111^*1011

—起配合使用(所以後文將再說明〕。摘要裡說明本文是要

用很多例子來討論多重隨機化的道理的,提到了

、811(101111^1011 ( ^ & 胃 , , , 和 如 何


58

關於統計論文的撰'寫

處理、811(1011112^1011-1)856(1 1111X6(1 1110(161,,。這個摘要沒有甚麼不對,只是看不太懂而

己。002已是非常精微細緻的學問,細緻到非專家就不想去碰的程度。作者之一的 6^是此中的有名的專家(如果不是權威),但這樣的摘要,我讀起來還是有「閑人 免進」的感覺。 它的緖論如下:

2X5)611111611*5 8X6 ^118*11151118116(1 &0111 。1)861^8^101181 8^11^168 311(1 ! ^ ! ) ! ^ ! ! 3*31106 ( ! & ^ 13^ ^116 1)111:1)081^6 8^1)1108^1011 0 ^ ^168,11116111:8七0 01)861^8,1101181 1111辻8, 1^61(161

^ ) . \ ^ 1 1 6 (^^),

^01^

( ! ^ ^ ^ ^ ! ) 311(1 11611)61661:

( ! ^ ^ 。 ) &)11111118,1:6(1 11161)110(18 &11116 811817518 0【6X^6111116111:8 1118,1;七81^6 11118 1111011011 1111;0 8,00011111; \ ^ 018851^1115 &10七01:8 1116X1)6111116111; 33 61*1161 3100^, 01: ^【68^1116111;, ^ 1 ; 0 1 5 ^

1161:6 ^ 6 11^61口1:6七1)100^ 811(1 1^68*1116111; & 1 ( ^ 0 1 8 七 。

1116811七116 36*8 0【11111311(10111126(1 311(1 1311(10111126(1 !8X3*013 ^ ^ ^ ^ ^ ^ ^8117 16568,1:011615 118^6 8x1^00211:6(1 4116 1186 0【811011 81 ( ! 込 ^ ! ^ ^ 。 ! ! ( ? 诒 ! ^ ! : ( ! ^ ^ ^ ) , 1 1 1 & 811(1 1^6111^1101116 (1957), 。 0 乂 (1958), 360*1011 6.3, ^ ^ 6 8 (1975), 1^63X1 811(1 0111110^ ( ! ^ ^ ^ ) , 560*1011 14.1, 611611 ( : ^ ^ ^ ) 811(1 ?161)110

6 力 ^ ( ^ ^ ) ) .

^116 ^1131;111^1;10I1 6113^168 ^116 ^11:601; 00118^1110*1011 。【811317515-0^8X131106七8^168 6X111131*1116 & 1 1 ( ^ ! ! & ! ! ! ! ^ ^ ! ! 呂 , 9 3 \^611 38 4116 111(111181011 , 111 81 1111X6(1 1110(161, 0【311 1:61:1118七118^ 8X6 ^8X1811*6(1 \ ^ 1;116 ! ^ ! ! ^ ^ ! ! ! ! ^ ^ ! ^ ] ! .

這一段是名家手筆。把區集^10010和^6^11161110用「不隨機化」和「隨機化」 來分辦。等閑人寫不出來。

0 【 0 0 1 1 1 8 6 , 1^ 18 1)05511)16 1)0 &)1111111211)6 311 8,118,17818 ^1*110111; 111310115化!^ (!诒&!^七!。!!. ? 0 1 6X01111)16, III1116 311811^818 0【8112111(10111126(1 。0011)1616"!31(30^ ( ! ^ 81511 88 81 ^ 0 ^ 8 ^ 81131^818 0【^8x181106, 1)836(1 011 61 ^0^810*01:? 110~1111;618^1;1011 1

! ! ! ^ ^ , 110 01151;11101:1011 13 1118x16 1)6^6611 1;116 ^1:68,1:111611*88X6 1:911(1011117 35~ 816116(1 811(1七116 131001^8 1113,1; 1681111; &0111 11111616111; &3,^11163 。 【 ^ 6 013861^3^101131 111111;3^八8 ! ^ ^ ! ! ! ! ^ ! ! 。 ! : ! ^ (!^巧巧)1101:6(1, 1;1118 1631111;3 1 1 1 8 8 1 1 1 6 811817318 &)]: 1;116 13,11(1011112:6(1 。 。 狎 ^ & ^ 。 。 "

911(1 1;116 ^ 0 - ^ 8 - 7 ^8.0*01:181 6X5^6111116111:?

67611 1)11011511 1^1167 41迂61: 1113x156(117 111 1116 1311(10111123,1:1011 4113,1; 15 61111)10^6(1 ^


59

第五章:且先讀幾個緒論

11115 18 13603,1186 1116 0 0 1 1 & 1 1 1 1 ( 1 1 1 1 6 1 3 1111161:6111; 111 6 3 ^ 1 6X^6111116111581 1181*1011 1185 110七1)6611 1600^11126(1 ( ^ ! ^

811(1 ? & ^ ! ^ , 1 9 9 9 》 81111118117,化6

00111111011 36801:11)11011 0^ 1)116 01818810 81)111;—0104 6X^6111116111; 111 1611118 0【01117七^ 1 6 1;111:66【3X^01:8 1)100^, 1X181111)101; 1;]:63,^111611*5 811(1 511131)101; 1)1:68115111611*5 3180 &118 40 ( ! ! ^ ! ! ! ^ 1 1 ^ ! ! 1)61^6611 1811(10111126(1 ^1681*11161113 811(1 1111161:6111; &3^11168 0?七116 。1)861^8^101181 11111*8 ^

讀過~^^點002的人都知道"!;1118 168111*8 111 1^6 891116 811317815 !61七116 1811(10111126(1 001111)161)6-131001^ 01631611 911(1 1;116 ^ 0 - ^ 9 - 7 ^1;011811 6^^6111116111;5 6^611 1;11011611 151167 ( ! ! & ! 1118X^6(117 III七116 1811(1011112211)1011 \^0^ 15 0111^10^&^" ? 但讀過811611 311(1 ?3^116

肯去深入了解的人就少了。若是能夠了解到气116 6X1)611111611*31 8辻119^1011 1138 110七1)6611

0011&1111(11118

(^^)並

1 3 〖 ! ! ^ 巧 紕 1 1 1 68^1

"。(^^(!,,,是否實驗數據的分析方法就會不同?

611611 ( 工 。 ^ ? ) 1(16111:16.6(1 6X^611111611118 1118,1; 111^01^6 111016七11811 1;116 8111516 1811(10111129,111011 。〖^163,^111611113力0 1)10*5 811^1 00110111(16(1 1:113.1; ^ 0 86*8 0【&10*018 8X6 110力611011611 1^0 ^ ^ ! ^ ^ 七 1 1 6 1311(10111128^1011 111,, 811011 ^乂!^!:!!!^!!^^. 1116 561161:31力61111弋1618, ^ 8 3 111*1:0(11106(1 ^01 ^1& 80^,8 0^ ^ 1 ) 0 1 8 111 011 6X^6111116111; ^111011 1681111; &0111 1116 018851608,1)1011 0【1;116 ^810*018 210001(11115力0 ^611 81:8^118 111 1;116 1311(10111123,1)1011: 566 &180 0\11115 6 七 8 1 ^ ^ ^ ) . 2x^)61:11116111:5 ^8,1; 111乂。1乂6 111111*11)16 1811(101111281*101185 811(1 1161106 11101:6 1^811 ^ 0 1;16155 ^ 6 1 6 18,1)616(1

'!!^辻辻&!^^!,.

^111*1^1616(1 6X1)611111611*8 1110111(16 1^0~ 口11856, 501116 311I)6I1II1-

1)056(1 811(1 501116 5111516-51)9,56 6X^6111116111)55 311(1 801116 011111)181^56 6X1)611111611*5 1181115 1;116 581116 111111;8 8,1; 63X^1 8*8^6; 1116^ ^ 0 110七161)1656111; 81 001160^1011 0【116\^ ( ! ^ ^ ! ^ , 1)111; 3X6 31 01388 。 【 ( ! ^ ^ ^ 111346叩0【30^61:81 6X18*1112

1^)68^

這一段說明,在002中,"6X1561:111161^3 1118,1; 111^01^6 11101:6 111311 1;116 3111616 I3I1^10II112^1011 0^1:6^11161^,的情形,20年前就已發現。並由此引入、16『,,一詞,並讓它

和「隨機化」相連。照顧到摘要開始時的句子。但像,1111^161:6(1

6X1)611111611*5 1110111(16

17^0^)11886, 801116 8111)61:11111)086(1 811(1 501116 8111^16~81;9^6 6X^)6111116111:55 811^ 501116 111111^1318156 6X1)61111161115 1181116 4116 89,1116 111111)5 9^ 6&0^1

覺都沒有。也許可以

3*2^6,,的寫法,就太專業了,我讀了一點感

專家罷。

1^0"!)11356 6X1)611111611^5 ^ 6 1 6 1111:1:0(11106(1

^

^/[^!!^&

(!^巧)8,11(1 ^ 6 1 6


60

關於統計論文的撰寫

( ! & ! : ! ! ^ " 1 ^ 7 〇 0 乂 ( ! ^ ^ ^ ) , 81*11011211 00X1 1156(1 1;116力61111 ' ^ ^ & ^ ' 18^1161 111311 《1)11886, , 11167 3.16 0113,13^1161:126(1 ^

4116 &110^1112:

(^) ^ 001111)16*6 6X^)6111116111; 111 4116 & 8 七 ^ ^ ^ ^ , 81111011211 1101; 11606833X117 ^1*11 1116 11168311161116111: 0【1681)01186 ^3X13,1)165; (!?) 1116 1811(1011112811)1011 0【1)116 11111*8 & 0 1 1 1 6 1 8 七 ^ 1 1 3 8 6 七 0 1 1 1 1 1 1 ) 8 111 1^116 560011(1 ^ ^ ^ ^ ^ .

到此處,過去的和本文有關的文獻回顧就差不多結束了。這幾段算是較長的,但 是,懂就懂;不懂還是不懂。因爲搞懂也需要功力。至於文字,是寫得有專家的味道。

八00111111011 81*1181^1011 111

1116^ 000111 13 ^11616 ^ 6 ^10(11106 &0111 21

661(1 1;1:131 1185 1;0 1)6 1)1006886(1 111 & 18^018^017 0 1 311 6^81\1^1011 ^11386 (^^!!, 1983; 6 ^ 6 1 1 61: 81, 1987; ^ 6 0 ( 1 &I 81, 1988; 611611 811(1 ?3^6, 1999; 0\11118 6七81., 2 0 0 3 ; 1^61:1:? 2 0 0 3 》 人 1 1 0 ^ 6 X 3 1 1 1 1 ) 1 6 8 0 ^ 1)^0-1)11356 6X^)6111116111:3 1^113,1; 118^6 1)6611 1)111)118116(1 1 1 1 1 1 七 6 【 8 ^ 1 1 1 6 61111)10^ 01117 0 1 1 6 0 【 七 ^ 1 6 51111151681; \ ^ & 0【1111111:11)16 18,11(10111129,1110114 III 41118 1)8,1)61: ^ 6 ( ! ^ 乜 ! ! ^ ! ! ! ^ ! ! 1)6^6611 5*8,268 811(1 。118368 111 6X1)61:111161^8, 七116 6)111161: 1110111(1111619,^61 38 & 8^60181

&.

110*6七118^ 1188^6 0 【

8*3^63 311(1 ^118868 111 6X^)611111611^8 13 11111:618^6(1七0七118^ 111 83,1111)11118 ^

^111一

1)13*8,56 6X^)61:1111611*8 3X6 0011(11101:6(1 111 86^6131 ( ! ^ ! ! ^ ^11116 !11 七6口818 ^1*11 1311(10111128,1:1011 0【【810*01:8 6)1 63^11 ! ! ^ ! ^ ! . 11167 ^ 1 ^ 6 1^0"!)11386, 811口61:11111)036(1 811(1 01181156-0^61: 6X1)61111161118

110七101151*11(111181 ^ ( ! ^ ) , 88 ^611

88 1X11111:18*8,26 161)1006351112 6X^)6111116111)8, 111 ^1110111^681)01156 01117 3^61: 86^613,1 8*8,^68 0【^1006851116 1^116 831116 111111:8

18 1116851116(1

[!1161 ( ! ^ 了 ) , ^166

811(1 881*68 ( ! ^ 今 ^ ) 311(1 8 0 乂 911(1〗01168 ( ! ^ 卩 ? ) , 560*1011 ^ ) . 1^0七311 111111*18158126 6X1)611111611118 8X6 1111111:11:161:6(1 88 41167 ^ 0 1101; 1x^01^6 111111*11)16 1811(1011112811)10118 七116 1181131 16^681*6(1 11168311161116111)5 6X^)61:1111611*3 411811: & 1 6 (115^^1856^1 111 16X^-13001^8 8X6 1101; ^ 8111816-5^&66 6X1)611111611*8 4118,1; 111乂01乂6 1111111111)16 ! ^ ^ ^ ] ! ! " 123.1:10113 1110111(16 301116 ^1:8.21115 3X1(1 801116 1)13111; 6^^61:11116111;8^ ? 。 1

^乂^!!!!^,

611611 911(1 0611161;110 〔 1 9 9 8 〉 0113011856(1 1111111:11)16 1811(101111281110113 111 1^6 001116X1; 0 ^ 0011*111110118 ^3^31118七^3^8 811(1 ?16606 ( ! ^ 。 ! ) 4680111)6(1 & 111111*1*1616(1 1101*1:10111*11181 6X^61*11116111; ^


61

第五章:且先讀幾個緒論

由此段開始介紹本文所要做的工作。先說明本文中所用到'^昭6,,和"!)^6,,意 味上的不同。

^1七110\1^1 1)116 6X5)6111116111:8 ^ 0 1101; 111^01^6 116^ ^ ! ^ ^ , 皿061:1;3111^7 3^(1 4 1 伍 1 1 1

1;11616 1183 1)6611

111611 1311(10111123,^1011 311(1 311817518. 1 1 1 6 卩 " ! 68

1)056 0 【 仏 ! 8 5)8^61: 1 3 力 0 46301:1156 311(1 001111)3X6 81乂 41&176111;七^? 。【 1811(10111123,1:1011 311(1 1 1 0 ^

3X6 6011)1076(1 111 21 131156 。《11111111*161:6(1

^ 乂 ^ ! : "

1116111;8^ ~\^6 001106111;1811;6 011 6(^111161)1108116 ( ! ^ ^ ! ^ , 1)603,1186化巧(!^!!!。!^七18^6 811七116 1616^9111; 1881168 1)111; ^1*110111; 6X1)181 (^)!!!!)!^^!。!^. 016836 1111(1618*311(11115 0 ^ 七 1 1 6 观 7 ^

11

1101)6七。111-

^ ^ ! ^ 01111*11)16 17811(10111128^10118 0911 1)6

61111)10^6(1 111 ( ! ^ ^ ^ 丄 ! ! ^ 6X1^ 6111116111)8 ^ ~\^6 8180 ^ ^ ^ ^ ? 1811(10111129^1011 6.19^ 5181118 & ^ ^61)10^1116 4116 1811(10111128^1011 111 811 638117 8^801:156(1 & ) I I I 560~ 1;1011 2, ^ 6 1111110(11106 811(1 (!^&116七116 1;611118

8X6 16^11116(1 811(1 111\181;1:3^6

111611 1186 111 1)116 0011*6X1; 0【1)^0-1)1616(1 6^^61:11116111;5^ 860*1011 3 511111)16 1:111:66-1)161:6(1 6X^)61:11116111; ^ 1116

(!然。!:!^)^

&

1^)65 0【1111111:11)16 1311(10111128^10118

8X6 111611 01680111)6(1: 860*1011 4 (!!^。!^^^^ 81101 ^ 6 8 6X31111)168 0【111111*11)16 ( ! 。 ! ! ! ^ ^ ^ 。 ! ^ 111

七116

00113*1*116111; 1811(10111128,1510115 0311 1)6 1)61:&)1016(1

111 61*1161 01(161, ^1161638 8601;1011 5 ^ 0 6 8 1116 581116 6)1 1;116 111011181^6 111111111)16 1311(10111128,1:10118^ 860*1011 6 6 ^ 6 8 6X91111)163 111^01^1112 111016 ^ 8 1 1 0116 4)^)6 0【 1111111)11)16 ! : ^ ! ^ 。 ! ! ! ^ ^ 。 ! ^ , 311(1 1161106 ^11166 0 1 111016 1311(10111123,1510118^八81^3^6 ^ 7 【 0 1 6)11111113,^1115 21 1111X6(1 1110(161 & ^ 811811721118 111111*14161:6(1 6X^)61:1111611*5 15 011*11116(1 111 8 6 ^ 0 1 1 7, 3 6 ^ 0 1 1 8 3.(1(11:68568 501116 ^61161:81 1881168 0011061111112 1;61:11111101067 9 ^ 111111111)16 1811(10111129,1110115 ^ 5\111:1161: 6X81111)168 ^ 。 ^ ! ^ 111111^1^)16 1311(10111123^10118 3,16 3,^3118,1)16 111 811611 ( ! ^ ^ ?) 311(1 &0111 1116 111111*1*1616(1 6X156111116111; " ^ ! ) 8 ^ 6 8,1; ^^^://0111:15.1311611.113,11161111111*1^161:I^

這一段說本文所做的事情,是比摘要要說得多的完整版。所做的事有二^0 68

50111)6 311(5 001111)31*6 8 ^ (!!&!^!!!; ^^? 〇《111111力1^)16 1011^013112:0,11011 311(1

^

1 1 0 ^ 0 1 &

61111)1076(1 111 & 1*811186 。【111111*1*161-6(1 6X^)6111116111:3,,禾口 "(!6乂610口 19,11^010^19^1011 4121^91118 & ^ ^6^)1041112 ^ 6 1811(10111128.1)1011 111 8,11 698117 &135011)6(1 &011,,。最後,再用「目錄式」的

列舉,吿訴讀者在哪一節做哪一件事。這是緖論的習慣,雖然,我每次唸到此就,就必 然會跳過。


62

關於統計論文的撰寫

大體說來,這仍然是一篇中規中矩的論文緒論一不能因爲我封002知識淺 薄而小看它。因爲它的目的,不是讓我覺得這文章好,而是讓002的專家覺得這文 章內容。 這是一篇所謂的出8, 8 1011 ^ 6 1 一一原則上應該是較有份量的文章。統計學者

常以「被邀往1158宣讀(並討論)論文」爲榮。

題外的感覺 一 門 學 問 發 展 到 最 後 就 是 愈 來 愈 細 , 到 最 後 , 只 有 高 手 才 會 有 興 趣 。 高 手 加 入 表 示 論 文 困 難 , 論 文 困 難 就 讀 者 少 。 精 妙 設 計 而 來 的 實 驗 配 置 及 ^ , 像 藝 術 品 。 因 爲 他 ^ ^ 計 得 # ^ 密 , 最 後 只 有 專 家 才 懂 他 們 講 究 的 要 點 是 在 何 處 。 以 至 於 可 能 去 眞 正 去 用 的 人 ( 實 驗 者 ) , 可 能 因 背 景 不 足 而 卻 步 。 精 妙 的 設 計 如 美 女 ^ ^ 之 一 分 則 太 長 , 減 之 一 分 則 太 短 。 君 不 見 全 眞 七 子 的 北 斗 七 星 陣 , 在 七 子 都 健 在 的 時 候 , 可 以 抵 擋 東 邪 西 毒 這 樣 的 大 高 手 。 但 將 譚 處 端 換 上 尹 志 平 以 後 , 便 威 力 大 減 。 何 以 故 ? 計 算 太 精 , 所 以 不 能 容 許 小 錯 。 學 問 到 了 一 定 程 度 就 「 閑 人 免 進 」 了 。 從 另 一 個 角 度 來 説 , 當 成 吉 斯 汗 用 萬 人 隊 沖 鋒 陷 陣 的 時 候 , 北 斗 七 星 陣 有 個 屁 用 !

000186 8

0 乂 曾 説 過 一 個 故 事 。 他 説 , 有 一 個 他 系 上 的 學 生 , 因 爲 拓 樸 學 ^ 6 1 ~

0^不夠好,所以沒能通過博士的資格考(^^)。他於是跑到一家公司去 工 作 。 在 公 司 裡 , 他 僅 僅 靠 著 一 個 2

3

實 驗 , 一 路 立 功 升 到 公 司 的 副 總 經 理 !

本段練習 我們附上四篇論文在他們投稿時的摘要和緖論。這些論文最後都接受了,也刊登 出來了。所以也不能算太差。這類文章都在可拒絕可接受之間一看遇到的評審人 &想當好人,還是想當壞人。 現在請你用評審人的角度來讀它。先不要管主要部分(以後再給〗,現在只讀摘要 和緖論。請問: 1.你看得出作者想做甚麼嗎? 1他們的做法或思路有道理嗎?


63

第五章:且先讀幾個緖論

3^作者的學問夠不夠大? I你的直覺是傾向於推薦刊登還是建議拒絕?理由? 竿一篇

^6811115

^0*1^81*1011 111 1 3 6 * 0 1 1 1

61*11116111;8

7116 ^18X11^101131 11161:110(1【01 1)1006881116 ^11110*101191 11181,2116110 16801131106 !1118^118 ^[!11^ ( ! 汪 " 1 8 1)086(1 011 81 乂0乂61《186, ^6116191 1 1 1 1 6 8 ^ 瓜 。 ^ .

?。! 6X1)61111161115 0011-

( ! ^ ^ ^ 1131116 & 1)100^ 3681511, ^ 6 1 6 1)6110(15 。【&01:1^81*1011 3X6 1111:6181)61:86(1

^6110(18

0【【681;, 3^ 113^1110(17112^1110 1681)01186 ^1110^1011 ( ! ! ! ^ ) 15 0011^01^6(1 ^1*11 1^6 (!&!^!! ^1111(^1011 ^ ! ^ , ^01 68X^1 乂0乂61, 1)116 0011^0111*1011 18 16^6886(5 011 1)16^111*6116(1 ^0,1&. ^11 1111*191 311917518 0【1;116 &3^8^ 0^611 111^01^63 001111)11*1116 ^0X61-^186 1^0-591111)16七一力631:8,

8^01(18 31

411:601; 51)601&09,111011 0【1)116 ! ! ! ^ . ^55111111116 0111乂力116 1611^11 0 【 1 ^ 6 11361110(1711811110 13 1010\^11, 508118 3,00111116(1 111 1^311811^011 1)6110(15 1)6^6611 3X^1^3^1011 811(1 1681: 8X6 011111;~ 1^(1, 811(1 1;116 1^0381111)16七漏七681 15 1186(1 10 001111)8X6 1116311 16^615 ^1111115 30*1^8,131011 ^618115 1116811 16^18

011111112 ^ ! ; .

0 0 ^ 6 ^ 1 : , 1^116 ^811(11^ 。【4116 ^0-531111)16 1*631 18 1)836(1 011

1;116 383111111)1^011 ^&^, 1116

3X6 08,11881311

6(^1191 ^311311065^ III 1^1113 8 X ^ 0 1 6 , ^ 6

001151(161 1;116 ^ 1 1 0 0 X 0 1 1 1311^七68七38 ^611 85 1110(1166(1 ^61810115 0【力116 01&881031七一468七^0.8^ 0011601; & I ^61)8111:111:65 &0111 111686 ^85^^1I1I)1;10I15. 1116 1618,1^1^6 ^61:&)10131106 0【^116 1^68*8 9X6 3856886(1 \^ ^ ^ ! ^ ! ! ! ^ ^116111 1;0 811111113^6(1 ( ! ^ ^ 311(1 001111)8X1115 1;11611 5126 811(1 ?0\^61; 0116 0【1116 1110(1166(1 1:63^5 ( ! ^ 0 ^

^ 七 ) 1 5 8110^11 1;0 1)6 811口61:101\

1\111015101131 ^ & ^ ^ ^ ^ 116801131106 11113,5111^ (!^]^!^) 18 & 11011-111^831^6 1116*110(1 1^118,15 1)10(111068 81 1)11116 56(11161106 0 ^ !1119^63 0^ 21 ^ ! ! ! ?, ) ^ ^ 1)161111 111 6100(1 0X766119.^1011 03,1186(1 ^ 1)6011111(11168 ^118,1; 3X6

^^^^^(!

1)0

3X6 5611511;1^6 4 。 011311568

116111:81 8X^1^8^1011 ^ 1^16 ^2181;

011^7 。【9,113117^1031

388111116 1116 1^311^61: 611101;1011 1)6^6611 116111:8,1

9^七1乂3^1011 3,11(1 511^86(1116111; 011311^65 111 1)100(1 0X^61121*1011?七116 11&61110(1711311110 1881)01186 ^111101;1011 ( ! ! ^ ) , 18 1010\^11【1111乂 8.11(1 1116 (^^^

&)110\^ 1116 09,11851911 (!诒七!^!? !!!^。!!.工11

1;1113 3^1;10165 ^ 6 001181(161: 1116 311917515 0 ^ 1^1^1111 ( ! ^ ^ , 001160^6(1 111 0116 0 【 ^ 0 8七8^68,


關於統計論文的撰寫

64

08116(1 118^1^8^1011^

311(1 "!:68力,,,1 13386(1 011 ^0-881111)16七68七8, 1^0111 1^110^16(166 。^ 1)116

1611^11 0 ^ 1:116 112161110(1711811110

11168511161116111:8 41111115七116 1;1:311811:1011 1)61:10(1 136^6611

810*1^3,^1011 311(1 1681; 0311 1)6 。!!!!七^^^!. 7116 ^811(111^ 0^ 1116 018331081 1^0-531111)16 1-168^ 13 1)8186(1 011 1116 383111111)11011 1:113,1; 1116 ^1^3-1)1011 &911& 6^1131 ^811811065^ III 1^18 3X11016,

1;116 168七(!&^ 8X6 0&11551811 ^1*11

1)101)086 1186 0【61 1110(1166(1 1^0-881111)16 1;68七^01

(!^迕1118^ 8110^5 & 1 : 461)3X1111:68 &0111 1^18站^!!!!!口!;&!!. ^ 6 5*11(17 1;111:66 001111)61:1116七681;8, 0116 18 1116

七 6 8 七 ( ^ ^ , 1937^ 1^111011 18 81 1110(11608^1011 0 ^ ^0531111)16七誦七681 1:113,1;

8110\^5 11116(11131 00^8^18110684

八860011(1 001111)61)11:01 1 8 0 1 6 8 3 1 6 - ^ 1 1 1 1 : 6 ) 1 ( 1 ( 。 ^ ) 七 6 8 1 ;

1

( ^ ^ ^ ! ^ 311(1 VV1111;&^]:^1, 1986】4113^ 0811 1)6 1136(1

11011-03,11551811

&!^]1&力1x11(1

001111)6*1*01: 13 1116 ^1100X011 1311^ ( ^ ^ ) ^631; ( ^ ! & ^ ^ 。 ! ! , 1 9 4 5 》 III \^113^ &)110^3? ^ 6 (^)!!!!)^!^ 1;116 018531081 1-4631; ^ 1 1 ^ 1;116 " ^ ^ , 。 ^ , 811(1 ^ 1 1 1;631:8【01 ?]^III ^3,^81 1)836(1 011 21 13100^ (^!印,^11616七116 1)1001^8 81*61118,16 1)6^6611 1)6110(18 0^ 8^1乂8^1011 811(1 1681;,

1116 116X1; 860*1011 (168^]:1^)68 1116 ^1175101021081 ^3X^^01111(1 311(1 ^11781081 1)10068868 1186(1 111 ^^1111 311(1 1;116 111081; 00111111011 1116*110(18 1156(1七0 15100683 1^^1111 (!&七&; 1七3180 ( 1 6 6 I 1 6 3 & ) 1 1 1 ^0-331111)16 168*8 ( ! ! ! ^ ^ ! ! ! ^

018881081 ^0-891111)16力-七&!;) 1)113,1 8X6

001111)8X6(1 111 860*1011 4^ 860*1011 3 (118^118868 1116 8^1)1108^1011 0 ? 1 ^ 0 - 8 8 1 1 1 1 ) 1 6 1)68^8 【01 ?,^1111 (!&^ 311(1 ( ! ^ 。 ! : ! ! ^ 4116 1116*110(18 1156(1 1;0 1(16111;!^ 311(1 (^&!!!^ ( ^ ^ ! ! ! 坊 &0111 08,115818111^ 6)1 681011 70X61, 1116 3126 811(1 ^ 0 ^ 6 1 。〖1116 &111 1681)5 8X6 001111)3X6(1 111 860*1011 4 1181112 81 811111118^1011 5*11(170

&

0

1

1

1

^ 1 0 1 1 1600111111611(18^0118 3X6

^ 化 ! ! . 860*1011 5 0011*611113 418(311881011 311(1 00110111810113.

^11

6^211118111011 0 ^ ^111*11)16 8 6 1 1 2 ^ 1 0 1 ^ 1 1 1 1 8 ^ 1 ^ 4 0 1 * 8 & ^ 0&11061: 111 3

^61:1^1112 0 1 & 8 8 , 1^11111-511111110 ?0^)111211:1011

86113^101:81 118^

& ] : 08111061: 1611(1 1;0 01\181:61 ^1^11111 111(11^10111818, 1^111011 0311

001111501111(1 113^ 136^011(1仏"3880。18^601 ^1*11 1;116 111(11^1(11181『^ &10*018 3.10116. ^11616 1185 136611 11101:6881116 3.^*611*1011 ^211(1 40 1)116 ^16^8161106 0 ^ 111111*11)16 118^ ^3,0*018 ( ^ ! ! ^ ) !61 。311061:, 811(1 !;。七116 11111)01*81106 0 【 ( ^ " ^ ! ^ ! ! ^ 111七61^6111:10118 1^119,1; !^丄!) 111(11^1(1118,18 16(11106 1^11611: 1151^8 3,01*088 1111111:11)16 1)6118.^1018 311111111;811601181^ 1 ^ 6 1)1111)086 0【1^1113 ^9^)61 18 1^0


65

第五章:且先讀幾個緖論

( ! ^ ^ ^ ^ 1116*1100101027七。1361^1& 311 0^1;111181 1111631 0:01111)1113^1011 0亡111111*11)16 113^: &10七01:3 (^。。!^ ^ ! ! ^ ! 。 ! ! ) ^111011 ^0111(1 ^8,01111)8,^6 6^81\1811;1011 0【0811061 1111;61^611^10115^

III七1*0(111(^011

1)681)1*6 1;116 001151(1618,1)16 1^101116(11031 8x1^811068 0^力116 133七1131^06111;1117 ^111*8,11115 5

11111)10^61116111; 111 11!65^16 1^6118,^101:5 16111&1118力116 111081; 6^081010115 1)01)11181*1011-16^61 8七18^6^7 ^01 16(11101116 0811061: 1181^ 28*11113^68 乂町,1)111; 5 1 1 蹈 6 8 1 ; 化 ^ 0^61 6 ^ 116^

^ ! 。 。 ! ^ 0【

0911061 08868 311(1 !!^)七0 0116-^1111(1 0 ^ 0311061: 111011;811^ 00111(1 1?6 1)16^61116(1七11011^1

11111)10^611161118 111 11681^11 1)6118.^101 1)13^11068 (人11161:1。811 。811061: 80。!61^, 2 0 0 4 ; 0。11 311(1 ?6七0, 1 9 8 1 》 人 1 9 1)6106111; ^6011116 111 1;116 18,156 3,1^ 1^111011 1 1 6 ^ 0811061: 08868 0001115 311(1 8^ 29 1)61X6111 ^6011116 111 1116 13^6 0【0811061 363^118, 00111(1 5)0*611*18117 1?6 8101116^6(1 \ ^ 2015, 迀1)16^611111011 6961*5 \^616 11616111:6116(1 811(1 1)6113^101: 0^191126 81181;81116丄11115鴨111(1 1;1:8118~ 121*6 1)0七116 ?16乂6111;1011 0【9^1:0x11118^617 100,000 0811061 03863 311(1 60,000 0811061 ( ! ^ ! ^ 68X^1 " 虹 , \ ^ ^ 虹 2 0 1 5

( " " ! 。 ! ! " 。811061: ?01107 608X01 811(1 1118111*11116 0乇^16(1101116,

2 0 0 3 》 ^ 1 1 6 1 : 6 15 91111)16 6^101611110105108,1 6^1(161106 6)1七116 001151(1618,111011 0亙16(1 1X168,1; 00118111111)151011, 1)11^81081 ^ ^ ! ^ , 811(1

3,01(1 111131(6 111 。?!!!!^]: 1)16^611*1011 6迁01:1;8, !^^^!^虹

1)11^81081 8,0*1^1*7 10^618 4116 115^ 0【08110615 0【〖116 0010115 1?16331:, 311(1 1)05511)17 5)108*8,46 ((^(^(!!&,

031111118010? 311(1 ^ 3 2 1 6 1 ? 1997; 1^16(1611161011 311(111011311, ( ! ^ ^ ^ ) ) . 八 I I 8x1(11*101181

30 1)6106111; 0【0811061 36811;113 0 3 1 1 匕 6 8^1:11)11*6(1 4 。 8^1111; 316七(八1101171110118, 1996)1 ^ ! ^ ] : 111*9^6 。【16(1 11163,1; 1138 1)6611 ^350^1^,1;6(1 ^1*11 1110168186(1 115^ 。【001011 ( ^ ^ ( ! ! ! ! ! , ~\^1111;6 911(1 ^10?116150115 2001^ 311(1 5)108*81*6 08110618 ( 腿 。 ^ ! ^ , 八 1 1 5 1 1 8 * 8 8 0 1 1 , 111111111, 8*31111^61, \^11161;1;, 81101 010^8111111001 2 0 0 1 夂 八 8 8 0 0 1 3 ^ 6 ( 1 ^1*11 1)0*11 口 ! ^ ^ ^ ! 1118,01:1^1^ 911^ 4161; 15 0 1 3 6 8 1 ^ ^111011 1113.7 2100011111: 6)1 1^6^6611 25-30 1)6106111;〇5 09110618 0【1116 001011, 131638^ ( ! ) 。 ^ 七 ! ^ ! ! 。 ^ ! ^ " ) , 611(1011161^111111, 1^116乂, &11(1 6801)11&^3 ( " ^ ! ^ 。 311(1 819110111111 2 0 0 2 》 9

1^0110 8,01(1 18 ^10*601:1^6 9,^311131; 001011 0311061: ^ 010^8111111001 &1 0,1 1998)1 10112~1361:111 1111111;1~ ^8,111111 1186, 111 ^8111;101113^ 1198 1)6611 &)1111(1 10 16(^1106 118^ 6)1 001011 03110619 111^617 1^609.1136 0^ 1*5 !6110 6101(1 0011*6111; ( ^ ^ ^ ! ! ! ! ^ ! 61 0,1 1 9 9 8 》 7116 118^ & I 1113117 41863868, 1110111(11115 001011 0811061 18 3550019,^6(1 ^1*11 1111111:11)16 1)6113^10131 11815: & 0 * 0 1 8 ?

136119^1018 9X6 ! ^ ^ ! 丄 ^ 1111:611*613,^6(1 311(1 1:611(1力0 011131561- ^1*11111 七11086 \^110 6 9 ^

^ ! ^ ! ! - ^ (!&化9X6

!!!^^乂!^!!&^.

( ^ [ ^ ) ;

1)11656

?01 6X91111)16,

3180 11101*6 111^617《0 1)6 86(1611*8,173 5115665^1115

^116

1)6)13,^101:8 1119,7 ^6 111111)113,117 1611150101112 ^866 6,呂.,^11111101135 1^1611:0118; 1/11111311, 1108513 311(1 八1)191118 , 1999〉 ^ 01131156 111 0116 1)6113^101:91 115^ 01 2^6^9.7 ^

0^0!' 111118 1X13-7 861^6 33 & 5^1111111118

01131126 111价16 0*1161 1168,11:11 1^6119,^101:8 ( 微 6 ^

5

21111110118 61 0,1 1999〕,


66

關於統計論文的撰寫

311(1七11616 3X6 ( ^ ^ ! : ^ ! ^ ! ! ! ! ! ^ 1)611^101:81 ^1111011)163 811(1 1111)61:^611*1011 & ^ ! ! ^ 衝 ! : ! ^ 1)118-1: 2^1(16 1)6118^101 01181126 6任01:1;8 8101:033 115^ ? ^ 0 1 8 ^ 001186(1116111117,七0【3X311118^6 1)01)1118,151011-16^61 16(11101:10115 111 031X061: ! ^ ^ , 11; 1118,7 1^6 111691016111 1)0力&!^^七(!&^:]:6七6 1)6118.^101811 113^

1013,∼!1611 81111113^ ^ ! ! ! ! ^ ^ 11112^ ^ 6 8^1)116(1 811111111;81160\1517七。1111111:11)16 1?6118^101:8 ( ! ^ ! ! ; ! ! ^ 0 【 ^ ^ ( ! ! ^ ! ^ , 2 0 0 0 》 ^ 1 1 6 111618^1116 1)10^1(168 11*116 001186118118 88 1)0力116 111031; 0

8^0101)113^6 811813410 81318^6^ 6)1 6^81118,^1112 ^116 6&08X37 【 1 1 1 * 6 1 ^ 6 1 1 1 1 0 1 1 8 ; 111031; 3^11(1168 113^6 81131726(1七116 ^8X10118 011*0011168 111(161)611(1611*17 0 1 \ ^ 0168.^1116 ^ 311111)1151)10 811111 (^.^,

1 1 1 ^ 十 1 I I ? ^ ^ ! ^ ? ^ ) (^^^ 6.3,, ?10011351^1 811(1 8&1118 2 0 0 4 ; 。 腿 ^ ^ , 〗 8 1 1 1 6 8 ,

311(18011, 0011^

30X^80X1^ 0 8 ^ 6 3 , 0611118816? ?811:611, 311(1工688810, 2 0 0 4 夂

^1118 00111(1 1)6

1)1013161118*10, 1)603,1186七116 1186 0 ^ 861)8X8^6 811815^10 5^181*65165 1113,7【68以^ 111 11111)1:01)61 !11&1611068 ^ ^ ^ ( ! ! ] ! ^ 1116 & 8 1 1 0 1 1

6 & 0 【 8 1 1 ^ ! ! ^ 1111;61^6111;1011 1)608,1136 0【0011613,^1011 81110118

3118,1)62163 1118,7 0^11(30& 1;116 01118*611115 6^601 1)1011^11; 8,1)0111; ^

3-5610111613,11011 0 ^ 111111*11)16 1)6118^10181 118^ ^ 1 ; 0 1 8 311(1 118^6 1)6611 01:1^10126(1 8 5 1)61112 1 0 0 81111151181;10^ 丁 116 1)111:1)036 0 ^ 41115 ^0,^61: 13 1;0 ( ^ 化 ^ 口 211116*110(101027七0 1(16111^^8 1 1 0^1;111181 1111631 ^ 00111151118,111011 。〖1111111;1口16 136118^10181 113^ ? ( ^ ! ! ^ ^118,1; ^0111(1 1^68七【8^111*8^6 6^811181*1011 0【811

8001*6 ^ ! ! ^ ! 。 ! ! ) ^01 0811061

0311061: 111*61^6111:1011 ^

第三篇 116(11101116 811^60*1^11;^ 111七116 1(1^6111100(1

801116 8016111;1813 1)16&I七0 6X610186 3111)8*9111:181 ^11(121116111; 111 &)10111181*1116 & 11^6111100(1 ?11110*1011 ^01 411611: ^&^. 15 111081; 3,^1:01)118,1:6 ^

0*1161:8 1)16&I七0 ^

1)0

^ ! ! ^ 6 8 ^ 11616 ^ 3 , 1 0116

0〖1116 11^6111100(1 ^11110*1011 18 1:0 3^0^

力116 (!&^ ^0 1611^111011111^6111100(1 七0 16(11106 1;116 ^ ^ ^ ^ ^ 001111)0116111

& 1111X131116 0 ? 001)611七1^1 11^6111100(15 811(1 16力1)116

(!&^,& 016*611111116力116 , ! 芭 ^ 011 63X^1 11^6111100(1 ^ ^ 6 (!诒七!115111811 56^6181 (!!&!^!!!; ^7?68 0 ^ 81113】60七1^11;7 111 1)116 11^6111100(1 61110*1011 311(1 8110^ ^1111 6X81111)163 1 1 0 ^ 1;11656 ^!!^,)60*1^6 6161116111)8 1118^ ^ 6 ^ ^ 1 1 111016 6(^111*3,1316 1)168^1116111

11111*0(111011011

^ 6 1)101)036 11161:110(18 & 1 : 1110(1611116 3111)3601:1^6 ^ ^ ^ 1 1 1 ^ ! ! ^ ^ . ^ 6

11^6111100(1 ^11110*1011七118^ ^111 16^1111*6 & , ^ 6 1

6131; ( ! 诒 。 ! ! ^ 1)116 113,111116 0 ? 4116 1)101)16111 0【^!!!),)60*1^1^ 111


67

第五章:且先讀幾個緒論

七116 11^6111100(1 ^1111011011;七11611

1 6 ^ 1 6 ^ 801116【613^6(1 16363X011; 311(1 &13117,

1111^1116 11^6111100(1 ^11110*1011 811(1

46&16迕

七68*111121*1011 1)1006(1111:68七113^ 16(11106七116 6560*5

0 ^ 811^60*1^6 ^ 1 6 ^ 8 11111)086(1 011 4116 0^561:^6(1 (!&^.

1.1 8*311)61116111; 0 ^ 1;116 1*1:01)16111

11; 18 801116*111168 ^ ! ! & ^ ^ 1\13^ 1)6116& 0【6X1)6111116111)61:3 8110111(1 1)6 ^ ! ^ ! ! ^ 111130 81 8016111;160 &11817513 111 ^8,^3七118^ 11111111118117 ( ! ^ 七 。 ! ^ 1;116 1116351116(1 110^81^

1980; 1 ^ 7 ^ 6 ^

8016111;181;3 0^561^1112 ^113.15七116乂 ^01^七116

811101^61:, 1980; 801116*111168 11^611)1:61:七116

1996夂6\11;

( ^ 枕 , 6 ) 1 6X91111)16, 1)6611 ^ ^ ( ! ,

1)01111)8 81113』60七1^617, 8^001(11115 1;0

^8^81七0 8110^, 811(1 810001(11116七0 1 1 0 ^ ^1601861^ 11167 ^6116^6 1116

1)0111158 ^61*6 1116381116(1^ 1116 13^*61: 1)1006(11116 13 0【0011186 ^111*6 00111111011^ 1^18 8111)360*1^6 111*611)1:6*3,151011 0【01)861^6(1 (!^^ 1118,7 ^ 6 1)0^8117 8^ 1^6 111100113010118 16^1, 0 1 II 1118.7 ^ 6 1)1111)056611 (^!^!!七116 1)111:1)056611 ! ] ! ^ ! ^ ^ ^ ! ; ^ ! ! , 七 1 1 6 311317518 0 1 3 ^ ^6001116 &3,11(11116111;; 866 6)1 6X31111)16, 019^3011, 1995, 1997; 0 0 ^ 5 0 1 1 311(1 1111381011? 1990; 91101 ?1688 811(1 73!1111:,

2001》

1*116 81115』6(^1^6 1111)61:1)16*3.111011 0【61111)111031 ( ! & ^ 111 111601101116 ^ 8 3 ( ! ! ^ ^ ^ ^ ^ ^ ^ ^ 。 ! ^

^

6

^ ( ^ ) . 3 6 5*81*6(1 ( 口 昭 1 , 。 ? . 。 辻 . ) :

"!)001;018 3X6 1)61115 61100111:3,66(1 10 11111)10^6 1;11611: 011*1091 3^1)1:81381 81^1115 4 。 1113^6 1)6*1:61: 1156 0云1116(11031 16863X011^

1611 1181115 1^656 8^1118, 11 13 11111)01^8111: 10 1611161111)61

1^113,1; 1111161:1)16153^1011 0 【 1 5 1116^1^311)17 311^60*1^6 311(1 0911 1*5615 1681111; 111 13198. ?8^1;5 0^0 110七8X30111111118,116 0 1 1 6 1 3 1 1 1 5 518,^68 0【1:68631011613, 111111(18, 311(1 (^汪811111)17 ^ 0 110七31)68^ &七116111861^68, 0 0 0 ( 1 80161106 1116^11:3,1)17 61111)0(1168 81 1)61131011 1^617^6611 1)116 61111)111015111 0 ^ 0011016^6 38^81 911(1七116 18^10119118111 0亡^661)17 1161(1 0011^10*10118 ^ 1111151856(1 111*611)1618111011 0【(1^^3^, 15 85丄!]^)。!^?!!!!; & 8 ^61&)11111112 116010115 6X^)6!"11116111;5^ 1?1118 6^81118^1^6 ^100688 15 116乂61 150*8117 01^6(^1^6 01 001111)161:617 111(161)611(16111: 0【5016111)151)59 0011^1(^10118 01: 1)11601:6*10611

813,115*10211 3,11317518 0 【 & 6 ^ 6 1 561; 111051; 0^)611 1)10066(18 \^ 5111111119,1*121112七116 (^&!"!!)!!— 1)1011 0 ^ ( ! & ^ 111 1)61'!113 0 【 灶 8 11^6111100(1 ^111101:1011^ 111 ( ^ ( ^ ! 力 0 3 ^ 6 0 1 ^ ^116 ?01111 0【七116 11^6111100(1 ^111101;10115 ^3X10118 38811111口!;10113 3X6 1113,(16 8,1)0111; 1)116 (!&七&, 511011 35 11111*113,1 ^ ^ ^ ! ! ^ ! ! ^ ^ , 1(1611*1031 3184111)111310113, !!!!!!^^&!!^, 6 比 , 人 ^ 6

111(6111100(1 ^11110^1011 1135


68

關於統計論文的撰寫

1)6611 8^)601116(1, 8X1(11*101181 888111111)110118 316 801116*111165 11181(16 (816I116^^I1^6 16^618〖11011^11; 10 1)6 8^1)1:01)1:13*6 8X6 ^ " ^ ( ! ,

8^ 1)1101: (!^!:化!!七!。!! 8,1)0111; 1116 1111(161:171115 1111013861^1)16

^11811^1*168 1X13-7 ^ 6 1^011^11; 111, ^ ^ . ) . ^11817813 0 ? 1:116 (!&七& 8 七0 & 6 6 9 力 ^

16

^ 7 ^0066(18

^

11^6111100(1 ^11101;1011 1:168*1116111; 0【七116 (!&^ 38 511111516 83 ^035113165 30亡118^

8016111;131; 0 1 81131751; 110七10

611618

(!诒仁化^!

111*1:0(11106 111111111181 415*011)1011 0 ^ 1^116 (!&^.

&811(1

41168七0 1113X1111126 1^116 01181106 0【1111(16181:811(11112 ^118,1; 118,1:1116 18

11^1112七。1)611 118七1110\1呂11 1^6 1676816(1 魏 乂 , ^ 1 6 1 1 1;116

8

1116肌^!乂 七^^165

311817515 0 【 ^ 8 , 1 &

3-1)0111;1111(161:171118 1)116110111611011 ^ III七1118

10.03 136611 001111)161:6(15 4116 0131111 0311 16380113^17 1?6

11181(16 ^18^ 1^6 00110111510118 ^1:2^11 &0111力116 311&178!8 8^1)10x11113*6, 1【110七^1:6018617【6&60力, ^ 6 1 騰 8 0〖118^1116, 13,11161 111311 1116 1)08811)16 11118111*611)16*8^10118 811(1 111181111(16181)811(111125 0 ^ 1)116 1 膨 3 0【1181151116 ^ 1116811 \^ 010^0^1^

1111111811 13611155. II;

811(1 81113】6(^1*7, 111 ^ 8

1)6 1156^111七0 618七1)11697 (!^&116 ^ 9 , 1 ;

^6

。。!^^.

八。。01x11116力0 ^1311(111^, 2001 ?

"!1116 ^01(1 013^601;1^1^ ^ 6 1 8

1)0 1116 ^ 1 6 ^ ^0,1 1 1 1 6 七 0 ^ 迕 七 ! ^ ! ! ^ 13 111(1615611(16111:

&0111013561:^1116 81113』601 1116 110*1011 0 【 0 ^ 6 0 * 1 ^ 1 1 ^ 611*3118 ^8,1;

061*8111 1^11128 6X15^;

111(161)611(1611*17 &0111 1116 !!^!!^!, 0 1 1^18^ 11^.6;^ 3X6 8,1; 16881: 111 811 6X^61:1181 8I)116I6. 01)360~ 1;1111:113 8X6 111(161)611(16111; 0 ^ 1111111811 \^81163 311(1 1)6116&. 1?116 11011011 0 【 0 ^ 6 0 * 1 ^ 1 1 ? ^ 13 68^)6018117 1616^0111力0 1)116 5*21*118 0亡0111: ^8x10118 1(1685, 311(1 4116 (!!!^^^。!! 18 1;0 ^118,1: 6X161X1 0^360*1^1*7 18 1)08811316 & I ^ ^ ^ ^ , 011(1 10

6X16111; 11; 18

!^鄉&!丫",

11118 18 1)111; 0116 0【1118117 ^6^111*10118 1113,1; 118^6 1)6611 5\12868^6^^ ^116 61\181乂6 ^11681; & 0^36011^11^ 111 50161106 11218 156611, 811(1 16111811139 311 11111)01:18111; 10^)10 0【(!^仁!^^。!! 81110115 11181:01:18118 811(1 1)11110801)1161:5 0【80161106 (【。! 6X^61181^6 8X1^*101181 ^180118310118 0 ^ 1 1 1 6 8 1 1 1118 0 丑 ' ^ ! ) ^ ^ ^ ! ^ "

5

566 & I 6X91111)16, 8 0 ^ 6 1 5 1998; ?01161 5 1995, 1996; 311(1 038*011

311(1 09115011 1 9 9 2 》 孖 0 1 801116, 801611*160 0 ^ 6 0 * 1 ^ 1 ^ 111^01^68 1116 368X011

06^*8111^ 111

1010^160126 8,1)0111; 0116 0【118^111:6,8 ^611-1^61)1; 860161;85 111(161)611(16111; 0【^113,1; 1111111311 1)611158 1)6116^6; 13111; 111 1118117 08568, ^ 6 611(1 1)118^ ^112^ ^ 6 68x1161 1^011^^ ^0 1)6七1116 9-1)0111; 112^1116, 1111118 0111; 18^61:七0 1?6 ( ^ ! ! ^ ^ & ! ! ^ ^ .

III 811 1111;61:681;1116 6X81111)16 &0111 1)1^8108, !^明!:, 2003 5 1)0111*6(1 0111;化&!;:

"?1011661: 10, 13,11110116(1 111 1972, 1& 1101^ 801116 8 131111011 1111168 &0111 1101116.

18 1133


69

第五章:且先讀幾個緒論

1)6611 510^1116 ^ ^ ! ! , 38 1^116 ^3.^3,^101131 1)1111 0111七&01111116 5\11115 ^0\^1118 1)10516831^61^ 81;1:011861:七116 ^3X1:1161 3^8^ 1^6^0111311 ! ) ^

1 1 3 1 1

^

0 8

) ^

1 七 ^ 1 1 6 1 * 0 1 1 1 ^101)056(1 〔866 4116 ^ 0 ^ 0 1 3

^ 1^6^011,8 18^8

1)8^68-^10(1166(1

01181186 9^ 1;11686 8^06161:311;10115^

II

^111510111 18 ! ! ^ ^ , ? ^ 6 ^ 0 1 1 , 8 811^1 0111346111 ,8 1 廣 8 ^111 1?6 111 ^01 801116 1118^01: 1^62^1116?,

801116*111163 1116 301611*181 1183 511011 (^卩1111(1618*311(11116 311(1 ^ 敏 七 1 1 1 ^ 0 1116 ^116~ 110111611011 116/8116 18 5*11(171116 1111(1 & 0 1 1 1 8 1 1 8 8 1 6 III 501116 08868 ^&

5 0 1 6 1 1 * 1 8 ^ 0 ^ 1 1 1)16(1101110115 0【1^118,1; 8110111(1 1)6

& X 5111)61101 1;0 ^ 8 , 1 ; 1;116 (!&^ 311817315 5661118 1)0 ! ! ! ^ ^ ^ .

1)6116& 0 ^ 1116 801611*181; 0 1 31181731; 3X6 80 8^1011& 6乂611 1)6&16

9 1 1 7 区 8 1 1 7 (^&1^8^

1)6211: 011 1^6 1)116110111611011? 4118^力116 ^8,1)81 8X6 111*611)16*6(1 01:

11181111)1119,1:6(1 8 0 化 & 七 1 ) 1 1 6 7 ^111 16&60^七11686 1)160011061^6(1 乂16^8 。 【 1 ^ 6 5016111;181;^

^11^

1)160011061^6(1 1)61301131 \^16^5 ( " ^ ? ^ 1161(1 1)66)16 1 ) 8 ^ 1 ^ 8117 ^ 汪 ) , ^ 6 8 ^ 0 1 8*10118, 8X6 ^\13^ ^ 6 1 6 & I 七 0 111 1;1118 0011*6x1; 83 5111)3 6 0 ^ 1 \ ^ ^

1.2 11619.^6(1 11636&1*011

0116 8,1)1)10&011 1)0 16(^1101115 1;116 6960*5 0【^1^611116 388111111)^10118 8,1)0111; 111^111100(18 11181^ 1)6【01111(1 111 & 11116 0【16868X011力!!&七111^01^68 1156 0^七116 61111)11:1081 11^6111100(1 ^11101;1011^ III 1)1118 0,^108X^1^ 111081; 1186^11 111 19X^6 881111)168, 81 (118^1:61;126^1, ^ ! ! ! ! ^ ^ , ^6151011 0 ^ 1)116 6111— 1)111031 0(1^ 1118*68X1 0【81 5^60160 111^111100(1 ^111101:1011? 18 !^^^!. III&]:61106 18 1;11611 0 1 8 ^ 6 &0111 1111111;1110111131 (!^七!丄!?;!^。!!.八II 1111&1*1111311)6 &9,^1116 0 ^ 41118 &^^1:03^11 15 4116 9x1(11131011^1 11111010^11 1)3X81116*618 1113,1 8X6 00110011111;8111;17 11111:0(11106(1 11110 1;116 ^ 。 ( ! ^ ,

8 6 6 : 0\^611,

1988, 2 0 0 1 . ?。【1;7?1。3117 8111811 811(1 1110(161:3^6 8126 83!11?165 1111.8 00111(1 1^6 81 ^)!:。!^!!!, 1)111: 6)1 1116 1118881^6 48^21 36*5 1 ^ 1 0 8 1 0

& 1111111115叩!^。^。!^ — ^ , & I 6X81111)16: 8 6 1 1 ^

& 1(11105 ( ^ ^ ? ) ; 311(1 11381:16, 111)31111:9111? 811(1 1^16(1111311? 2 0 0 1 〉 811011 811 3^1)1:03^11 00111(1 1)6 51 11611)^111 81*61118^6^

^ 6 5110^ III 1116 116X1; 8601;1011 1 1 0 ^ 观 ^ [ ^ , 1111(1613*311(1 311(1 8100011111; 6)1 801116 ^ ? 0【5111)3601:1^1^

8011161111165 611161:5 1)116 111^111100(1 ^11110^1011? 911(1

6 8

1101; 1?6 0165116(1^

^ 6 ^111 1 1 8 6 ^ 6 & 1 1 1 1 ; 1 0 1 1 911(1 &)]:111 0【七116 11^6111100(1 ^11110^1011 111 ^111011【01 3^80111*617 0011*111110113 1811(10111

3,1)1655 11^ 1;0 211)101)01^10113111:7 00115*3111;9 11; 15七116 301111; 5)101)3^1111^

(!^!^辻乂 ^111101:1011 0【力116 01^861^3^168 ^1^611七116 1111013561^8,1)168 ^


70

關於統計論文的撰寫

第四篇 人!)!^!。&11011 0 ^ 0 1 1 6 81(16(1 1-168*8 &11(1 & 061161*31126(1 2x1)61*11116111; \\^156

2【1:01: II&46, ^ ^ ^ ^ ^ ( ^ ) , ^ 0 111211-1)611811:7 011^011110160*1(16 ^101:0&!:^&^ 8X1)61:1111611*8:人II 11X31111)16 1181118人【211^01)818

^0*1^8,11011:人【1111(18^16 0118-1161126 111七116 811817518 0 ? 111101:03X1:8^ 七1丑08^011 0^七11086 ^ 1 1 6 8 ^8,1: 6x1111)11; ( ^ & ! ^ ! ! & ^ ! 6X^)1:6881011^

18 1)16 ! ^ ] ! "

^116 0^601:1^68 0^七1113

16868X011 ^ 6 1 6 七 0 6 X 8 1 1 1 1 1 1 6 0 ^ 811111)16八!^0\^, 0116 81(16(1 1^七681;8, 118,^111:81 10^ 4181186)0113*1011, 311(1 21 ^

6 1 1 6

^!

2 6

^ 6X1)6111116111 ^ 5 6 61101 181*6 1116*110(1010^7 ^

0【811011 ^ 乂 ^ ! ^ ! ! ^ ! ! 化 . 入 8 8^ 1)681; 0856 5 ^ 6 91181^26(1 8

1

(

^

^

!

^

811817515 111101:0811:8^

6X1)61:11116111; ( ! ^ ^ ! ^ ! ! ^ ^ 1;0 168七6)1七116 69601 0 ^ 21 0 1 1 0 3 0^1101118^111 161110(1611112【8X^01, ? 1 0 ^ 1 ^ 2 ( ? ^ ) , 911(1 811 !111111311:01: 0 【 ^ \ 0 1 ^

1101:1110116 ^131561:611111 ((^厶),011 ^ 6

6^

1)16831011 0 【 8 2 5 6 ^18,1)1(101)518 1)1181181181 261168.

1168111*8: 1116 。 ? ^ ^ ^ ! ^ / ? ) 18 46&16(1 38七116 1)101)8^1111^ 0【16360*1112 ^ 0 1 111016 ^1116 111111 115^)01116315 8-1: & ^611 IV?6工6^015^ 150\^61^人^

^ 16乂61, 811(1 151101:68 4116 1)101)8^1111^ 0【1113^112 1683七11811化

丁116 11161:110(1 ^ 8 8 8 1 1 0 額 七 。 1 ) 6 311111)16七0叩!^乂 311(1 ^68,1:17 1:101:68863

^91\1& &8 8111811 38 2 0 1 3 ^813 00110111016(1 10 1)6 8x16(1113^6【01 1 ^ 6

6X5)611111611*5 ! ^ 口 ^ ^ ^ .

入 0 1 1 6 31(16(1卜1;68七810116 ^1*11 ( ? ! ^ ^ ^ ! ^ — ^

4 3 ^61163 88 6X111^1112 ?"(!61)611(16111; ^ 父 卩 ^ ^ ! 。 ! ! . 6X81111116(1 ^

^ 1 1 ^ ~ ? 0 1 1

。 【 3 6 (^^^)

0 1 8111811 1(1611*166(1

2x5)16881011 0 ^ 811 4 3 261168 \785 16-

^616 。011&:016(1 1;0 6x1111511; 1^X1^(161)611(16111:

6X^)16881011^

III七1*0(111(^1011

8X1^6111; 0【1116X1561181^6 11110108X1:8,7 ^60)11101027

6118^16(1 111(11^1(11181 1 3 ^ 0 1 8 ^ 0

1168七0 683117 01)1)9111 81 ^101)811)6181)60^1^6 0111)116 6X^)168810111)3,11*61:11 0^*1101188111(18 0亡861168. ^1115 1)0^61:^1111;60111101057 1138 8110^6(1 111^681;18211;01:8七0 418^11086 6 3 x 1 ^ 08110618 ( ^ ! ^ , 811(1

^ . " ^ . , 2 0 0 3 ; 2113112, 11. 61 8 1 , 2 0 0 3 ) 5 ^1500^61 ^61168 1:118,1: 00111^11311*6七0 01118111;1:8111;5 ( ( ^ , 0 . 0 ^ 6 七 8 1 . , 2 0 0 2 ) 5 811(1 (!^。七0001(11118,1:6(1 ^6116 16^13.1:1011 ( ! ^ ! ^

力。1:81 4^6101)111611七 & ! 6^611*5 811011 35 61111317026116518 811(1 56X1181 11181*1118-^1011 ( ^ ! ! ^ , 1\ 61; 31., 2 0 0 0 ; 1^0, 了 . 64 8 1 , 2 0 0 3 ; 只 腿 ^ , 1 3 . 八 . 6 1 31., 2 0 0 2 》


71

第五章:且先讀幾個緒論

1116

&:8七861161:9^1011 11110103X13,75 \^616 861161:3117 152186(1 011 1^0

(!^ !!^!;!!。^!。^^!^.

7 1 1 6 8 6 0 0 ^ ^ 111101:08X1:8^ 6X^61:1111611118 1 1 ^ 0 ^ 6 ^1)11(1121112 1 ^ 0 1 1 1 1 1 ^ 八 ^ ^ ! ^ ! ) ^ , 68X^1 0【 ^111011 1135 1^6611 001X761:16(1 11110 0 0 1 ^ ^

811(16 1113,1; 1133

811(1

5^)0**6(1 ^1*11

1)6611

13,156116(1 \^11;11

1*8 01^11 81101:05)1101:6, 011 81 5111616

10,000-20,000 。!)]^

1)101)68 0^9112 &11(1 8^)66(1,

2 0 0 2 \ III 0011*1:851; 5 11101:6 1606111; !^^!-^!^!!&^ 011^01111016011(16 111101:08X18,789 811011 8 5 1;11086 09616(1

1^7

^6^11161;11^ , 1)10^1(16 &11^0^ 111&111121*1011 3^011七七116 6X1)16851011

11111^^ 831111)16 811(1

0311

118^6

21 11111011 !^!^]: ^ 6 1 1 5 1 ^ ( 丫 肌 8

丁116 1118,^01:1*7 。亡11161:110(10106168 6)1 1X110103X18,7

1^0 ^ 6 3^)01^6(1 8X13,75

(!^.&II 61;

( ^ 以 ^ ! ^ ! ! ! ? ! ! ^ ! ! , 2001 811(1 ^3115 9X18173 9 1 8 0 卩 0 3 6 0*1161:

31.

16^618

111 811

8^)0&6; 2 0 0 2 》

118^6 156611 ( ! ^ ^ 丄 。 ! ^

2000; 1^611

311(1

。11111011111,

^01

6)1

2001;

1 6 ^ 6 ^ 866

811(1 81)66(1, 2002》!!!!&!:力!!!!"^乂 1:11656力^0"(!^6 5^0*1:6(1

8^3*18*1081 1881168,

311011 8 8 11011113112;211;1011七0 0011601;【01 ( ! ^ 13188.

1^1^1161:111016 1^ 111016力11811 2 1^69^111611158 3 X 6 ^ ^ ( ! ,

11 13 110七1)05311)16力0 001111)8X6

311

1^69^111611力8 011力116 331116 0^211^ \^\15 11606581*8,1:1112 811 111001111)161)6 6100^ 1)651511 ( ^ ! ) ) 1 ^ ) 6 ( ! & ^

( ! ^ ! 811(1

011111:011111,

2 0 0 1 〖 八 8 311011, 81)60131 6X^)61:1111611*31 ( ! ^ ^ ! ^ , 511011 8 5 七 1 1 6

16&]:61106 911(1 101: 8,4101181 ( ! 伤 ^ ! ! 8 X 6 1166(16(1 & ) ] : 0 0 1 1 6 0 ^ ^ ! ! ^ ! ^ 8 (^^!!: 811(1 2001; ( ^ ^ ^ 喊 2 0 0 1

311(1

011111011111?

311(1 8^)66(1, 2 0 0 2 夂

III 0011*1351; 5 0116011110160*1(16 11110103X18,75 1186 81 5111216 ( ! ^ 1^(^.11010^ 911(1 1)086 801116 & ( ! 乂 ^ ! ! ! ^ 6 8 , 1110111(11118 & ^3^7 ( ! ^ ^

1110^6836(1 ( ^ ! ! ^ 乂 。 云 8

1)608.1136 11681*1116111; 6 6 ^ 8

511111)1166(1 6X^61:1111611*31

6 1 1 6 8

& 1 6 168*6(1 111(161)611(1611*17 011 63,011 ^ ! ^ ) , 6111111118^1115

1116 1166(1【01 1 6 0 016815118. 1^6^61*1161683? 3^611:1311081 1551168 1761118111, 311011 3 8 1101:1113111^ 0 【 1651(1113118? 1101110呂611611^ 。【1:681(11191 ^8^181106 ? 00116181*1011 0 【 6 1 1 0 1 5 ^1^11111 911 0X1^ 00116121*1011 0 ^

1^101061081 ^ ^ ! ! ! ! ) ^

811(1

3,01035 3 1 1 8 ^ 3 ^

^11X6(1 1110(161 11161:110(13 & 3 1 1 8 1 7 5 1 5 0【111101:03X1:3,7 6X^6111116111;? 1)101)086(1 ^

\\^61&11-

61; 3 1 . ( 。 。 。 丄 ) , 8 。 1 乂 6 8 111081;。【七11686 1831163 〔866 0 1 8 1 1 ^ 6七81., 2 0 0 3 ^01 16^/1&^). !!。,^!, 七116 001111)16X1*7 0【311317313 ^1I9II1^,1;1^^117 11101:69868 ^1*11七11686 3,(1^31106(1 11161:110(18 ^ 1;11119^617, 1118117 0^ 1116 0111:1:6111 ^19,01:1*1011613 0【111101:03X1:3,7

XIII&)]:~

1;60111101057 ^0 110七1)055685七116

1113^1161119^1081 6X^)61*186 1 1 6 0 6 8 8 8 X 7 力 0 11163'!11118^117 ^ ! ! ! ?^ 1^11656 11161;11038, 011七]16 0七1161 11311(1 ^ 1 ^ 0 \ ^ 15 9^ 100)1 ^119^ 18 6 8 5 乂 七 0 11111)161116111; ^1*11 563X011615^ 1^611: 3,11(1

011111*011111

1116*110(18 00111111011 1:0 111031; 16-

( ^ 。 。 ! ) 0 0 1 1 0 1 1 1 ( 1 6 & 3,113,17318 0 ^ ^9,11&1106 ( 八 1 ^ 0 乂 八 )

13 & 119.^111:81 1;001【01 8^11(171118 ^0^81

& 0 1 1 1 6X^)6111116111:8百辻!! 111111七1 口16 09,^620110211【3X^015,,,


關於統計論文的撰寫

72

6131; 。 1 ^ 6 ( ^ 6 0 ^ 1^18 16863X011 ^ 8 5 1;0 6X81111116 1116 11*1111^ 0【811111)16八]^0\^八 5

6)1 81181^818 0 ^ 161)11081*6(1 0112011110160*1(16 111101:08^1817 6^^6111116111;8^ 1 1 1 6 1110*1^8,1:1011 ^ 8 5 5 ^ 6 1 1 610(111611^17 ^ 1)8186(1

5^611 811(1 011111011111 〔 2 0 0 1 〉 1 0 8*8,16(1 " 入 I I 8X^81111)8^6 0【1110(161

811817513 811011 8 8 八 ] ^ 0 乂 八 1 8 1:118,1; 811110(161 11611)8 1116 81131751; 6X1)1016 1116 ( ! ^

1^ 0116 611(13 81 1110(161 !118x16(1118^6, ( ! ^ ^ ^ ^ ! ^ ! ! 吕 1 ^

13 1118x16(1118,1:6 0811 !^】!) ^ 6 81131731:

1(16111;!^ 50111063 0【^3X121*1011 811(1 131&8.,,人860011(18X7 0 ^ 6 0 1 : 1 ^ 6 0【1;1118 5*11(17

^0 8110^

1 1 0 ^ 1181116 & 0116 81(16(1 1-^681; 0811 1)6 1186(1七0 11101:6386 1 ) 0 ^ 6 1 ^ 1 1 1 6 丘 1 1 8 1 0 ^ 6 0 * 1 ^ 6 \ ^ 3 8 七 0 111*10(11106 311 31*611181*1^6 111611110(1 1)0 111016&86 1 ) 0 ^ 6 1 \^ 8^0111^ 卩0311^6 ^1111111211

81 13836 11111111361:。【&186

!)]:。!)&

^ 1 1 6 人 ] ^ 0 乂 人 1 8 5)8X1)101113X1^ 81111)6(1 1)0 31131721118

& 0 1 1 1 111101:03X1817 6X1)6111116111:3

化 " 6 1 1 1 1 ) 1 0 7 81 16^)1108^6(1 ^8^*01181 9X1811661116111 。【1; 168,1)111611*8 ^ 人 I I 6X81111)16 0亡511011 311 6X^)61:1111611^81 (!^^!岳!! 13 0116 111 ^ 1 0 1 1 七 1 1 6 111^651:12^01 1 0 0 ^ 3 3,1; 86116 6X1)16381011 111 ^ 1 1 ( 1 - 1 ^ 6 &11(1 111111)8111; 1)181^8 111 1 ^ 6 1)16861106 0 1 8,13861106 0 【 3 1 1 3x1(16(1 01161111091. ^ 1 & ! ! ^ 111101:03X1817 5*11(1168 111001:1)013,1:6 1;1118 1 ^ ) 6 0 ^ 6X1)6111116111)31 ^ ! ^ ! ! , 6 《 , 七 ] 1 6 1631)01186 0 【 ^61168 111 110111)11111011661110 311(1 1;1111101:1661110 1;1581168 1)0 (!!&!^!!!; 001106111;1811;10118 0【1^0X10 0 1 11161:3^611*1。 ^1:\155 ( ! ^ ! ^ ! ! ^ , 11. 6 4 81., 2 0 0 2 ; 1\13^11162, 3 8 1 . , 2002^ 0 1 1116 1681)01156 0 ^ ^ 6 1 1 6 8 & 0 1 1 1 3 1 & 1 6 1 1 4 1;1851168七0 68*102611 0 1 0*1161: 1101:11101168 ( 八 乜 6 , 1 1 . 2 0 0 3 ; ^0。1。11, ? .

64 81, 2 0 0 2 ; ^ 辻 & , 比 6 七 8 1 ,

(!^^!^ 6 8 5 1 1 ^ 6X1)611(15 1111)0 8117 11111111361 0 【 ^

6 1 1 0

^?

2003; 。0(111. 6 8

81,

6七01., 2 0 0 2 》

份^^!^) \^ 8 1 1 ^ 11111111)61 0【

46^6101)1116111:81 111116 1501111;3 ^ 0 1 1)1001161111081 。乂!)。^!!]^) ^

1)111113X7 1)101061081 0 1 ^ 6 ( ^ 6 0 ^ 1;1118 16868X011 011101113,1:111 161110(1611112【3^*01:, ((^八),16211121*6

?10X1.2

8七。1111016131:811(1 1 1 0 ^ 81

( ? ^ ! . ) , 81101 811^01^ ^0^\1

01103-

1651113,101:9 ^11)1)61:611111

6X1)16831011 (^!!!!!!^ 8611111118^1011 。【^18,1)1(101)315 866(13 〔111(161, 8 . 0 ,

6 七 3 1 . , 2 0 0 3 》 ? ^ ! ) 18 1 1 6 0 6 8 8 3 1 ^ 【 0 1 161)1:6831011 0【61111)1:^01110 1;1311:8 111 ^18,1)1(101)315

(^^,

61; 31., 1 9 9 7 》 2 X 1 ) 1 : 6 3 3 1 0 1 1 0【1)116 6111131701110 8七8^6 111 1)1^1 866(1111128 18 1111111)11:6(1 ^ 七 1 1 6 口 1 8 1 1 七 5 ^ 0 ^ 1 1 1621118,1501 ^1)1361611111 ( ( ? 八 ) 3 1 1 ( 1 13 6111131106(1 \ ^ 8^1)1108^1011 0【11111001182016? , 811 1111111)11:0!' 0 【 0 人 ^ 1 0 5 7 1 1 * 1 1 6 3 1 5 ( ! ^ " ! ! ^ , !^. 6 七 3 1 . , 1 9 8 5 ; 0^03^丄6七&1., 81)6(^603117,

6X1)16881011 ^ 8 8 6X81111116(1 111 ^1(1-1^)6 3 1 1 ^ ^

1997》

566(18 ^ 0 \ ^ 1 1 111 1)116

8,1)861106 811(1 1)16561106 0 〖 1 0 - 8 1\1 111110011&2016~?4 111118 1116 ^61101^1)65 ^ 6 1 6 , ^ ^ 1 ( 1 七 7 ? 6 , 4116 1)1^1 111111;3111:? 311(1 1)1001161111081 6X1)051116 ^ 8 8 ^0 61*1161: 1 0 - 8 ^ 1 111110011&2016-? 0 1 110 11111001182016^ (!!!!:!!!^ 5 6 6 ( 1 呂 6 1 1 1 ^ 1 1 3 ^ 0 1 1 '


第五章:且先讀幾個緒論

0 1 1 1 ^0110115 113^0^116318 \ ^ 8 8 ^19^ ^61168

1:113,1;

?!^!. ^11110410118 (!!!!!!!^ 8611111113*1011 1;0 16^1:683

|31011101;6 6011)1^01110 !^!!^!^. III 8111)1)01:1; 0【511011 81 ^1501;116815? 1116 ^1811801:11)1

16乂615 。 5 1 ^ 0 1)051*1^6 16511121*013 0【61111317086116313,

丫 00X^1,21)0^2 616^3,16(1 1.6.

^616

( ^ ^ )

(!!!!!!^芭61111^113^011

2003〉 , 0111

73

1111:6163^ \ ^ 3 5

(^^,

。 【 1 366(1111125

10 &11(1

1 1 6 ^ 561168

61; 31.,

人 0 0 1 ^ 2 1 ) 0 ^ 1

1^ 811(1

1998;汛。116, 8 丄 . ^ 81., ^。(^),

( ^ ^ , 了.

3X6

61; 81, 1999; 111(161 ^ . ! ) . 61; 31,

1)1181; 6x1111)11:6(1

乙 - ( ^ ^ ! ^ ! ^ 6X^6881011,

!!卩1:651118^6(1 , 八 3 8\1。11, ^ 6 113x1 81 1181*11131 0116 51(16(1七681


第 六 章 : 讀 一 篇 要 大 改 的 文 章

附上的論文是某作者投稿用的第一稿。他肯投出去,大概以爲沒有問題了。我拿 掉了原作者的名字和機關,爲省空間,也拿掉了所附的圖和表,因爲我的目的不是要 讓大家搞懂這論文。 這是典型的國人用英文寫的論文一大、小毛病一大堆。最後被接受的形式, 和下面所顯示的頗不相同。 請挑出所有你能挑出的毛病(包括大小寫的不當和標點的小錯〉。用紅筆在錯的 地方註上就好。

1?116 11111)2101; 0 卩 0 1 1

1^6^1011211 111110^21^1011 。2^)8^3111*3^珏

05186 111 01x11181

41)81:1*3^七: 1^1)1 119^6 1)6611 1)1:8,(11*101181117 001181(1616(1 88 311 11111)01133111; 0118111161 111 ^ & 41&181011 0【8X1^81106(1 1;601111010^ ^116*1161: 11; 0811 1)101110七6 1)60111101067 11051; 0011111;!^ 01 1101; 18 1^

V^^9,\ \01^8]11^^ ^

31

0^635 ^01 1^1&

&)01156(1 1)101316111 111 1606111;17 ^603x168 ^ 71118 5)9^61

91191^7,08

1)6^6611 1^1)1 3,11(5 16510113,1 111110^3,1)1011 03^3^11辻7 ( ! ^ ^ ) . ^ 6 611(1

七116 5^1110^61: 6^60*8 0^ ? 0 1 3X6 1101; 3151^6091 卄 8 8 ^6 11811&11乂七110115111 ^116 11111)3,01; 0【 ?1)1 011 1110 18 \^69^; 1)116 611*17 【 ? 0 1 11&8 110 1186【01 611113,1101112 111(1186110118 111110^^1011 0

03131111;;^ 1^116 16863X011 1119111&81;5 111016331115 ^0111681)10 II&;!)丄!!口!!七^ 5

5*1:6115*116111115七^16


關於統計論文的撰寫

76

111110^^1011 。31)8^111*168 311(1七60111101027 81^8011361107 111 ^011165*10 6111)61:1)1:1865 3X6 ( ! ^ ] : ! ! ! ! 11811*8 1;0 11111)10^6 1110 ^

1688 ( ! ^ ^ ^ ^ ^ ^ 001111^1163? 16^101181 111110^3,1)1011 。 叩 ^ ! & 七 乂 , 8^)1110^61

1^6^ ^017(18: 63601; 1;116 1^61 5

。【^!^印!^!^!!!^!!!!)

1. 111^1*0(111011011 ^111*111811)101131 001111)811163 ( ^ ! ! ^ ^ ) 60011011110 1x11:6213^1011 ^

1?111:011611

1116 1111;61:11311;101131 6001101117.

311 ^ ! ) 。 ! ^ ? ^ 1016 111 1116 1)100685 。 《 ^ 。 ^

08-1)1*81 。!!^&!^, ^11^03 111811118111 ^ ! ^ ^ 00111160*1011

^116 &)161511 0111:601; 111^681;1116111:

^11^05 1138 8-11681(17 1^6001116

8011106

1118117

( ? ! ) ! ) 00110011111;3111;

1688 ( ^ ^ 。 ^ ( ! 00111111168

(!^。^)七0

0^3111 1111;6111211101131 。 叩 辻 & ^ 311(1 3x1^81106(1 1)60111101027 11101:68511161^ 011111636 50^6111~ 1116111; 81^8,75 8.^2101168 10*3 0【11111)01:1)8,1106力0 0^110,0^1X1^ 011213,1:1011 311(1 1)116 1;60111101057,, !!!^^!:^! ?01, 562.1

,, 。!^!!-^!。。!:" ^6110^

1)01107,

311(1 1116(1

1:0

6)161511

111^631;1116111; 811106 ^ 6 16^~

^35 。311:16(1 ^11111)161116111:6(1七116 "!118x1^1; 6)1

^111*8,1:6 1;116 1;60111101051081 1)1021685 1;111:011611

^19^,111^

1185 81163^7 ^606^6(1七!^七01:91 3111011111 0^ &)161511 111^65*111611*5 0^1:

1)11110118 ^ ! ! ^ 11111)11 1:116 611(1 0亡2004, 811(1 811106 1993 0111119 1138 1)6611 1:116 18X^681 1

1^1)1 16011)16111; 111七116 1^005^ III 2003, ^ ! ) ! ^ 0^ 1116 1)168^0111; 0【1)116 6^1(1611110 8^.118? 1;116 81110\111^ 0【1腹8^(1 ^ 0 1 168,0116(1 53.505 1511110118 ^ ! ! ^ ^ ^111011 5X11*1)8336(1 ^1116110^ 811(1 1113,(16 01111181 1^6001116 1116 111051;

! ^ ^ ^ ^ !

?01

001111*17

811101111七0亙!!!^^?! ? 0 1 168^116(1 60.63 1)11110115 ^ ! ! ^ ! ^ . 1188 81111)3856(1 40 1)61X6111;, 1^1)1 18 1)116 11111)01^3111; 1X^8^

[(^!^,

1^0^力116 18,1:10 0 卩 ? 0 1 1:0 0 0 ?

2005】

( ! ! ^ ! ! ! ^ &)1:06七0

。 1 ^ 0 1 1185 1)6116111:8,116(1 ^ 0

811 0^1力116 ^01:1(1 III 2004,

1113117

1)0081; 60011011110 36^101)1116111; 111 011111&. 1116

8^6(^8 0【1116 118,1^101131 6001101117

化 6

11101:62186 。【150*81 8111011111 ^116 116呂8^1乂6 ^11110*1011 8,^)1)68X6(1 ^81(1118117 311011 98 1;116 110 010661160115 6X^)81181011 。【011111686 11181111?8101;1111116 811(1 1116 111七61:113^101181 1)13^16 ( ! ^ ^ ! ^ 。 ! ! 1)608,1186 。【4116 6X06881^6 1611&1106 。 【 ? 0 1 811(1 ? 0 1 1;601111010^ !!。 ^ &1)0111;七116 31^9^6~ 1

^10 69601; 0^ 1116 ,,1113x156七&]: 1;60111101067,, 1)0110^? 0068 ? 0 1 ^1111:3,1)6七116 1:60111101057 1)10^688 111 ( ! 。 ! ! ! ^ ! ; ! 。 6111:611)1:1568? ^016 811(1 111016 011111686 801101315 156^111 1;0 1)11111& 8,1)0111; 1;116 ?1)1 8*1:8.^627 ^ ! ^ ^ ! ) ^ ^ ^ ! ^ .

^18117 1111;61:11811;1011811 30110181X5 ^ ) ! ! ! ! ! ^ ^ 111*0 1;116 ^6116~


第六章:讀一篇要大改的文章

^8 1116 1119111

77

。 5 1:11;61:113^101131 08^11;318 &11x1011, ^ 6 1111158^1; 0^ ? 0 1 011力116 60011-

01117 811(1 1;601111010^ 1 。 1)116丘03七0011111;17 ^肪1^6611 1581(1 111016 811(1 11101:6 81**611*1011 \^ 1111:6111811;101181 176868X01161:8^ ^ 8 1 1 7 16863X01168 8110^6(1 4118,1; ? 0 1 ^ 8 8 11111)011:3111; 1;0 &101111)8.1)6 60011011110 ^6^6101)1116111; 811(1 1)60111101051081 1)10^1:683 6)1 1116 1x051 & 1 化 6 ^6101)1118 0011111)1168 ^ 0 ^ 0 ? 1994;仄。1^0 6 七 8 1 , 1996;

0011111;17,

681)6013117

1999;

3301101111

9

801611-

25*6111 61; 31-, 1998^ 00^6乂61:,61111)111031 1656XII 011 1)116 85)1110^61 63(60*5 0^ 51)1 41(111 ,1; 8115)1)011; 3*311(11)01111)8 8^0乂6, 1160611*17 801116 61111)111031 16863X01168 111(1103^6(1七113^ 七116 3?1110^1 61?601;8 0^ ^11^08 ^616 ^63^ 311(1 1^6 1)0811^6

0【?1)1 011 6001101117

5

( ^ ^ & ! ) ! ! ^ ! ^ 8110111(1 118^6 501116 061*3111 0011(11*10118 ^011118, 1992; 38x1(184 811(1 331:118011

5

1 9 9 3 ; 《 。 ^ 。 , 1994; 1)6^6110, 1996, 19971.

?01 11181117

1^。8,力116

001161^1011

^6^6611

? 0 1 811(1 1)60111101051091 1)1061688 01 1)10(1110111^11^ ^ 。 ^ ] ! ^98 1101; 812111603111; 6X061)4 6)1: 1

七11086欧口。!:!;-。!^^

001111*1168

[^^!站!!!?!:细&!^&!!!,

5

8811811, 811(1 83.1)5&)!^, 1996】811(1

1:11056 0011111;1:168 118^1118 111^1-16^61 0【1111111311 08,1)11:3-18【801:61132*6111 , 0601:6601:10? 311(1 1(66, 1998》 ^ ^ ^ ^ ! : 1^1)1 0811

1)11115

^116力60111101027 ?1051688 111 01111181? 011111636 5011018X5 &180

118^6 011361:6111; 。 ! ) ! ! ^ 。 ! ^ . 1*^0 8011013X5 111 011111636 ^08,(161117 。《500181 501611068

^00~

311(1 0111111&I ^0X1& 18186(1 801116 1:6863X01163 011 1^18 ^101)16111 111 2001 311(1 2003

311311

! ^ ^ ? ^ ^ ^ ^ . ^1167 130*11 111^6811188^6(1 1116 6111)611)1:1868 111^6816(1 ^ 1^21116

^11^08 8111(1 3^61 31181-

1116 001160*6(1 6.8^^ 11167 01)1:31116(1 0011*13X7 00110111810115^ ^0001(11116七。1116 \^16^

0〖5030』11811 31911^ ^1)1 0&II 1)003七160)11101067 ?1061655^ ^1161:6 1166(1 1101

8117 ? ! ^ 。 。 ! ! ! ^ -

41011. 1^1^08 ^111 ( ^ & ^ ! ^ 1 ) 1 1 1 1 5 七 ! ^ 8X1^81106(1 460111101027, 1113^111116 311(1 6(11111)111611*5

4。

8118X6 011111636 11131^61; 811(1 0011860111611*17 61113X56 ^11611 1)101)011:10118 ^ \\^1116 0111111& ^011^ 001181(1616(1 ^10^七116 1;60111101057 8^)1110^1: 6660*8 。 【 ? 0 1 \^616

1104

(!^!]!^.

^^31106(1

111210111116 311(1 6^11115111611*3 8X6 1101; 6(111811七。1;60111101061081 。3^9^1111:168 , 01100111^9X7, ?1)1 61111611)11863 ^0111(1 ( ^ 化 ^ ^ 911^ 5(^116626 。11七II&;0 8^1乂11168 111 01011163*10 611*611)11568^ 5(0161211 ( ! ! ^ ^ 111^68*111611158 9X6 09,1116(1

^111011811

^ ^ ^ 。 8

口!:!!!!&!:玎;^.

1^1^05 118^6

0^10115 3X1^31118^68 1613-11^61^ 001111)3.16(1 10 (!。!!^^七1。 61*1118, 3,11(1 1101(1七116 111081; 乂1^010118 1)3X1)5 111力116 ^011(1 6001101117. 1116 00X1*111)11*1011 0^ 1\11^08 1;111:011^1 ^11:601; 111^68*1116111)8 011 ^60111101027 1^3X18(61 18 0^10118 111 1; 11601^ ^1^08 001111)1116 1:11611 0^11 1)1:6(101111113,1106 1110111(11115 03-1)1^&!, 1;601111010^, 1118113^611161^ 8^1118, 111&]:^6*1115 0113111161 I I & 0 3,11(1 80 &^七!! 5


關於統計論文的撰寫

78 ^

^11)11七116 2^1^811^816

68

1 6

108

^ 七^1111^1^ 1110111(11115 1181*1116 1:680111:068, 1111111811 168011106

311(1 1118X^61; 80816 811(1 80 &)1*11 1〇1681126 1116 8^8111:8^6 1^61112 ^61)811:6(1 ^1*11 111 ^ 6 ^11016 ^ ! ^ . ^ ! ^ 。 8 (^!&0^

11101:6 2^68^

63^11

0*1161

^^(^!!^^.

8,11)6111:1011 011 1)16 II&;0 0^ 116^

1?116

111^6311111611*8 0【1^11^08 1118,7 1)1:1118 ?16010118 1630\11:068 1110111(11112 08^1七318, 1;60111101~

0^7, 1113118,261116111; 81^1118, I I & ! ) 08^8^1111168, 311(1七]16 116^01:1?: 0【11^61118^101131七18^6 &)]: ^ 6 11081; 00\1111;1^ !

' 3 ^ 1 1 ^

? 0 1 ; 1)11112 ^60111101057

8^)1110761: 63601)8 4111:011611 ^6111011~

8七181七1011, 1111118.11011 16^6156 6116111661:1116 111(11^1181 0011*8^, (!!&181011 。《1118118^61116111; 5

5

81^1118, 811(1 1116 6X1)101*8,1:1011 0【11^61:118^101181 1118X^61;^ 11118 18 136116&0131 1;0 8111111^七116 ^&^) 111 111^1一七60111101027 ^1)11 111 810061618^011, 311(1

0011111;1:168? 1;0 ^^^^^111(1115131:181 1:601111010^

^ ^ ^ ^ ^ ( !

1;0 &1;011

1)60111101027 111(1611*8,1:10115 311(1 18^ 111七116 0011156 0【

( ^ ^ 】 。 ! ) ! ! ^ ! ! ! ; . 1^1:1;116111101:6, ^11^08 118^6 8*1011261: 1;60111101057 0011301011811688 811(1 81^118; 1;116^ 1113156 1186 0【16568X011 1113*1^11110113, 11111^61:51*163 811(1 0*1161: 861^106 01@^^31;10118 111016 1

1

1)05111^61^ 80 ^1^03 0811【3^11118^6《116 001181:1:1101;1011 0【118,^101181 111110^8^1011 5^3*6111 ^01 & 11054 0011111:17七0 801116 6X4611 七. 71)1

1118^ 3180 1)11112 0 6 8 ^ ^ 3?1110^61 6&。化.丁116 ^60111101057 8^)1110^61: 6660*5 0【 6

^ ^ 0 8 3X6 111^617

1;0 乂61:7

111 1)1)03 111 01(161力0

&61316. 1七18

0116 1^111(1 0【01110131 111681115 111211; ^11^08 11X7681;

111611: 0^11 ^601111010^ 3x1^311*3,563 811(1 8^ 1:116 881116 1^11116 1;0

5113X6 1;116 0081; 8x1^811113^68 ^11)11 !/!)。^. ^11^08 11105*17 111^681)6(1 1)116 03,^11:81-111161181^6 811(1 160111101027-1111:61181^6 111(11181)1163 ^1011 ^616 18^81(1 111 0111118 1111(161: 1^6 001181(1618,1:1011 1

0〖七116 ^01381 8 * 1 8 , 1 : 6 2 7 肌 ^ 力 ! ^ 丫 311116(1

1;0

000111)7 011111656 1118X^61;

11110116

^61111^

^1^03 118^6 0^10118 001111)6*1^6 8x1^31148668 001111)8X6(1 4。 ^ ^ ^ ! ! ^ &11118. ^116^ 91^8^8 1311118 01016 8x1^81106(1 1601111010^ 311(1 6(11111)111611*8 11^011^1 71)1 , 00^6^61:,51)1110^61 69601;5 0911^

001116 111*0 1)61112 21111;0111211;10811^ 1111131:18111 811(1 11683118^1 ( ! ^ ) 161)168611*601

111811;七116 8口 1110^61: 62(601)8 &0111

71)1 61^611)1:1868 ^616 111 111^61:86 1)1:01)011)1011 10七116 8126 0?

1;60111101087 & ^9 ^6*^6611 &161511 8111(1 4011168*10 8

611115

( ! ^ ^ ^ , 1^01^0, 181151111 811(1 263911 〔1996〉 &180 81^111608111;

31)1110^61

01117

1^ 1)1311*5

^1*11

81

611118

1:116 1*8,11911 ^ ^ ^ ! ! ^ ^ . 1^01^0

&1111(1 1;11^ 81 1)051*1^6 811(1 8*3^18*108117

1110(161:81*6 1;601111010^ ^ '?' ^1161:6 81111051 8

^616 1101; 8117 81)1110^61: 63601)8 ^ 6 1 1 4116 1;60111101027 ^011168*10

&0111

111

61^11 611115 ^98 11111011 !^区!^!: 1^1011

9,0001(11116 4。 1116 16563X011 0^ ^6X100 811(1

0611618117 31)68^116

七116 111*10(11106(1 ^60111101057 I I 8 1 1)6 3111*3,1516 ^1*11 1)116 ?8-0*01: 611(10^1116111:3 111 4116 11051; 0011111;1:^ 1【七^

16

1601111010^

^616 1;00

111111*168 & ^ ( ! 。 ! ! ^ ^ ^ 。 &11118 10 11111158^6 311(1 15601111010510811 08^8^11^168七。8,1)50115 811(1

\01^

8^11011^1 1)11616 1119,7

168X11, ( ! 。 ! ! ! ^ ! ; ^

611118

瓜&]1乂

。卩!^^-

1118,7 119-^6 1101: 611011^1

111111^1:6 8X1^31106(1 1:60111101087 &0111

1^1)1 6111;61~


第六章:讀一篇要大改的文章

79

1)11868 311(1 0911,1; 1118^6 \^& 34^8,1106(1 ^60111101027匕 611^056116*10^ ^11115 11 168111*8 111 11七1;16 6

31)1110^61

8608,1136 0^ 1:116 8^101011688 0^ !11&)11118^1011, 111051; 1;60111101027

6(1^6 8X6 1)3^11;

!^!。^"^.

01117

1^110^1~

1^011^1 1)13,0*106 0811 \^6^ 1)6 11188*61:6(1 ,』1181; 85 ^116

5^11(17 0【601611521)6111 (^^^) 8110^6(1 4113,1; 1;116 111*10(11101)1011 0【11101:6 8,(1^81106(1 1^60111101067 911(1 1)116 16(1111161116111;。【8^801^1^6 03^1)1111^ 111化6 11051; 001111*1^ ^616 ^111150111【8^01:8 0【 60011011110 5^0^111 ^

1^01

"^&8 111016 1)10 ( ! ! ! ^ ! ^ ^ 1)11311 ( ! ^ ^ ! ! ! ^ ^ ! ^ 。 111\^681;1116111; 00.1^ ^11611

1;116 11051: 0011111;17 ^ ^ ^ 111111111111111 1^111651101(1 8*00^ 0【1111111311 ^ & ^ ^ ! . 1)6^16110 13

( ! ! ^ ^ ^ ^ ^ 4118,1; 1^01 118x1 150511)1^6

七。1116 0011111;1:168

(!^。。)

! ^ ^ ! 1;60111101057

11628^1乂6 6360*8 011 1;116 &110^618^ 800011^111311*1011 0 【 ^ 0 1 110七01117 ^6?611^ 011 1^6 1)60111101057

131011^11;

^ &)161511 111^68*1116111;

9

1)111;

3180 ^61)611(18七0 81 18X^6 6X^6111;

011

^116 8,13111117 。【8,13501:1)111011 811(1 3531111113.11011 0【8,(1^91106(1 1;60111101027 ? ^011168^10 &:1118. 1*0 0

3X1(1111168^)1110^61 6960*8 0^ 1^1)1, 1116 11051; 001111*17 01^3^ 1^6 111 ?0386851011 0【611011^1 1111111311 03,1)1*91 1113,1; 1138 16061^6(1《00(1 6(1110&1)1011 811(1 11811111153? 811^ ^10066(18 1)0 16&)1111 311(1 111110乂8^6 0011311811^17 21^61

11*11121115

^

8,0(11111:6(1 1;60111101067 6迁6。1;1乂61「

6608,1186 ^11^05 ^038685 111016 8,(1^91106(1 1^111101067 311^ 111311218

6111611

^

3^1118

00111-

1)8X6(1 ^1*11 ^0111681;10 &11118,力!^辻611*1:165 11101101)01126 1)116 01151118,1 001111)61:11)1011 1118X^:61; 111 4116 11031; 001111*179 5^6626 0111; 4116 ( ! 。 ! ! ^ " ^ &1118

111七116 111(1118*17 811^ 10^61 1;116 11181~

1^61; 81181:6 。【010111631:10 6111:61:1)1:1868^ 1^01^0 ( ^ ^ ) &1111(1 1:118,1; 110 6^(161106恥111(1 8^10^ 力116 口08^1乂6 6660*5 ^11^08 ^38

。【?01

011 ( ! 。 ! ! ! ^ ! ^ 。 1)10(1110151^1^ ^ 。 ^ ! ! 1^1611 1)116 1118X1^力511316 0【 1

811(1 1116 1:60111101057 821? ^38七00 101^1&. 1)611101151:1:8,11011 811(1 00011)6!^

1^1011 6360^8 3X6 168117 6960^1^6 111601131115111 0? 51)1110^61 6&01;8, 1)111; 11118 011181; 1?6 1)386(1 011 0011681)011(11116 1;601111010^ 。3^3^111乜68 111 ^011168*10 &11118. ^ ^ 。 5 111^631; 1110011)0181*6 5

911(1 1)111011836 1;116 1)0*611*1211 ! ^ & ! ^ 111 1;116 11081; 0011111;!^, ^111011 111817 03-1156 1^6 111110^8^ 《!011 8^*1^1*168 111 1;116 1)111011336(1 6111)61:1)1136 1)6 ^ ^ & ^ ^ , 1)6 ^13113&『16(1 01: 1)6 01056(1; ^111七1161111016 ( ! ^ ^ ^ ^ ^ 1116 16^01131 II&:0 210*1^168 1113^6 118 6X06881^617 161^ 011 ?

001111*1:165 3.1)0111; ^6^ ^60)11101057 311^ 1)11115七^ ^ ^ ^ 16

6

111

1116 1118^011七!68 0【^[!^08 111^681; 111 0111 0011111;]:7肌己6115&8 ^11 6

1;1011

311(1 0^61:81*1011

0^

1116 6x19,1 ^ ^ ( ! ^ !

3^ ^1686111;^

6)161511

。 ! ^ 乂 ^ ) ^ ^ ! ! ^

111086 1^6^ !11七611116(118X6 1)10(1110*5

^616 115113117 5111)1)116(1 1)7 ^1^03 111七6?11911^ 8 0 1116 1111^6 6^60*8 \^616 111111*6(1 ^ 1\1^05 !11七651:3^6

011111656 1)356 0 【 ! ! ! ^ ! ! ! ! ^ ^ ! ! ! ^ ^61^ 310\^7七0 ^101;601; 1^11611: 0\^11 136011-

110丄0^7 311(1 4116 1X13,1111^8,0*1111115 6乂|?63:1;186,八130,561(10111 11^6 1*613^1011 11111^6131^165 3,11(1 16363X011

^ ∼ 。 8 115113117《3^6

011111686

^ ^ 匕 ^ ! ^10(1110^1011 3力1&七-


關於統計論文的撰寫

80

6^7 011(1 8X181166 6^61^ ^111(1 0【^1110*101181 1)6118.^1018 111 ^ 6 ^11016 ^011(1七0 6X08^8,1:6 1)116 00011)61111)1^6 81(1^811*21668 011 68X^1

011111686 6111:611)1:1868 8X6】113七0116 0【1七8 11131111&^-

七1116(1 01181115 111 1 1 1 6 呂 】 。 ^ 1)10(1110*1011 ^ ^1113 !8 11181111&10*1116七18!18&I ^七1101; 460111101067 七1:3118&1. 1(60111101027 011X1118^011 118-1)156116(1

01117 ^1七]1!11 1^16

1^1^08^ 11118 13 0116 1^111(1

。【&08,111112 60011011110 \^11;11 1)84 ^01111(1^011^ 1*116 94^81106(1 1^60111101057 811(1 6(11111)1116111; 0311,七1)6 1^18115^61:1:6(1 1;0 ^0111681:10 &:1113 21111;011181;10811^ 丁 116 1)60111101027 51;]:68,111 0011^ 1)6 1

^181186)11116(1 1111:0 611(10^116111。 1:601111010^ 。9^8^1111:168 68511^ ^116 1)1111)086 0〖11118

^0,1^01

18 1;0 81131726 ^11811*11:81*1^617!^丄&七!。!^!^!) 1)6^6611

1^01 811(1 165101181 111110^8,111011 0811)8,131111:168 ( ! ^ 。 ) 811(1《0 611(1 1;116 0161;61:1111113111;8 0【1110. ^ 6 ^111 61111)11:109117 ^0 16868X011 011 1116 0011618^1011 136^6611 ? 0 1 811(1 1110 1181112 6.3^^ 0【 6&011 1)10^11106 111 01111181; ^611^ ^6*1161 1116 11101:6 0【!!!^^^^! ?1)1 111 8^ 1)10^11106 ^111 168x1 七0 & 11151161: 16^1 0【111110^1011 。8^3151111;7, 2 1)168611*8 0111 16363X011 ! ! ^ ! ^ .

158^61 18 01^811126(1 38【0110^8, 860*1011

860*1011 3 ^ 6 8 1)116 000【166101181

1皿0乂8^1011

08^8^1111;168, 860*1011 4 1686&101165 61111)11103117 1116 ! ^ 丄 & 乜 。 ! ^ ! ! ! ! ) 1)6^6611 ? 0 1 31101 1^10 1181115

1X1111七1^8X13^6 3*31^18*108 311817518. 860^1011

5

00118^1110^8 61111)111081 1110(161七0

0X181^2&

11111)9^.1 0【71)1 011 1110 ^111;1161^ 860*1011 6 311817268 ^ 6 65601; 0【^01 10 1)116 16^1 0【 ^!^]^!^!^!^!^!). 860*1011

7 (^(^(^.

1^6868^X11 ^631@11 III ^1118 ^ & ^ ^ ! : ,

&)0115 011 1^6 ^ & ^ 。 ! ^ ! ^ ! ) 1)6^6611 ? 0 1 811(1 1110 811^ V11^11^1; ^116

1016 0亡孖1)1 111力116 1110 111 0111118.. ^^^118,1; 1&力116 16^101181 111110^81*1011 08^8^)1111^? ^1113 18 1)1111011)81 185116 ^6 5110111(1 0011(11101; 011. 8 0 ^6 1113^6 061*81111 1;116 0011061)1; 0^ 1110 61541^ III &101, 1;116 0011110*3,151011 0【1110 15 ^61^ &1)1111(18111: ^ 工 靜 ^ 丘 ? 1 ) 1 1 8 0 1 1 6 0【1116 1113111 ^9X3*015 0【1110; 11 11168118七116 8^1111^ 0【1601111010^ 111110(11101112 311(11)18118&!:. 0111116 1)8515 0〖七116 001111)1:61161151011 011七116 11168111115 0〖七116 0011061)1;? ^6 68*811)11311 21 861163 0【111(1101)018 七 。 1 1 1 0

001111)161:617 811(1 01)3 60*1^61^ 111611 ^6 00118*11101; 8^'!1*1161)10 6^81113,1:1116

611101;1011^ 1?116 30016 0^ 1116 001181)11101:6(1 ^1111011011 0811 16^)1:686111; 1110 8^0111811;61^ \\?6 1186 1)1111011)81 001111)0116111; 811817518 0【111111*1^8X18,116 813^18*108七0 01)18111 8^11*1161)10 6^81113,11112 ^11110*1011 ^ ^ 6

1)1111011)81 001111)0116111; ( ? 。 ! ^ ] ^ 83 1)116 8711*116*10

6^81118,151115 111(110*01:七。3^1)1:8186 1110 811(1 03101118,1^6 1^116 0011613,1:1011 1^617^6611 ?1)1 811(1 1110^ 8608,1186 ?0111 18 4116 ^61^11*6(1 311111 0【63,011 011211131 ^8X18^16, 311(1 1*8 ^8,1:181106 18


第六章:讀一篇要大改的文章

81

七116 1)1名名68、 11; 0311 16&601; 1113,^01:1*7〇5111&11X13,1)1011 0【311 011511181 ^ & ^ .

^116 &101)01:

103X111165 0【68X^1 01^11131 ^8X13,1)16 011 ?0111 8X6 1116 0011613,1)1011 0【681011 00211181 ^8^18,1)16 811(1 ?0111 ^ 1111011611 41115 311313^518 ^6 0311 8180 013*8111 1116 (161;61:II11I1^I11;5 0^ 1110. ^111 613.1)018,16 0110113X8X3*61181:108 0【801116 1;^151081 16510118 ^ \\^6 0011(11101; 011 ( ! ^ ^ ^ ! ! ^ ^ 001111)316 911(1 81131^515力0 8111111118X126 1116 1\1168 0^ ( ^ ^ 。 ^ ) ! ! ! ^ 0【1110 ^ ^ 6 68*8,1)11511七116 61111)111081 010(161攻1*11 16^6331011 311317518七0 001111)316七116 ! ^ ^ ! " 1:81106 0【6&011 &1X^01 111811; 1)6 1619,16(1七0 1110 1181112力^ 11111111361 。【卩8^611力8^1)1103^10118 16

4。 111635111:6 1110 ^ 111611观1156 0011618,1)1011 311317 ^ 化!。!!^ 503.^61 6.10.^101^ 811(1 1116 8

5

^61;61111111811;6 006&016111)8 0^ 16516831011 1110(161 1)0 1113111&81: 4116 0〖^!^!^!)!^!^!!]^!!!!). ^ 1 1 肌 ^ ! 乂

3 6 8

3 X 6

0【1^1)1 011 4116 16乂61

^6814 ^1*11 8^.8 313.^13^1031 50^8^6^

八11 (!&!;311186(1 1111;1115 168631011 9X6 01)1131116(1 &0111 01111181 8^8,1:1311091 7681130015:, 01111181 3!311-1;6011 111(11181)17 8118,^15*1031 ^631:1)001?:, 811(1 011111^ 80161106 311(1 160111101027 3^^13^1031 ^63^15001^ 111686力11166 ^ 0111118..

801116

6 8 1 1

^

0 0

^

9 X 6

^1111)116(1 \^ 1^3,11101131 811168,11 0^ 8*9,15151510 0^

0【1;116 ^8X18,1)168 0011^ 1^6 0111601)17 01)1)81116(1 311(1观1)10066(1 1;0 801116 811111)16

001111)11113,11011 ^八11 &0^9 3X6七116 111031; 11^0(18^6 01111611*17 8^13^16 , 1

3,

^11211; 15 ^116 1*63101131

111110\^1^1011

02^)31)111*5^?

160111101051081 111110^9,^1011 13 81 0011061)1 0^ 60011011110 08,116201^; 1七1116&115七116 600110111101;60111101051091 &0*1^*168 1110111(11116 I I & 0 , 1)10(1110*1011 8,11(1 00111111610181 3^1)1108^10118 0【116^ 1;60111101027 ( ! ! ! 。 ^ ^ 116^ ^ 。 ( ! " 。 ! ; 811(1 116^ ^ & ^ ^ ! ^ ) ^ ^60111101051081 111110^8.111011 18 0116 1^111(1 0^ 001111116101&1 8,0*1^1*168 ^111011 0168.1)63 116^ 60011011110 乂81116 \^ 11163,118 0^ 116^七6011— 1101027 ( ^ ^ ! ! ^ ^ 1 1 6 ^ 0 1 1110(11&^^^!!) ^

I 七 1 3 七 1 1 6 &181; 0011111161:0181 81^1109.1)1011 。【116\^

1)6011110102^, 811(1 169,11263 1)116 001111)1119,^1011 0【6001101117 311(1力601111010^ 1*601111010^031 111110^8,1:1011 1138 1)11166 口31:七^!!丄犯0118X3X1*61:181108 ^ ?1181;? 11; 6111 口11381268 1^113,1;46^66 0^ 1113X1561; 1631128,1:1011 311(1 3,0(111181*1011 0五七116 1^118111688 1)6116615 3X6七116 111*11118,1:6 ^ ! ; ^ ^ & ! ^ 七0

^611^ ^1161)1161: 1;116

111110^3,1:1011

15 81100658^111 01 1101

860011(1

5

11 61111)11951268 !^&七11; 13

81 873*61113,^10 6115111661:1115 &0111 1116 16563,1011 3,11(1 ^6^6101)1116111: 0【116^ 1)60111101057七。 6131 0011111161:019,1 8-1)1)110211:1011 ^ 丁 ! ! ! ! ^ , II; 61111)11331265 ^10^1)115111685 61^61^)11868 3X6 1;116 8116,160*5 0【1^1111010^111110^3,1:10115 ^ ^60111101051001 111110^3.^1011 1133 ^ 0 七 乂 口 6 8 0【1631123,1)1011 1110(168, 113,111617【116 ! ! ! ^


關於統計論文的撰寫

82

1)611(16111 111110^8,111011 1110(16 1)836(1 011 11^0, 311(1 1)116 860011(1-111110^81^1011 1110(16 1)836(1 011 111111:0(11101115

^

3881111113^1118 8X1^81106(1 1;6011110105168^ 1?116 111^681:111611*3 011 !!!^!^!)^]!—

11

(^!!七!11110^8^1011 。【116^ 1;60111101027 8180 ^ ^ ! ^ 。 ! ^ . &111(15【01

1166(18 乂61^

II:

^订!)!)。!!;.

116^ 1)10(1110*8 8X6 001151(161:8.1316 811(1 1116 118^ 18 5

8*10115 。8^)8^1111^ 。 《 化 & 。

8608,1186 0【1;116 18X^6 1^1111010^

811(1 1166(15 18X^6 8111011111;8 1^6^6611

( ^ ^ 。 ^ ( !

。【

0011111;1168

311(1 01111181?七116 86001101-111110^3,1:1011 1110(16 18 11811&11^七8^611 111 011111^1*11七116 &3七(!^^丄一 ^ 0^1116111; 111 1;60111101027皿^ 50161106 1)116 800^)6 0^ 1601111010510811 111110^811)10118 156001116 111016 5

811(1 11101:6 ^(!^,001111)6*61106 0【1118110118 1136 0? 1)116 6X^61101 1^110^16(186 1185 1^6001116 311 11111)01:138111; 1)8X1; 0^ 1;60111101021081 111110^8^1011 。8^8^1111^ ^116 16^101131 !11110^8^1011 ^1*3,11*168 3X6 611818^6(1 1;0 111110^3,1:1011 03^3^1111:168 , 1116 165101181 111110^8.111011 08^8^1111:168 8X6 1)16 1)0*61111811*168 0^ 1)10(11101112 8*1681118 0^ 111110^8,1110113 1*618^6(1七0 0011111161:06 111 & V011. 11167 16&I 10七116 。8^3^)1111:168 0【0011^61*1112 1^110^16(166 11110 116^ ^ 。 ( ! ^ , 116\^ 018^^01^ 311(1 116^ 361^1。6, 1116 1621011811 111110^811;1011 08^8^)111*168 9

08^811)111七168 0^ 50161106 3,11(1 1:60111101067, 1101』118七1;116七6011110105^81

816 1101 1X161-617

001111)6*11:1011 8,1)111^ 6)1 1)1111016

8^*61^1011 1;0 1116 60011011110 8,^1)1109,1)10115 0〖116^

^116 8*10112 1)601111010^^81 001111)6*11:1011 8^1111^ 0【81 1621011 (!^^^!!,七11163118 4113.1; 1116 111110^21*1011 08^3^1111168 8X6 81;1:0116 1300. 1?116 165101131 !11110^8^1011 。8^3^111*168 9X6 1118X16 11^ 0^ 1^086

七018 38 16110^5: 1^601111010^^ 1111111811 1650\11:0650163,1)018

0【1010^16(126 811^ 61111)107668 ^110 ^ 朋 ^ ) 1)116 ^ ! ! ^ ^ ^ ^ 0^ 018^81113118111 口;七116 1010^16(166

311X1011,

3^1111^

0^

1^11811; 138,1)111*7 0^ 1113^11@ 1156 0云311 1^111(18 0【1680111063 111 1;116

^011(1 。0118七811七1乂, 811(1 1;116 3,1)1111^ 0^ 1^110^16(126 &11X1011 81110112 6 8 ^ 111110^8,^1011 1111^8; 1:116 08-1)3,1)111*168 0^ 1)60111101021081 111110^811;1011 111 611161:1)11868; 111110^8^1011 611^11:0111116111:5 811(1 七116 60011011110 1)616)1:111811068 0【!11110^10118,七!!" 18七116 011*1)111; 0^ 111110^3,110118 ^ ^116 !11110^3*1011 08^1)1111168 ^111 ( ^ 。 ^ 111 & 1651011 ^

^116

111110^8,1:1011

4116 1。11^61:111 60011011110 001111)6*1*1^611688

08^3^11113168 3X6 1;116 111051; 11111)01*^8111;

&10七01七0

6X^18111

1^116 ( ! ^ ! ^ ! ! ^ ^ ^ 0【1116 3 6 5 1 6 6 0【60011011110 1)1051)61:11)7 8111011^ 111511-111001116 118,^10118 ^ ?01 1(1)08力0 88^,

0^81111116

9^1(1 (!^^^^!!!^七116 1:60111101027

6)1:06七0 11111)10^6 1)116 001111)6111:1^611685 [!? 116

010^81

1)6001116 811 6886111)181 ( ! ! ^ ! ! ! ^

001111)6*1*1^611688 116^011;

^01: 11)03 ^0 88^, 1111;]:0(11101112 ^ 21^^81106(1 1)60111101067 811^ 858111111811;1116? 11

2002-2003】,

1^6

560011(1-111110^21*1011 1881101*0111; 1;0 11111510^6 1;116 16^101181 111110乂8^1011 08,1)3,13111*168 811(1 111*61113^101181①!!!!) 6*11^611688 ,


第六章:讀一篇要大改的文章

4, 1 1 1 6 001-1-6181*1011 3^1&1^518 1 ) 6 ^ 6 6 1 1 ?1)1 &11^1

4.1.

!?。 63^^11811 4116 561-168 0卩1x1(11(^01*8 0 ?

83

I I I 。

1110

1?0 6^811181*6 1116 。011618^1011 1)61^6611 71)1 811(1 1110 3X^111:8^617, ^6 1166(1 ^0 ^08011^& 80 ^6 1111151: 68*8,1)11511 81 861168 0^ 111(110*018力0 6^81118,1:6 1110. 7116 65~

1^10 6X3,0*17

138,13118111116111; 0 【 5 6 1 1 6 8 0【111^101;018 0【1110 13七116 ^111:1;1161 " ^ ! ? 0【001111)1:61161181011 011 68861106 811(1七116 11168111113 0【1116 0011061)1; 0^ 111110\^1;1011, 311(1 18 3180 1116 。【111110乂8^1011 1;11601^

0011110*3-1:1011 。【1110 13

(!^^丄。!)!!^!^

2^)1111(120113; 1:116 ^61;611111113111;3 111-

。111(16 6(11108,1:1011 ^ 80161106 811(1 1;60111101027 1680111068? 111110^8,1:1011 03^131111)7 ^ 611*61:1)11868, 16^101131 5^11*116*10 5*16112*11 311(1 111&11118^1011 0011(11111011; 811(1 8180 1110111(16七116 165101131 311(1 11131181261116111; 81011. 1116 561168 0【111(110^01:8 0【1110 1111181; 16&601; 1116 1)1686111;

1)01107

0011(11^10113 311(1 1)116 11七11129^1011

6550161107

0

【【6^01181 1^110^16(166 311(1 160111101057 。1^60

1^617 311(1七17 1)0 6^81118^6 1;116 1110 001111)16*617 8 ^ 01108611 8110111(1 1)6 1^116^ 811(1

。!^^^丄乂.

1?116 111(1101:018

1^61116

011力116 1)3513 0^ 16&601;1115 1110 8^01118^61^, ^ 七 0

361601; 1;11056 5^11*116*10 111^101;01:8 ^1011 118^6力116 0011111101111635 311(1 3X6 111811611761:81316, 'I'1161:6&^I6, ^6 561601; 22 111(1101:018 81*066*1161: ^0 1116331116 1110 85 115^6(1 111 158^16 1. 19,1)16 1 8,1)0111; 11616 1)17111011)16 001111)011611^ 211131^318

4.2

1156 1116 1)1111011)31 001111)0116111: 311317518 10 68*8.1)11811 1116 5^11*116*10 ^8X13,1)16 6乂81113,1)1116 1110 0【681011 1)10^11106 ^ 1力3 6X061161106 13 ^9,1; 4116 \^61^11;3 8X6 1^986(1 011 1116 1111161:6111; 001165^1:3.1)1011 16181*101181111)8 0【1^116 ^81118113168 &0111 1;116 8117

01181^818^ 1;1161:6 ^ ^ ^ ! ! ^ 113^6

111&1161106 。【81113』601^1*7,紐3 15 013,160*^6 口 6 1 & ^ 1 1 1 8 18 1)6116&0131 1)0 01191^~

513 311(1 &1)1)1:3*186 8711^1161;10311^ ^ 6 31181726(1七116 ( ! ^ ^ . 0^ 31 1)10^111068 111 01111181 3,1)0111; 8^0乂6 22 ^8X18,1)168

^1111011)81,1 001111)0116111; 311817818, 1151112 8^.8 50^^8X6 10 ( ! ^ ^ ^ ! ^ ! ! .

1?116 1315868^ 615611^81116 0^七116 00116181*1011 1119^1:1^ 乂311168 11.1167 811(1 1116 6151; 1)1111015)81 001111)0116111; 1611601)8 50.53 丁&1)16 2 3,1)0111; 11616 6^ ^116 615611^60*01: 0【^116 !^!^^^ 615611^31116 111 1)8^162 ,

0311 ^1 1116 6X^16881011

0 ? 6 1 5 1 ; 5)1111011)811 。。!!!!)。!^!^ (?匸!^丄)95 &)110^1115: 尸

^

0.1237^^7^十0.1338^7十0.2793:!? ^ 舨 ^ ^ : 丑 ! 7 一 0.08145^:尸尸I

1


8 4 ^ ^ ^ ^ ^ ^ 一 ^ 關 於 統 計 論 文 的 撰 寫 ^ ^ ^ ^ ^ ^ ^ ^ ^ ^

十0.1971^X^7^十0.1107^^^十0.0818^5&7 十0^7^71117^ 1

十 0 . 2 3 8 0 ^ ^ 5 / ( 3 ^ 十 0 . 0 7 2 7 0 ^ ^ 1 / 1 ^ ~ 0.01363:^?:!^ 十0.2426^^^5^1,^5十0.2494^^^^十0.258900X1^(7^ 十0.2781^10^1)17十0.2611300^5^尸十0.2685^5&;^ 十 0 . 2 2 3 7 〃 ? ! ^ 十 0 . 2 3 0 3 ^ ^ ^ 十 0 . 2 5 9 7 皿 五

十0.2871^(3^0尸十0.144711^1101)1107

1\1&

8110^ ?0111 18 1116 ^

6X1)16881011

^ ^ ( ! 511111

0〖68X^1 011211181 ^8x10^16, 111081; 0【

七116 0066501611*8 3X6 1)081*1^6 6X0111(11116 1 ^ 0 111(110*018 0 【 3 1 1 ( 1 11168115 4116

3^61&6

6

111(11(^01

6X^)611(1111116 011 1)111011836 0【40111651:10七601111010^ 0【63X^1

^ ^ ^ : ! ) ! : ^ ^ 0611618117 8!^8^11^, 1116 11121161 0【1)60111101021031 08,^)8,1)111*168 ^ 1)116 1633 七!0 160111101027 611*611)1:1568耵0111(1 ^ ! ! ! ^ ^ ^ ^ . 1683011811316. 111(1101:01: 0【68^1 ^!!^!:!)!^.

2X1^X11 11163118

8 0 1:116 11658.1)1^6 ^3,1116 0【1116 00691016111; 13

1)116 3 ^ 6 1 8 ^ 6

1?116 00691016111; 18 ! ! ^ ^ ^ ^ ,

1*8 111&11611065 18 1 1 0 力 ^ 6

(!。!!!^一

6X1)611(111111:6 011 1;60111101027

1)111; 1)116 11111111361 ^8-11163 0111^

0811 11621601:辻.^11118 ?0111

^6110^8,1:1011

-0.0136,

80

03,11 16&601; 1116 111110^811;1011

08,1)8,1)111^ 0 【 6 8 ^ 1 1)10^11106 87111^61:10811》8〇^6 1156 ?0111 8 3 1:116 8711*1161110 6^81119^11^

111(1101:01: 1;0 8,^1)18186 1110.

4 . 3 1 1 1 6 11111)8101; 0 【 7 1 ) 1 011 1 1 1 0

1116 108X1111^8

111

1)3,1)16 2

8X6

1)116 ^9^01 108x111^8

0【62^1

011211131 ^8x18^16 011 ?0111 ^

?8^1;01 108X111165 3X6 1;116 001161^10118 0^ 6&0^1 011^111811 ^8X13,1)16 311(11)1111011)01 001111)0

116111; 111 & ^ 1 1?116 0011618,111011 00691016111; 1)6^6611 1^1)1 811(1 ?0111 18 01117 0.4462, ^^!^ 1183 110 81^111608111: 0011613^011 1)6^6611 ? 0 1 311(1 1110. 8 ^ 1)8^16 2 1110 1110111(16: "!乂!^[人11X21

&6168 118^116 111^11 ! ^ & 力 ^ ! ^ ! ^ ! )

611(1 1)113,1; 1;116 ^8X1— ( ^ ! ) ^ ^ ^

0^ 1601111010^钍9118&]:), 1!1?1111?丫 311(1 1)28101^ ( " 印 ^ 1:116 8^111*7 ^!?!:^), !^5^8人1^3

811(1

^ ^ ^ ^ ! ^ ^ ! ^ (!&!^。!; 1:116 3^111^

1)116 8^111*7

0 【 ( ^ 印 ^

0 ^ !11110^3^1011 011*1)111; 111

^ ^ ^ ^ ] : ^ ^ ^ ) , 0 0 1 X 2 0 2 , 31011201; ? 8 0 0 ^ ^ ? ( ^ ? ^ ^ 力 1 1 6 0 8 1 化 ^ 0【61111)1076680, 1^8&;0 ^!^)

( ^ ^ ^ ^

1116 1111111811 163011106

111 8 & ^ ) ,

311(1 ? 0 0 ? ( 啦 ^ ^ 1;116 1)61:&)111131106

& 1661011七0 5 3 , 7 ? 七 ^

16

^ 0 1:116 111^68^111611*5

0【8&1\

1^1^ ( ! ^ ^ ! ^ 。 ! ; 1116 16^1 0^ 611七16口 1:6116111:-

0【^。乂^。!!)

^61;61:1111118111;8 0 ? 111110^81*1011 ^ 6

8,1)111^

^ 11161:6&)16? & 1 :

21 1181*1011 0 1

08^8^)1111^ 1110111(16: ^9^111^

0? ! ! ^ ^ ^ ! ! ! ^

3,1*6111:1011

1116 11111118111 1630111:06 111 8 & X 811(1


第六章:讀一篇要大改的文章

1119^112

6111 1186

85

0【311 1011(18 0【1680111068 0【8&;!?; 1)16 160111101021081 111110乂3^1011 03^)3^1[-

1 ^ 111 6111)611)11868; 118^1116 800(1 611^110111116111;8 1)6116&0131七0 111110^81*10115? 1116 111601181118111 311(1 575*6111 8101531 8&!?

18 01)611 311(1 0811 1118^6 1680111063;

力116 ?0^61:611

^1111

1116 011*5*311(11112

1186 0【1116 100811 81)60131 1680111065 311(1 4116

1)61&1111811106 0亍10081 60011011110

9

&)106 0【111110^81,11011 ^ ^ 6

^1011

^ 6 0011618.41011 1)6^6611

1)6001116

?01

311(1

I I I 。 611*1161: 1151115 ^ 6 8^111;1161;10 ^9X13,1316 01^&1116(1 &0111 1^6 1)1111011)8^ 001111)0116111; 811817813,

(!!喂腿,68*811)118111116

(!!柳!!^ ^ 6 5 0 3 ^ 6 1

16516831011 。111:乂6,

866

^ 6 16^6851011

1110(161 811(1 。 ! ^ & ! ] ! ^

^ 6

38 & 印 " 1 . 715111:6 1 0^0\1^ 1161:6

0311 0^)561^6七116 ! ^ ^ 。 ! ^ ! ! ) 1)6^6611 ? 0 1 311(1 I101191 111110^3^1011 。3^2^)111*7 0163X1^ 1^7 1)10*1116

1. 1^0111 1116 5021*1:61

0^ 1)01111)8 \^8^ 161)1:686111; 63^11

^6 0811 (!!^^^^):七113^ 111616 113^6 111311^ ^01111;5 ^01 3^9^ ^1^1 88 86!』1116, 811311^181, ^1311^111

9

0113115(10116

1116

1651011 111 ^101;111:6 1 ,

16516831011 0111^6, 511011

311(1 ^13116511 ^ ^116 ^61)61:1111113.1:6 00651016111; 112

13 0111^ 0.1991, 11; 111(11081165 1118,1; ? 0 1 0311 6X1)181111 19.91 8^

1)10*1116

1,观0311

&11(1 1)113^七11616 118^6

1 ) 0 2 6 七 1 1 1 6 8 6 1)01111)8 161)1686111; 1116

^1:0^111063

81

101; 0【^01111;5 31111081; ^ ^ ^

111 ^111011 150*11 71)1 311(1 1110

13,266(1 1)611111(1 1?11686 1)10^111068 1008.16 111061115616(1 9X6

1688 ^ ^ ^ 。 ^ ( ! 111 600110111^ 1)608-1136 0 ? 1)116

13^6(1

01

^68*6111

1101;1011

5

1651011

口011。7

8X6

^

811

0云01111181,

311^芭

1009^1011, ^116 1)611111(111311(1 111110^1011 08^8^1111:168 916 111811117 111011106(1 ^

1 6 1 6

6 0

^

1 8 1

!^

0

13^^(1

60011011110 0011(11110115 ^ 1?0 6111111118.1:6 1)116 111&1161106 0^ 60011011110 ( ^ ^ ^ ^ 口 ! ! ^ ! ! 七 , ^ 6 06^01113,116 1;116 0011613,151011 0,^11 08110611115 1)116 16^0113 111 \^111011 1^01;11 ? 0 1 311(1 1110 3X6 311 \ ^ ^ ^ 1)611111(1 911(1 0^911100116131*1011 13 111111118 0.3626, 11113 111(1108.168 ^13^ 1^1)1 1185 1116 11663^6 11111)2101; 011 1110 ^ ? 0 1 111 0118115^0112 811(1 ^13115511 3X6力116 15

11.334 1)11110113 ^0112115

111

!)!^^^.

2002, 311(1 10.19 1)11110115

1)161)011(1618,1)6(1 0^61: 0^1161 16^10115 ^ & ^ .

00111153X6 661011 01151119,1

^18^ 108^0^

^8,119,1)16

1:116 03,111)61: 0【61111)107665

1)61: 1 0 0 0 0 1)01)1119,1:10115 ( ( ^ 。 [ ^ ( ^ ) , 6(11103^1011》61

10000

( ! 。 ! ! ^ ! ^ 111 1113!^811, 1116 3111011111:

^11611 16^

111七116 &)111*11 811(1 1;116 II&11 1631)6(^1^617, 311(1』1181; 111611 ^ 6

^116 3111011111; 0【1^1)1 111 0113112(1011^ ^ 111110^3^1011 03,^)3,1)111*168 116

1)15661:

0816^11117 311(1 5

0113

111911 1116 181*161 16510113 81

( ^ ^ ( ^ ! 111811

011 111!'66 ^8X18,^165

^111011 9X6 11111111361- 0 ^ 00116^6

3,11(1

111^1161:

11111111361: 0【^:&3112^68 &0111 1115*11)11*10118 0【111^161:

1)0^11181^10118 ( ! ! ! ^ ! ! ^ ! ) ! ! ) ? 1:116 1)001^8 53.163 口61: ^ & ^ ! ^ ( ^ ^ ^ ! ^ ^ ? ) ,


關於統計論文的撰寫

86

0118116(10118 10081*6(1 111 1 2 8111(1 1 3 811(1 211681)60*1^617 111七116 ^ 0 1 6 00111111乂.

乂9112^16

1:113,1: 1681)601:8力116 1111111311 165011106 111 8 & ; 丁 , 11111111361 0【801611*181)8 & 6112111661:8 ? 6 1

10000

5)01)1113^10118 ^ 8 & ^ ) , 0118112(10112 10081*6(1 111卩0,7\人11(1 313,112311 10081*6(1 111 20, 6 , 4811(1

5

011 8,1)0^6 ^8X18.1)168 1681)60七1^1^ ^11686 8110^

^18^七116 16^1 0 ^ 1111111311 03^11^31 ^ ^ ^ ! ! ' ! ;

1118^011七116 8111011111; 0 【 ^ 0 1 111 0113116(10115 2111^〗18118811 , ^\^1161;1161: 1)116 8七0(^1 0【1111111811 。8^1*81 15 111^11 01 1 。 ^ ^111 ^601(16七116 8?1110^61 6 5 6 0 * 8 ( ! ^ 。 ^ , 311(1 111&1161106 81 113^1011 ,8 1

111(161)611(16111; 111110乂8^1011 。8^8^)1111168 311(1 ^0*6111:1811*7 ^11601;1^ 。 【 ? 0 1 1118,1)011

1611 1116 乂01111116

0111^

8 七 0 0 ^ 0【1111111311 03,1)1*81 311(1 1;60111101021081 。 叩 & ! ^ 辻 ^ ,

0311 ^ 6

1110

1)6 016^6101)6(1 811(1 6111131106(1 ^

1*116 1651011

^1*11 1;116

8七1:011268七1110 18 8 1 1 8 ^ 1 1 3 1 , &)11(^6(1 1)7 ^

111110^8,111011 08^8^)1111^ 111 661^1116 811(1 81181121181? 0 ^ 0 1 1 8 1 7 ^ 6 00X1^ ^ 力 ^

1680111068

5

^63*1116111:8【01: 8&;1\ &)]: 111110^^1011^ ^8.1:1011;七116

^11116

3,15111*7

1

6

1116 ? 1 1 1 6 8111)61101:11^ 111 66131118 1110111016 1116 8,151111(19111

8*10112 8^11*7 0【0168,1)1116 1 1 6 ^ ^ 。 ^ ^ ( ! 辟 , ^ ^ ! ! ^ 七116 111081; 6X06116111; ^ ^ ^ ^ ^ , 111 81181121131, 1)11616 118^6 81 ^ 0 0 ( 1

1^1)1

^ ^ 8 , 1 ; ( ! ^ ^ 1;116

111 1;11656 17^0 16&0118 11816(1 111七116 &)111*11 811(1 4116 6^11七11 ^ ^ ^ ^ ^ ^ .

3,1)16 6X1)18111 01117 &0111

"^!^

^ ! ^ ! ! ^ ,

1111口01*81106

8&X

^ 0 1 1 1 -

811(1 4116 ^00(1 611^110111116111)5

1111(13^1011 & 1

1

111(11181:1131 111110

0 ^ 1;60111101051081 !11110乂3^1011 0 ^ 6111:61:151:1368 111 811811^181 ^ 6 6 ? 31163x1 111

^11016 001111151:^; 811(1 1;1161:6 118^6 4116 3*10112 &113110181 8*1611^11 311(1 1)0^61^111 08,^1131

8^/9111^&.

2116|13112 15 ^ 6 ^10\^1106 111 ^ ^ ! ^ ^ 1 ^ 6 6001101117 ( ^ ^ 。 ^ ( ! ^ 6 1 ^ 观 1 1 ,

^116 。3^8^111*7 0〖111110^8^1011 111 ^11^8,1:6 611*611)1186 18 6X1;]:^【(^!!犯乂. 2116』18116 4676101)6(1 ^1110^1^ 1)603,1186 0 ^ 1:116 ^1181 8111)61101:11:168 0 【 8 & X 311(1 4116 8^51;6111^

?60^)16 113^6 ^16811; 611-

1;111151818111 1)0 ^ ^ ! ; - ! ! ! ) 811 ^ ! ! ! ^ ] : ! ) ! : ^ ^ 11161:6 1 1 ^ 6 力 1 1 6 ^ 6 1 & 0 1 : 878*6111 &1: 162101181 301611*160 811(1 160111101061081 11111078^1011, 111^68*1116111; 811(1 61181101115 311(1 5111)1)0111118 & I 1;116 18161116(1 5)618011 111 2116』1311^ 2116^18,112 13七116 811)0*1160818 0【1118,^1112 ^1111 1186 0 【 1 0 0 & 1 1680111063七0 11111)1:0^6 1;116 111110^3,1)1011 0 8 ^ 8 ^ 1 1 1 ^

^1161:6&)16? 1)61112 01)611七0 6X1)61:1181, 8,^18101)1115

13 1101七116 11111(1116 11168115力0 111—

016886 I I I 。 , 811(1辻1811^七116 11111)01:七311七11168118 61*1161: ^ ^116 8 ^ 6 6 ( 1 0【16&)11118,11011 811(1七116 46^1:66 0【1118X^61:128,1)1011 111 6001101117 ^111 ^601(16 1;116 1 6 ^ 1 0【111110乂3^1011, 1116 110*1011 811(1 573*6111 ^111 111&1161106七116 111110^81*1011 08^8^)1111;^

1*116 (161;61:I111I18I1*3 0【1;116 111110^8*1011

03,^)8,131111^ 1110111(16 1116 01:1611181 ( ! ! ^ & 1 0 6 0【!11110^1011 , 1116 160111101051081 11111078^011

。31)8^1111^ 111 611161:1)1:1868,七116 8,1)111*7 0 ^ 013^116 6111 1136 0〖4116 10081 8^60181 1680111:065 811(1 811 1^111(15 0 ^ 8 & X 1:680111X68, 118^1116 ^116 ^00(1 611^1101111161115 1)6116&0131七。111110乂3^011, ^ 6 1 ~


第六章:讀一篇要大改的文章

&0七111601181115111 811(1 8乂81;6111

87

16^01181 801611*1^0 811(1 1;60111101051081 111110^3,151011 ^ 6681(168 6 ) 1 0 6 !61 111110^8,151011 ^ 0 1 1

2^)0^6【8X^018, 1116 10031 60011011110 0011(11151011 18 1^116 8*10115 & 0*1161: 1 1 8 1 1 ( 1 , 1 6 乂 6 1 0 【 0 0 ? ^111 1)6

111611

111 4116 16210115 ^8,1; 113^6 5*10116 111110^8,11011

03^8^)1111^, 811(1 4116 111|:61118^101181 001111)61111^611688

1)6 5*10112

5, ^ 1 1 6 61111)11:10^1 1110(161 0 ^ 1116 6 ^ 6 0 1 ; 0 ^ ? 0 1 七 0 1116 111110^11011 03^)8^)1111^

016331116 1 ^ 6 111110^8.151011 03^8^111117 ^1*11 ^8X10118 (!!&!^!!!; ^8X18-1)168 111 4116 8 ^ 0 乂 6 811317515. 6\11; 8011013,18 0 ^ 6 1 1 1156 1116 1)81*6111;

(^&^七0

1;1011, 1)603,1156 ^11611 911 11^611401: 0 1 0163,1)01 9,^1^

1116&31116 ^ 6 1;60111101051081 111110^8^ 1)9,1)6111; 1 0 4116 1)8,1)6111; 。 ^ ! ^ 。 ! ^ ] ! ! ! ) , 11118

13 118113117 1^116 ^01;6111;181 31211 0 ^ 60011011110 ^31116 0 ^ !11110^8^011 311(1 161)168611481*1011 0【1;116 111110^3.11011

00^8^1\1^

1^1*1161:111016 4116 1)8,1)6111; ( ^ & ^ 8X6 。01111)16*6,

8^0^119,1&

811(1 0811 1)6

0^31116(1 683117.

I I I 1683 1;11811 2 0 768X8, 01111181 1188 1118x16 1;1:6111611010118 ?1:051:658 111 63*8,1)115111118 61 16呂81 373*6111【01 1116 ^10*60^1011 0【111110^1011 , 0111118/8

1)21*611^ 1

^

8 6118.0*6(1 111 1 9 8 4

311(1 081116 111*0 69601; 111 1 9 8 5 ^ 8 1 1 1 0 6 七 1 1 6 1 1 , 1 3 ^ 1138 1)6611 8111611(16(1 1^106^

811106

1)3888^6 0^七116 1 9 8 4 口 8 ^ 6 1 1 七 1 賺 , ^ & 06111)181 ^0^61111116111; 1185 155116(1 0 ^ 6 1 2 0 1651118,1)10115 311(1 ^1(16111168 3 0 8 8 七 0 1)101110*6 !11110\^^1011 ^!^^

III 01111181. ^ 0 ^ 3 ^ 5 ^8,^6111; 1 5

01111181 18 1)16**7 11111011 111 11116 ^1*11 1;116 !11*61118^101131 ^ ^ ^ ! ! ^ ^

^ 111

[ ! ^ - 力 ! ! 01611115, 2 0 0 4 】 ^

1116 1)3*6111; 1 3 ^ 0【01111181 ^1^1(165 ^21*61113 1111)0 1;111:66 03,^6601:168: 111^6111)1011

9

811(1 6X1611181 ^ ! ^ .

1*116 111^611*1011 ^3-156111; 1 6 & 1 8 七 0 1)116 1 1 6 ^ ^6011110-1)1:03601;

1)111; & 1 ^ 3 1 ( 1 011七116 !)]:0^1101;; 11161:110(1 0 1 1^3 1110(11&08,1:1011

5

^111011 0811 & ) 0 1 1 1;116 !)!:^^"

111(161)611(16111; 1111;611156111 ? ^ ^ ! ^ ^116 111111*7 1110(161 5)31*6111; 11168115 1116 116^

110*5

1)1&0*103,1 ^ ^ ^ ! ! ^ - ^ ! ^ ^ ^

^ ) ! ^ & ^ 双 & ! ^ ! 011 4116 8118^6, 5*11101:1116 0 ^ 4116 1)10(1110*5 01: 411611:

001111311131;10118^ 丁116 6X1611181 ^681211 ?3^611力18 1^116 116^ ^ ! ^ ! ! 1

^111011 18【1111 0【1)16383111;

11111)16351011 811(1 511116(1 ^01 1116 8,1)1)110^1011 111 111(1118*17 31^011七^116 8 ) 1 8 ^ 6 , 5)3,^*6111? 00101, 0 1 411611: 00011)1113,1:10118 0 ? 1116 ^1001110*5^ 1116 11111(^3^1^ 1 6 ^ 1 13 1 6 1 ^ 1 ^ 6 1 0 ^ 0 【 ^ & 11*111*7 1110(161 0 3 ^ 6 1 1 七 8 1 1 ( 1 6 X 1 ) 6 1 : 1 1 9 1 ^681^11 5)3,1611^ 111^6111)1011 ^8,1^6111:8 8,11(1

7116 1;61111 0 ^ 1)1*0160*1011 15 20 ^63X3 ^01

10 ^9,18 ^01 11^111^ 1110(161 9,11(1 6X^611191

( ! ^ ^ ! ^ ! ! ?&^!!^.人111011^;

1)11166 ^ ^ 6 5 0 ^ ^81^6111;8111^611^1011 1)3,^611*8 3,16 1*6^3^(56(1 ?18 1119^01 111110^8,^10118 ^1167 5

0311 16^1:68611^七1!6 111110^9,151011 1 ^ 6 1 11108(;!^.


關於統計論文的撰寫

88

1116 11111111361 0 ^ ^ ^ ^ ^ 8,111:1101126(1 ^ 8 3 ^!!&!^!^^^! \ ^ 1116 3,131111:168 0 ? ^ 8 , 1 6 1 1 1 ; (^!!^。!^!^!), 8 0 111 1^18 1)6X1; ^ 6 1156 1)116 11111111)61: 0 【 ^ & ^ , 8^1)1108^10118 111 0111 001111*1:7 ^ 0 1116851116 1116 165101181 !1111078^1011 ^&^&^!!!!;^.

^ 6

^ 6

1186七116

&110^1118 11100161 1;0 68*11113^6

1186力116 11111111361: 0 【 ^ 化 ! ^

10!]!^.

71)1

1116 5^1110^61 6^6015 。 【 ? 0 1 011 !11110^3*1011

8^1)11(^10118 ( ? & ! ; ^ )

1 6 & 1 3 1 0 1116 1681126(1 乂811168

0【1^01

! & ^ ^ .

00,^8^

8 8 81 111688111:6 0【111110^8^1011

0116 1)6110(1 001181(161:1118七^七?01

111^0^七。01111181 11111)810*8 011 ( ! 。 ! ! ^ ! ; ^ 111110^8^10113 ^111111 81 81101:七1)6110(1 0 ^ 1111116. 入 8 1116818111:68 0【1111)111;七0

(!^^^。!)!!^!^

II&0

^

^

^

,

^ 6 1186 6X^)611(11^1^68 011 80161106 811(1 460111101027

〔 8 & ; ! ? ^ ! ^ ? 》 ? 1 1 1 3 1 1 ^ 001151(161:1112 1^6 &101; 1^119,1;

( ! ! & ! ^ ! ^ 8 * 3 ^ 6 。【60011011110 ( ! ^ ^ ^ 丄 。 ! ) ! ! ^ ! ^

1)10^111068 9X6 3 ^

8 0 111211; 1:11611 111110^3,1)1011 。2^)811)1111^63 8110111(1

3180 ( ! ! ^ ] : , ^ 6 1110111(16七116 16^61 0 ? 1)61 08^1^

1116 1110(161 0811 &180 1?6 6X1)16886(1

(^&!^!^

0 0 ? ( ? ^ ! ) ?) 111 0111: 65*11113,11011 ^

85:尸0力671力^八-^1)1"! 01)1^8^1^X1^, 3

^11611

^ 6 1 8 ^ 6 1023X1^11111 111 1)0111 81(168, 811(1 ^ 6 1110(161 0811 1)6 ^1111611 8 8 &110^1112:

1^0,1&711

^ 0 + 0:111

?⑤?十7111

^01十0111

8^X^X1^十11

^ 1 1 6 1 6 0 18 1;116 68^1111&1)6(1 1111:61061)1: 0【1:116 6(^18^1011, 11 1 3 8 1 ) 8 1 * 1 8 1 1 1 0 6 1 1 0 1 , 1116 00691016111; 0!, ^ 811(1 7 13 ^

6188*1011)7 。 5 1116 11101:6386 。 【 ? 0 0 ?

1)81*6111; 111016356 ! : & 口 ^ ^ ^ .

9

8

&

;

0

1;116

^ 0 1 0011^611161106? 1116 6(1118,1:1011 ^ 8 5 ^11**611 35 !611。\^8:

?讧滅^00^

1^1)1十^0^?十&8^1^?

1116 。06伍。1611*8 0 1 ^ 2 ^ 3 111683111:6 1118151111:11(16 0【1)116 111&1161106 0 【 5 1 ) 1 , ? 0 0 ? 811(1 8 & ^ ^ ^ ^ ! ; ^ ! ^ .

丁 116 60^9 3X6七8^611 &0111 0111118 8*8,413*1081 ^ 6 8 X ^ 0 0 ^ 311(1 01111121 1

1

1?60111101027 8*9,1151:1081 768x1)0015, 00^611112 30 口10乂111068, 111)61; 15 6X01x1(16(1 111 0111 311817318 1)603,1156 111081; 0【1116 1616^8111; (!&力&

^01辻13

61*1161: 1101; 8^8118^16 0 1 2 6 1 0 (!^!!!!^七^16

1;11116 1)6110(1 6X81111116(1 ^

^ 6

1186(1 8 人 8 8 0 3 1 6 七 0

((!)!^).入11(1

68*11118.1:6 4116 6(1118*1011

63*11118^6(1 1^116 601118,1)1011 6)1 68X^1

七116 01(11113X7 16831; 80(118X63

0亡1)8,16111; ( ! ^ ^ ! ! ^ ! ^ ] ! ,

811(1 (1^812I1) 3 8 ^ 6 1 1 83七116 101; 31 ^8.46111; 8^1)1103^10118 ,

1^1111^

11100161,


第六章:讀一篇要大改的文章

1^1)16 3 3,130111; 8^

1^1)163, 1;116 46七611111118^6 006^01611*8 II

2

^116 ^311163 0 ? 7-849^181;^ 3X6 816111608111; 8^ ^&

89

11616

0 ^ &111: 1110(1618 8X6 &11 3 ^ 0 乂 6 0.77, 911(1 16^1

1110(1618 311 113^6 ^ 1 6 8 ^ 8*9,418*10 81^111&081106 811(1 41167

0

0【0.0001^ 8

1

^1115 8110^5 1^8^ &)111: ^8X161*10118 0 亡 8 1 1

6X^1^11

1

1^568 0【1)8,16111; 8,1)1)1103,1)10118 11101:6七11911 77 ^ ^ ! : 仁 ^ ! ! ! ^ . ^01七116 8111011111; 0【111^6111;1011 口3^611七, 七116 0 0 6 伍 0 1 6 1 1 七 0 亙 ? 0 1 13 5)03111^6, 1)111; 1七13 8*8,1:1811109117 1115151111109,111; 6乂611 1111(161: 1116 16乂61 0 ^ 0.10.

8 0 ? 0 1 1133 110 316111603111; 62601; 1 0 仏 6 8111011114 。【111^611*1011 ^ & ! ^ . ^11616 1133

5)051*1^6 66601; 6 ) 1 ? 1 ) 1 1;0七116 3111011111; 0【11*1111^ ^0,^11^

311(1 1183 51^111&03111; 63601;七0 4116

3111011111; 0 ^ 6X^61:1131 ( ! ^ 印 1 ^ 6 1 1 七 3 1 1 ( 1 1;0七31 口8^6111 8 & ; ' 1 1 9 8 816111&08111; 69601;七0 七116 9111011111; 0 ^ 311 1;111:66 1 ^ ) 6 8 0【1^8.1&III 311(1 1116 10^,91 ^0,^11^ 0 ^ 0 . 0 0 0 1 , 6X06^)1;七116 6X1)61:1181 01681611 ^0^01^

1111^61:七116 512111608111: 16乂61

13 1111(161: 1;116 3161111103111; 1 6 ^ 1 0 ^ 0^05^

1116 168111*5 1118111&51;化&七8&!? 2X1^ 15 1)116 01051; ! ^ 。 ! ! ; ^ 111110^9,111011 ^ & ! ) ^ ! ! ! ! : ^ .

& 1 0 * 0 1 1)0 11101:6856 1;116

? 0 1 11818 1)081*1^6 81)1110^61: 6 5 6 ( ^ 8 4 。 801116 6X1^6111;, 1)111; 1188 110

815111608111; 69601; 1:0 111016386 0163,1)1^6 111^6111)10115 811(1 1;116 111^611*10118 118^1112 111(161)611(1611^ 1111611166111; ^ 0 1 ) 6 1 ^ 7 ^ ! ^

6,

8

'

6360^ 10 1116 16^61 0^ 6111;!^口!^!!^!!!^!^^)

1186 1116 11111111361 0 ^ 116^ 16218*616(1 611^611)11368 ( 卩 ^ ^ ) ) 。 5 7 6111:61:1)1:1863 ( ! ^ ? 丁 ^ ) ) 611*1:61)1:6116111191 1 6 ^ 1 60115七119^ 1^01

1^1)1

力6。111101067 ^ ! ! ^ ! : 口 ! : ^ ^

811(1

1 6 & 1 5 七 。 1 6 3 1 1 2 6 ( 1 ^311168 0 ?

811(1 口 11乂8^6 1)60111101—

(卩!!!^)

1^1)1

35 21 1116381116 。【

1 3 ^ 6 ( 1 0116 1)6110(1

^!!^!^"

1 1 1 5 0 ^ 七 0 01111181 11111)8X1*8 011 111110^8*1011 3^1;1^11;168 ^1)11111 3^ 3^101^ 1)61:10(1

0 ^ 讨 脈 .

1116

0 ^ ? 0 1 1;0 1;116 611*161)1611611113116^1 0311 1^6 5110^6(1 3 5 & 1 1 0 \ ^ 1 1 1 2 & ^

1

1

^ .

7 1 ^ 1 1 6 3 2 , 3 , 4 3,130111; 11616

胥6

01)861^6 1;11166 3021*^61: 1)10*8 111 ^111011 63-011 1)01111; 1,6口168611七69,011 ^10^11106

611(1 1:118,1;七1161:6 119^6 1118,117 ?01111;3【3!'經&7

1;116 16(1 16^16851011 0111^6^

5

311(1

1111:66 0 0 1 -

1618,111011 0060101611*5 1 ) 6 ^ 6 6 1 1 ? 0 1 3 1 1 ( 1 1 1 1 1 !!!!?^!' 0〖3,11 1^111(15 0 ^ 116^ 6111)61:1)1:1868 8111(1 仏6

^6*61:1111113,1:6 006&01611*8 0 ^ 165 :6531011 6(^118,1)10118 9X6 311 ^ 6 1 ^ 1 。 见 ^ 0 ^ 6 08,11 1113,^6 1

00110111510118七!!&七1^1)1 1195 110 (!!!^仁力51^111&08111; 69601: ^ 0 1 6 ^ 1

0^ ^ ! ! 七 ! ^ ! ) ! ^ ! ^ ! ! ! ^ ! ^ ! ) .


關於統計論文的撰寫

90

丁116 111016 1^1)1 ^111 1101 1)11112 ^116 ^ ! ^ ^ !

1

611*1:61)16116111181 1 6 ^ 6 ^

11118 1681111; 1 1 1 8 , 7 匕 111(11106(1 \ ^ 0 1 : 0 \ ^ 1 1 1 2 ~ 0 1 1 1 ; 6^601; 0 【 ? 8 6 0 3 , 1 1 8 6 0【1;116 111^1 6

1 1 3 ^ 七 0 ^!^!;-!!!) 811 ^ ^ ^ ! ^ ! ! ^ ^ , & 51100688^111 6111;]:65)16116111 1111181; 1)6 81(1^611*1110115 1)1011661 ( ! ^ ! ! ! ^ 力 0 1 ; 1 1 6 1)16111611(10118 118^ 811(1 1)10^1(16 11151161: ^ 8 ^ 6

^116 1)16861106 0【6)161211 611*61:1)1:1563 111817

61111)107668 311(1 11101:6356 1116 001111)611*1011 111 1116 1113x1^61

5

11101:6386 1;116 41650111*7 0【81100688^111^ 848X1^118 311 ^ ! ! ^ ! ^ ! ^ ^ .

80 11; 18 111^617

11118

1113117

1)601)16 118^1115 061^8111 611^161)16116111 8^)111^8 ^0111(1 ! ^ ^ ! 86160^七116 8601116 811(1 8 七 6 9 4 乂 3013 111 &)161211 611*611511863 1:11311 1111(161*3^6七116 118^:七0 08X^6 0111:^

7^

00110111810113

&口。110^

11X1^110^10118

八 8 【 8 1 3 5 1)1)08 0X6 0011061116(1? 111110(11101115 111 8^1^81106(1 1)60111101057込^116 81101:1:0\11; 七0

1111)3*6 1:116 160111101027 1^0^683, ? 0 1 1188 1)6611 1 6 ^ ( 1 6 ( 1 8 5 311 11111)01*8111 0119111161

6 ) 1 160111101067 41&181011. 3 0 ^ 6 ^ 1 , 七 1 1 6 1681111)8 111七!!诒口3^61 ( ^ ! ! ^ ! ^ 钍 & ! ^ 3 8 &)110^8^

?118七,1:116 001:1:6181^1011 1^6^6611 1^1)1 811(1 1110 13 111512111508111; 81;91;131:10811^ 1116 11111

1)2101; 0 【 1 ^ 1 ) 1 011 1116 165101181 111110^8,1:1011 。3^0^1111^ 15 111811)1)16018,1)16 ^ 1*116 16^0118 \^111011 8,1^,19^^ 1X101& 1^1)1 113^611,1: \^& 111^161: 16^101181 11111073,1)1011仁&^!^!^. 01117 ^ 6 1 1 1116 乂。1隱 111116 0 〖 ^ 0 1 1113.1)011 1)116 8 * 0 0 ^ 0【1111111311 08^)11)81 311(1 1)60111101021031 09^8^1111168, 0811 1110 1)6 ( ^ ^ 。 ^ ( ! 811(1 6I111^I1^6^1. 11118 &1(11118 1 8 8 3 1 1 1 6 力 0 80161182*6111

( ! ^ ^ . 人 七 -

1)18^*1115 ? 0 1 13 110七1116 11111(1116 11168118 1 0 11101:6336 1110, 811(1 11; 1811,1; 1 ± 6 11111)01:1:8111: 11163115 61*1161 ^ 1116 4611611111113111)8 0 ^ 1110 1 1 1 0 1 1 1 ( 1 6 0 0 ^ 1 1 1 8 1 (!^乂!!!^ &)106 0【111110乂8^1011, 1)116 1:601111010510811 111110^3,111011 03-1)8,131111^ 111 6111:611)1:1868?七116 &1^1111^ 0【1113121115 &111 1156 0 ^ 1)116 10081 31)60181 1680111065 311(1 811 1011(18 0 ? 8 & ! ? 1680111065, 118^1116 1^16 ^ 0 0 ( 1 611^11:011111611*3 136116601811力0 111110^8,1:1011? 811(1七116 10081 60011011110 0011(111:10118 ,

860011(1, 1:116 3:68111*8 0 ^ 1 ^ 6 8*81*181:1031 1110(161 111(1108,116 1^118,1; 111^68^1116111; 111 I I & ; 0 810七1^1;168 13 1)116 111081; 11111)01*3111; & 1 0 * 0 1 七 0 6111131106力116 111110^3,1:1011 08^3^1111168 , 7 1 ) 1 1198 15081*1^6 81)1110^61: 6 3 6 0 * 3 七 0 801116 6x1)611七,1)111; 1188 110 312111608111; 6 9 6 0 1 七 0 11101:68186 0163,1:1^6 111^611*10115 311(1 111(1126110115 111110^8,1:1011 08^3^1111:168 ^

!^",七1110116111;11166 8 。 3 ^ 6 1 3 1 & ^ ^ ! ! ! ^ 811(1 00116181*1011 00691016111:8 1^6^6611 ?1)1 311(5 1

1;116 11111111)61: 0 【 1 1 6 ^ 611*61:1)11568 811(1 1116 361;6111111131;6 0069101611*5 0 【 1 6 ^ 6 8 5 1 0 1 1 69118^10113, 611(1 1113^ ^ 0 1 1183 110 0111601;

4 0 1116 1 6 ^ 1 0【^!!七!^!^^!^!!巧!!!!).


91

第六章:讚一篇要大改的文章

1 0 511111 11口 0,1)0^6 1631111;5? 158,111; 1116 1 而 ^ ( ! ?1)1 ^111

IV!]^05

113^6七116 1560111101051081 3X^8111;&2

8 0 1 1 1 6 0 6 1

68

^

1111;3^6 1;116 1;601111010^ ?1081:683 311(1 1 1 1 1 1 ) 1 0 ^ 6 1 6 ^ 1 0 1 1 3 1

111110乂8^1011 。9^8^111*168 111 501116 ( ! ^ ^ ^ ^ .

6111; ^ 6 0911^ ^11^

丁116 ^ 8 1 1 0 6 ( 1 力 6 ( ^ 1 1 0 1 0 ^

111 ^ 0 1 4116 111016七116 ^ 6 ^ 6 1 ^

1)1111(117

^ 6 111*10(11106

6(11111)111611*8 0 【 7 1 ) 1 02111^

1)6 1)18113^16(1七。^011168^10 &:1118 81\1^0111811;10311^ 111616 118^6 110 315111603111 001161^1011 1)6*^6611

1^1)1 811(1 I I I 。 , 1:116 11101:6

03,5)8,1)111*168 2111(1

乂8^011

―!:!忱.8。

^61;61^111118111;5七0 11111)1:0^6 1110

II&;0

0【?01

^6

^11 110力11606853X117 1)8X617 161^

0311

011

^11118

?01

5*1011661: 111110-

1110. 1?116

10 11X1^10^6

1110111(16 811011 ^ 1 0 1 5 3 8 &)110^116: 11101:6381112 ^011168110

!11乂631;1116111;8, 6111191101112 1^116 5 * 0 0 ^ 0【1111111311 ^ & ^ ^ , 11111)10^1115 1^6 1)60111101051081

111110^3,111011 。9^3^11辻!68 311(1 1;60111101067 3.^8011561107 111 ( ! 。 ! ! ^ ^ ^ 6111;61口1:1868, 118^1115 ^

0

^

0

611\010111116111;8【01: !11110^3*10113 ^

^116 &11(111153

111

1^1115

^ 3 , ^ 6 1 : 1118,7 ^10^1(16 801116 ^ ^ ! ^ 【 0 1

1)0*11

11051;

^ 6

0011111)1168

311(1 &)161511 1 1 1 乂 6 8 七 0 仏 6 9 8 6 ( 1 011 3 ^ 0 乂 6 311817318 ^ 6 1)111; & ^ ^ ( ! 301116 1)0110^ 11111)1108,1:10113

88

6 ) 1 1 。 篇 , 1 1 1 3 ^

&180 1)6 6 5 6 ( ^ 6

1;0

0七1161 ! ) ! ) 。 ^ , ? 1 1 8 ^ , 辻 1 3

七0 11111)1:0^6 4116 5 * 0 0 ^ 0【1111111011 。8^辻&1 811(1 11101166110115

II&0

1116

6 1 1

七【01

^

&

03^3^1111;168, ^^^1161)1161:

0 1 1 0 ^ ^111 4601(16 1;116 5^1110^61 6 & 0 1 : 5 ( ! ! ^ ^ ! ^ , 811(1

4116 8 * 0 0 ^ 0 ^ 1111111811 08,^1*31 13

111&1161106 81 118^1011,8 111(1126110115 111110^3,11011 08^8^)1111:168 311(1 1)0*611*18,111)7 ^11601;1^ I 七 1 8 11606838X7 ^ 0 1

0111118 七0 1

61113X56 111^68^111611*5

111^681;1116111;5 & 1 &5*61:1115

II&0

0111*1^3,11115七116 111(161)611(16111;

111

1)61801111618 ^

II&;0

681)6013117 4116

6)5*61:1116 1111111311 09^1\ 0\8 1

1

1七18 11606888X7 6 ) 1 0111118 力0 5^16116*11611 1

。8^)811^1^168, 1)81*101113X17 8111)1)01:^1112【01 1116

^1^1*168 0【46011110-1111:61181^6 111(1118*1:168^

II&;!) 8^-

111686 3X6 11111)011:8114力0 5111:111^力116 160111101057

1)6*^6611 ( ! 。 ! ! ^ ^ ^ ; ^ 6111:611)11868 8,11(1 &161^11 08,^)1*31 611*611)1:1568^ 01117 ^11611 4116 11081; 8 061*8111 1;60111101051091 1^81611*6(1 口61:80118, 0311 ^ 0 ^ 。 5 8X101166

001111*17

II&0

?!^^^^

111 ^ 6 1108力0011111;1:7 311(1 1;]:9111 4116 113^^6 111^1 1)60111101051031 ^31611*6(1 1?6180115 1)0 16(11106 5

4116

005^ 0【1111111311 168011106 9,11(1 1119^6 1)10(1110*8

1003117 1361;1;61\ 11161:6?016 1118,10115 113^1乂6

111110^3^1^6 375*61115 。61:&。1, 。1111;1乂3^1115 I I & ; 0 。8^)8^111乜68 。【^011168*10 611*61:1)11368 ?051-

1)1^617,

?1:011101;1112 811(1 5^11311113,11112 111(161)611(16111; 111110^3,1:10113 111 ( ! 。 ! ! ! ^ " 。 611*611)11568 9X6

七116 133818 &)]: 1111^1:0^111^ 1^601111010^10311卩1:021 688 &0111 1113^1115 1186 0 ? 5 1 ) 1 1 1 0 ^ 6 1 6 9 6 0 * 5 1

0 【 ? 0 1 ^ 。 。 ( ^ , 011111686 ^61111116111; 5110111(1 &)0118 011七116 ( ^ 皿 丄 ^ 0 【 丄 請 ^

? 0 1 311(1

1115131: 011 ^ 6 5*10^111^ 1)01111; 10 3,^8,1106 111(165)611(16111; 111110^^1011 0^&13111^168^ 1^1 了 10 111^6 911(1 ^

1

1

^

6

「 0 1 10 136 011 ^116 ^^0^,0^

18 1)61166018,1 1;0 1111^10^6 0111, 111^61)611(16111:

!11110^3^1011 03.^)3,1)111*168 ^ ^ ^ ! ! ^ ! ^ , 011111^ 5110111(1

^0 0163,^6 61 ?9,11 001111)6*1*1011 611^1:011-

111611力^01 ^011168*10 611*611)1:1863 1)0 001111)61)6 ^1*11 & 6 1 1 ^ 6 1 ^11868

9

311(1 ^ 6 6 ^ 5115&016111;


關於統計論文的撰寫

92

11^811011811685 0【1)116 1118X^61; ^ 1111(161:七116 111*61186 001111)61)1*1011 61^11:0111116111:8 1七1113,7 &)106 ^ 1 1 ^ 0 8 4〇111016856 1)116 ( ! ^ ^ ! ^ 0【1)60111101057 ^12^13&1:七0 0111: 0011111;1^

116&17611068 31*6 ^!^!!^^^, 611^1 0? ^ & ^ ^ ! " & 0 0 1 ^ 6 0 1 ^ 0 1 1 ,

本文的最後形式已在】0魏01

0100,1(1

80167106

5發表。見

11忧I):/^V1V^^81I11^^ .6(1^^^17VV7 )(18/1I1^16x^111;II11 (

^

讀者可以比較這兩文前後的不同。一如果底子不太差,努力作美容整形,還是 有用的。


第七章:讀一篇關於自助法的論文 在這一部分,我們選出2&011的一篇在1979年的論文來細讀一主要在探 討他的寫法,論文寫得好的境界有三:初級爲易售,讓評審覺得可以刊登;再進一步 是眞有內容,此時,即使寫得略差,也不會受太大的影響。最糟是其實沒有實質內容 但寫得花圑錦簇 1 。 此文爲1977年的甩^的獎座論文。這是國際數理統計學會(化^比化

6111^1081 8*8^1^8, 1^3^在它的年會中所邀請的主要演講。這演講會在會場的最大 廳內舉行,且同時沒有其他的論文在宣讀。能受到邀請的學者皆非等閑之輩一事 實上此文在八1111318上根本不會被拒絕,因爲否則皿8豈不是自己打自己的嘴巴? ^ 2 講座因爲要面對較大的聽衆(雖然麗8的會員都是以數理統計爲主,但也 不是人人皆是高手》因此這樣的論文也不會寫得太深。但更不會太淺,因爲否則又豈 不弱了被邀演講者的名頭?對這類的文章,作者有較大的期望,希望能〖對統計科學) 發生影響。因此他會寫得不僅能懂而且能用,且同時讓讀者覺得這文章有學問。 這篇文章的全文,見益觀1

3

01510,1131103

7,

1-26 。下面的註脚,要配合原文來讀 ,

可以當作此文的「導讀3」來用。我們的目的不是敎你自助法,而是介紹你這論文的寫 作。

1

「花團錦簇」是舊小説中形容八股文寫#^的用語。

2

因爲版權的問題,我不在此列出原文。但4/171&5

01

810.1151108是有名的期刊,好一點的專業圖當館都應

兹有。去找一下^ 3

這裡當然充滿了我的看法(如果不是偏見),也不盡然是作者的原意。此文我每讀一次,都有些新的領悟,

因此這一次不到之處,必然也是有的。

2


關於統計論文的撰寫

94 論文的標題是"丑。。!^!^!) 詞:匕。。!^"!)和拉(^&!&

1116*110(18:八110*1161: 100^ 8,1

』8X^111&".用了兩個名

。這兩件事都是「重抽法^6831111)11118 ^^(!)」。在演講的

時候,〗8X^111&已廣爲人知,但^(^&叩卻是新的東西。以下爲我的註脚。

9.1,

11116 I4, 1811010111 881111)16指的是:^,义 ,…,∼11(1 7

。此處直接

2

引入丑〖X,巧這個統計量,這個統計量是本文今後要討論的主弦律。注意到它有未 知的分布^在內。這和我們熟知的統計量如尤乂有異一它們不包含未知參數 5 。但目前你可將它想像爲X -

或者力^""之類的統計量。

1X1, &135*1^,11116 4在此直接提〗3X^111&,並和本文目的做一個區隔。本文可看 成爲〗8^1&的推廣,但作者並不這樣看,這樣看就把本文看小了。他將1300*8^ 看成爲一種自然的功法,而將〗8^1&看成爲一種類似的,但較低層次(因此反而 較複雜、較不淸楚明白)的工具。當然,在寫此文的時候,多數人知道』8^1& ,而 ^00*3^則正要推出,知者甚少 6 。所以他用』3X^111&作爲比較也是合理的。此時, 他對』8X^111&旣不能捧也不能罵,因此說8^

111168^ &^0x11118,1)1011

0〖】3^1^111&"

―但此話可不能空口說,後文得要有本事證明。

9.1, 111*1:0(111(^1011, 11116 5,用"紕化!!!^ 10 ^乂?皿!!"是恰當的用語。這回答了

「何

謂〗3^111&」這樣的較深層次的問題。

15.1, 11^00111^011, 11116 8 , "!11016 ^^!!^^"在後面可是要用例子說明的。故下 一句立刻說:對於831111)16 1116(11811而言,^(^&叩就比〗8X^111&有用^因爲已知

』8X^111& "!8 1010^11 10【811,,, 11^0(111(^1011, 11116 10.立刻又說,對於1111681: (^^!!!^。!!中,13001^3^比 01038 ^811(13^011 (另一種已知的重抽法,常在1111631 ^ ! ! ^ ^ ! ! 中 使 用 〉 要 好 。 ^ 1 , 111*10(111(^1011,

11116 13.此一段又提』8^011& ,說可以用仏11161:110(1來看出

』^111&可以視作爲^00*8*1:叩的一次微分。並說因爲可以這樣看,不止對〗8^111& 4

這指從8.1)3*1-301:起第一行,下同。

5 6

在無母數問題中,可視作未知參數,但它是「無窮維(!!!&!^ ^!!^!^。!!)」的。 事實上眞在這一行中的人應該早已知道。開玩笑,3*31^01(1的統計系正預備推出的一套方法,如果你還

想在這個行業競爭,豈有沒聽過一點風聲之理?在第一線作戰的戰士,耳朵當然是豎起來的。


第七章:讀一篇關於自助法的論文

95

可以提出理論基礎,並因此可以回答一些原先^8^1&需要回答但一直說不淸楚的 問題。此段的末尾還說,若有額外條件一一如已知?爲對稱或者811^0*11 何做^00*5^

― 該 如

7

。最後,更進一步提到,對於迴歸,1)00*51;^?又該如何做 ?

111*10^^1011,

11116

21.此一段說本文以舉例爲主,對於一般性的1)00*8*1:3^

8

理論著墨不多 。 ?^, 11116 3^此一段承認以前各作者的功勞。如【5, 6】爲"!^98 0103617 161^6(1,,

0

注意他不承認100^0相同,因此否則自已就沒有貢獻了。又說叫中的方法可以導出

本文的公式,又謊〖10】中的111&1^3〗11131 ^3.0^111&直接和本文的111^110(1 3 相 關。這一段是預吿,將後文的1116化0(1 2,^ = 1,2,3都一一交待。 注意到.[!01並非一般論文,而是8611 1 ^ 8 的 化 & ! ! ! ^

16?011 。 一般在重要論文

中是不引用技術報吿的,但【10】卻是有名的一篇文章,內行人都知道。所以可以在本 文中大方引用。

本文最後提出1)8X911161:& 1)00^1^,以印證本文所討論的 11011-1)3X811161:110 130。1;^!;!&!)爲主,但?81:31161;10 1^001;31;1:8^的道理是類似的,且和11.入.^151161:的1116)111181*1011 1)01111(1 一致。注意到7181161:基本上已解決了所有傳統型的1)3X81116*110 111&161106的問 題,可由此顯示出!^^^!:叩的不同凡響一一可以大小古今通吃。 ?,2,

860*1011 2, 11116 6,此處》1^8 110 11,, 0 6

一句,是爲了後面的例子(如相關係

數)做伏筆。在此也等於是說,此例雖然7爲一維,但^。^!:叩的應用則不限於此。

860*1011 29 11116 12.此一段用簡單的一段文字介紹〗3^^111&,並暗示〗8X^11!& 的不足:(!)只有興趣在1)198和 ^311191106; (^) 8,01^1&只有興趣處於口^)或^2.4^ !).2,

這種形式的統計量 9 。

111168 3-16.這一段直接介紹1)00^1:^的運作方式(但11朋10中所提的 "(!19,^1116 531111)168 。【5126 71—1 \^1;110111 ^!^^^!!^"是一直沒有講淸楚的〉。 !).3,

7

這裡提一下,一般的統計方法,若無法推展到迴歸型的數據,就不能算是完整。所以他提「能做迴歸」,是

有「本研究基本已完備」的暗示。 8

不要以爲3*311101^的人不做1)00^11:^的理論。相信此時作者必有些學生在努力。甚或已有一些成果。

要比這些人快,你需要更快,並且要消息靈通。去國外某學術單位訪問,這是一個目的。 9

其實本文中1)00^1^也多在對付這類統計量,但因在架構上丑(叉,"是廣泛得多,所以看^較高級。


關於統計論文的撰寫

96

9.3, 111168 17-23.這幾行不那樣易懂,但卻是^(^让叩的基本道理。"巧81161: 0011^ & ! ! ^ , 並 不 那 樣 ^ 1 1 - ^ 1 ( ^ 1 1 ,但打出7181161:的大名,不懂的人只好承認自己的學

問不夠。1)00^1^的精神是:用丑#的分布來近似丑的分布。爲何這竟是對的?我 曾有較數學的表示法如下。丑〔X,巧的分布可以用它的0118X^*61181^ ^11101:1011

(^.^)

來表現。同理,^ ^ ^ , ^ ) 的 分 布 , 則 用 類 似 的 比 1

來看。在(巧和②之間,有兩點相異:X

?, ?

# 。但仔細看一下,②中

的^,其實是一個用來指示對誰積分的(!^!!^ ^ 8 X 1 ^ 1 6 。若在②式裡的積分中令 乂^:?,則②變成

比較。和(力則知道若是7 ^片,則。和是完全一樣的。因此二者的分布在 此時是一樣的。

111168 24-29^這一段的好句子是'化力^6 ^8X^115 (!^^!^^ 0【81100685 0^七116 6X31111)168 5?68^ 6)1 ^ ^ ^ " ^ 這 又 暗 示 了 本 文 大 量 舉 例 的 原 因 。 11116

30及以下。這是做硏究的基本方法之一:用最簡單的11011-1:1^81

驗證理論。此處:^∼11(1

0826來

6(1;^是幾乎不能再簡單的情形,用前述的^0^1^方式

來做,是否會得到理想的結論?如果有,可以向下面繼續做;如果沒有,就得去找原 因。

11116 4,用、11^6188117 &111161:,, 9.4, 111168

一語帶過多少敎本上的結果,

5-16.這一段是可以硬算的。此處舉的是一個較複雜的例子。注意到因

爲X的情形等於已做過,雖然那是最簡單的情形,此就再做就沒有意思了。因此此處

用306011(1 11101116111;末討論,以示和1^110111181 作技巧之一。這0811161:

0856有基本的不同。至於引用岡,也是寫

(^)可是經典的古典敎本。你若是隨便引用一本3^131^8

111 6118111688?看在評審人的眼裡,你的份量就全不是那回事了。 1^.4, 11116

19及以後。此處提出三種方法來算^的分布。最後當然大多數人會用

1116*110(1 2,但方法一是用來印證用的:能做解析計算時還是要做解析計算。31111111^1011


第七章:讀一篇關於自助法的論文

97

終究不如6X^1;的計算結果。方法三其實是無用的,在本文中有用,是因爲我們要靠

它建立1)00*3*18^和』8X^111&間的關係。 但此文若沒有和』8^1^11&的一段姻緣,文章的支撑就少一些。所以這一文字是 可加上的。此外,用三個角度來看1)00^^叩,也表現作者上功夫。 9.4, 11116 29及以後。介紹本文的其它內容。主要指的是?-^^!^問題的處理。雖 然指的是86^1011 4

6 (沒有連貫〕,但二者都是2-331111)16 1)101)161118,故可放

在同一段落。

15.5, 560*1011 3,本節以硬算爲主,要點在^6, 111168 8-13.這幾行用明確的事實說

明"!30。1;81:1:3^ ^011^8 &1 831111)16 1116(11811, ^116】8^1011& ^065 1101;"。注意到^1 !]也是 經典敎本〖且引用時直指9.237 ―這是應該的。直接引用某書的時候,應結出較細 的資訊。如【3】,860*1011 27.4 ^ 4 , 11116 11》:)。這表示兩件事:(!)作者對讀者負責,不 希望你在一本500??的書中去找他所引用的某件事,(^)表示作者眞的讀過,不是鬼 混的。至於指【14】,9.8有錯一事,一般是有風險的。但若你眞的挑得出錯,也可以明 說。此處【141的作者腿1161是2&011的博導,二人關係良好,是無所謂的。 9.6, 11116 1 4 ― 9.8 611(10^1^16 1.這兩頁若是由一個小敎授來寫,多半會被要求刪 去 。 但 是 有 名 的 大 敎 授 , 所 以 可 以 多 用 篇 幅 。 重 點 在 1 ^ 1 6 1後面所說的

11105^ 110*1^16

1116…"。有這一句才能〗113*1^這兩頁的篇幅。並同時強調了最

簡單的^0^1叩,其實非常不錯。至於極力地將問題中的額外條件(如對稱、平滑) 用進^0*3*1叩的努力,其實是沒有甚麼大道理的。 如果在1979年,如果你數學不錯,一個立刻可以做的題目是:用數學來證明或 反證這兩件事。此文只用了 71

13而已。那麼,當71 ― 00時,情形會如何?對數學

好的學者,這不會太難。而在1979,這類文章多半可以刊載。我的直覺是:(!)你必需 手脚要快,(^) 二者的差別應在0、71;的項以外,^這種文章即使能做也沒甚麼 了不起,你只是證明你技術不錯。

但現在是2006 ,你必須好好查一下才會知道此事有沒有已經發表。而9.8的最 後一段是作者的感覺,雖然這不會是無的放矢,但也不會有眞正的大意義。明顯地, 目前根本不想追究這些現象。 這一節只有兩個要點:(!)對幼!!!!^ 111^1皿而言(因爲已知標準答案〕,^00*5^^


關於統計論文的撰寫

98

較】8X^111&要好:前者做對,後者做錯。②簡單的^0^1^不比複雜的1)001^1:&!) 要差。這裡面,。是數學證明,(^)則只是模擬的結果。但作者巧妙地安排1300^琴 的出場場景,並用拉0^111&來陪葬,雖然不是自己的計算^作者大方承認,本節的主 要技術來自〖13】〗。這是重要的,不要掠美一這是學術論文的規矩。

860*1011 4, 本節又舉了一個例子:對於0118011111111811^ 811817513中的61101: 18^6 的估計量,1)001

8*18^要比01088 ^811(18,^1011要強。 全節都是在用81^1^1011來做(道理當然是算不出解析的結果〕。這個例子和前 面的881111)16

1116(118111不同,否則就沒有甚麼意義。它的不同點在:。這是2-891111)16問

題;②01058

^311(1^1011和』8^111&桌不同的事;(力我們在此算不出6X3^的結果。

因此11^110(1 2是唯一的方法。並且,到目前爲止,1116*110^ 2尙沒有舉例。 主 要 的 結 論 在 ? ^ 1 0 的 1 ^ 1 6 2中:差別是0.09

0.03,有三倍的不同。

本節沒有理論,但模擬的步驟交待得十分淸楚一我可以根據作者的描述,寫 出一個程式同樣做出作者的結果。這也是科學論文的要點之一:所描述的實驗 10 資 料,應豐富到別人也能據此做出同樣的實驗的程度、這是「可重覆性(^^^^^ 1*50」的要求。 此節除了選題正確(需要一個观11-101 0 ^1的問題,它還得有一個^11-1010^1的 解,這個解還得比不上6 0 0 1^1叩\且本例的各種條件都尙未被討論過,因此除了寫 得 仔 細 之 外 , 並 不 算 難 。 可 提 出 的 是 , 在 ? 1 0 的 ^ 了 ) 中 , 要 用 6 5 * 1 而 非 6 8\ ;在1^11,

11116

1 9 處 , 要 指 出 該 用 饥 而 非 饥 - 1 。這些都是應該有理由的,想來眞正

的專家都知道。但我們只講文章的寫法,而非導出結果的數學。我們就不提了。 要注意的是9.9, (^!)中的「符號成對」時的寫法。在字母裡,先X再[先有《 才有:?',先有饥才有71 。因此

10 11

X

用 足 標 《 計 有 饥 個

V

用足標

模擬當然是一種實驗,儀器是^腦。~ 道理是:別人有辦法查證你的實驗是否做對了。

^計有71個


第七章:讀一篇關於自助法的論文

99

其中隱含的次序,數學上一點都不重要。但如此寫將出來,會讓讀者在唸這一段時少 用很多心力。並且你自己做計算時也會多費心力。例如(^)中的分母自然是7X1 ,不 會是71 。如果我們將(^!)寫成 二 3 X I ∼ ^ ! ?,《^ 1, 2,…,771

XI

^

^ 2;" & ∼ 1 ^ ?, ^1,2,一,71

雖然數學上正確,但就不夠漂亮了。即使我們寫成 XI ^ XI ^

XI∼1^ ?,《:1, 2,…,771

^

^∼!11(1 ?,》:1,2,一,71

^

也不夠漂亮。這類的小小化妝,也是要學的。 1 ) 1 2 , 860*1011 5, 11116

1.這一節目的是建立1?00^1:3^和』3X^111&的關係,是和

論文標題有關的主要結論。在11116

7處,就讚揚【10】是 6 ^ 6 11 6 加^1 。此事世間已

有公論,所以誇講一下也無所謂 12 。何況1)00^1^還要用拍01^11〖&來做墊背用!墊背 夠好,被墊的文章當然會更好。 這一段的數學技巧是將^看成爲多項分布。這是&^(^(! ^

,因爲原來的

& ∼ ? 用 到 X ; , 就 變 成 了 ?# ,而後者的分布是可以寫出6X2^ &1111的。技術上, 等於是由一個11011卞^811161;1^的架構,轉換到1)3X81116*1^的架構上去13 。 另一個要點是丑在這一段中完全沒有限制。因此此段說的是:一般的^⑨化^叩 和一般的〗^1^111&間的關係。當然,(^)所得到的結果,和[巧]中所得一絲不差 ―這才是本文中較硬的結果。此事到了 9.14的第一段結束,才算眞正回到傳統的

這一段要唸得眞懂,得找張紙找枝筆跟著做。此外,需得去讀[化]14或者【14】。 這一節以2006年的角度來看,並不重要一因爲^^&叩己可以獨立站起。 但本文的標題是"^。(^忖&!) 1116*110^8:人110力11枕100^鱿^6〗3X^1&",因此,「借用 3^1011&以成就本文」的味道很濃。而這一節就變得有意義。任何情形下,& 和!)。。^^^)都是重抽法(卩^腿!^!^ !!^^①,因此,在第一篇介紹1300*5^^的文 12

但對不怎麼樣的論文,就別亂捧:可能有人要吃味,也可能禳評審人覺得你品味不足。

13

嚴格地講,因爲還有 的值可視爲有71個未知參數的98011&1X16(^0 1110^61 現在大概是找不到它了。因爲8611乙油8已變成1^06111 ,而後者差不多要垮了。

14


關於統計論文的撰寫

100

章中,「和3^111&比一比」,「和38X^111&拉上關係」都是有意思的。這一節雖然對後 來使用!^。!^^!)的人無用,但對於化&『66的影響,卻是有一點用的一一至少,這一 節讓我們對於130(^*1&!)和』8^1&都有較深的了解,而了解卻是硏究的目的。 15

本節的最後一段有點多餘,只是回應前面的對稱情形,再多晃一招而已 。最後, (^)中最後一行中》的足標是多餘的。

0.14,

860*1011

6^這一節又舉了一個例子,例子性質又與以前的例子不同:(巧它

做的是標準的2-831111)16

0886

,因此可望由此看出一般的迴歸該怎麼做 1 6 。對於2-

58111?16問題而言,尙有不知如何處理38^111&的問題存在。而經由^"^叩的角 度以觀之,可望能解決〗^1^111&這個問題。我們可算出一些6X^1;的結果[公式 (^)],亦可經由111^110(1 2 (^^

^^(!)算出近似的結果[公式(^:^)],而這兩者

相差極少一一從而說明4 6 1仏1116*110(1用在1)00^1^上也是有道理的。

在9.16,

之後,明白說明如何用』8X^111&來做一個2-381111)16的問題,這解

快了一個未決的問題。 ,17, 360*1011

1.對這一節我的感覺不好。主要的是其技術內容,和前面的2-

881111)16 0356似無交集,也不搭調。也許從^1100X011 ^ 直 接 到 到 了,我看不出之間的關連。固然解釋了

16^16851011

是太快

「做法正確」,又用&來墊背

―說【15】和间都做錯了。但這一節因爲和前面連不上,寫來是有一點弱的。 當然,文章到了尾巴這裡,文氣已盡。讀者到此也都累了, 一般的想法是:前面的 似乎都沒有錯,最後一節大概也錯不了,因此,「深究」大概是不會去做的了。

9.19, 360*1011 8,

116111^指的是文章中較有深度的註脚。此文有6^的16111^1^,

是長了些。但這是2&011的風格。 總的來說,這文章其實只有一個主要的^1^: 「若我們想知道巩X,巧的分布, 用^(^&叩就好」。除了幾個有解析解的地方外 1 7 ,全文其實沒有多少技術面的東 西。但這卻是極好的統計論文:見林又見樹,而見林的部分,遠大於見樹,因爲作者選 了一個廣大的角度來看!^^&^!)的問題。數學計算太多的統計論文,基本上都是令 ;

我不敢説一定是虛晃一招。 '結果赠未明顯地由此看出。 '而且都不算^


第七章:讀一篇關於自助法的論文

101

人卻步,只有一小撮人可能有興趣的。 這文章沒有講甚麼?想一想。有沒有模糊的地方需要弄淸楚的?哪些問題他該 問卻沒有問?, , ^ 這是「找題目來做」的方法之一。當然,這是老文章了,容易補充的地方,大概都 被補齊了。去好好査一下1979後出現的關於^。^師的文章,我想,只是讀它們的 緖論,你就該學會怎樣找題目了。


mr\m. mmmmmx ^m^m^Mo mÂąmm% mm referee wftmrnto mmm m

T e s t i n g f o r A c t i v a t i o n i n D a t a from F M R I

Abstract

Experiments

The traditional method for processing functional magnetic resonance

imaging (FMRI) data is based on a voxel-wise, general linear model. For experiments conducted using a block design, where periods of activation are interspersed with periods of rest, a haemodynamic response function (HRF) is convolved with the design function and, for each voxel, the convolution is regressed on prewhitened data. A n initial analysis of the data often involves computing voxel-wise twosample t-tests, which avoids a direct specification of the HRF. Assuming only the length of the haemodynamic delay is known, scans acquired in transition p e r i ods between activation and rest are omitted, and the two-sample t-test is used to compare mean levels during activation versus mean levels during rest. However, the validity of the two-sample t-test is based on the assumption that the data are Gaussian with equal variances. I n this article, we consider the Wilcoxon rank test as well as modified versions of the classical t-test that correct for departures from these assumptions. The relative performance of the tests are assessed by applying


104

them to simulated data and comparing their size and power; one of the modified tests (the C W test) is shown to be superior. Key words:

Excess kurtosis, haemodynamic response function, Shapiro-Wilk test,

skewness, two-sample t-test, Welch test, Wilcpxon Rank test.

1. I n t r o d u c t i o n Functional Magnetic Resonance Imaging ( F M R I ) is a non-invasive m e t h o d t h a t produces a t i m e sequence of images of a subject's b r a i n t h a t are sensitive t o changes i n blood oxygenation caused b y neural activation. T h e vast m a j o r i t y of analytical techniques t h a t are applied t o F M R I data assume the transfer function between neural activation and subsequent changes i n blood oxygenation, the haemodynamic response function ( H R F ) , is k n o w n fully and the data follow the Gaussian d i s t r i b u t i o n . I n this article, we consider the analysis of F M R I data collected i n one of two states, called "activation" and "rest," based on two-sample tests. F r o m knowledge of the length of the haemodynamic delay, measurements during the transition period between activation and rest can be o m i t t e d . T h e validity of the classical two-sample t-test is based on the assumption t h a t the activation data and the rest data are Gaussian w i t h equal variances. I n this article, we propose use of a modified two-sample test for F M R I d a t a t h a t allows for departures from this assumption. We s t u d y three competing tests. One is the Welch test (Welch, 1937), which is a modification of two-sample t-test t h a t allows unequal covariances. A second competitor is the Cressie-Whitford ( C W ) test (Cressie and W h i t f o r d , 1986) t h a t can be used w i t h non-Gaussian data. T h e t h i r d competitor is the W i l c o x o n rank ( W R ) test (Wilcoxon, 1945). I n w h a t follows, we compare the classical t-test w i t h the Welch, C W , and W R tests for F M R I d a t a based on a block design, where the blocks alternate between periods of activation and rest. T h e next section describes the physiological background and physical processes used i n F M R I and the most common methods used t o process F M R I data; i t also defines t h e four two-sample tests (including the classical two-sample t-test) t h a t are compared i n Section 4.

Section 3 discusses the application of the two-sample tests

for F M R I d a t a and describes the methods used t o identify and quantify departures f r o m Gaussianity for each voxel. T h e size and power of t h e four tests are compared i n Section 4 using a simulation study of F M R I data, f r o m w h i c h recommendations are


105

given. Section 5 contains discussion and conclusions. 2. F M R I E x p e r i m e n t s 2.1 S o m e p h y s i o l o g y A l l neuronal activation is linked t o an increase i n oxygen consumption, causing a local increase i n the blood flow. T h e body's response is t o supply more oxygen t h a n is required for the neuronal activity.

Due t o the different magnetic properties

of oxygenated a n d de-oxygenated blood, the excess oxygenated blood t h a t circulates d u r i n g neuronal activation alters the magnetic properties of the venous blood, resulting i n the so-called blood oxygenation

level dependent ( B O L D ) signal. F M R I produces a

sequence of b r a i n images t h a t is sensitive t o changes i n the B O L D signal. I n a classical F M R I experiment, the subject is scanned every few seconds t o o b t a i n an image of the brain; the subject is exposed t o an experimental stimulus i n some t i m e periods, and is i n a rest state during the remaining time periods.

The s t i m -

ulus can either be applied for brief periods i n r a p i d , possibly r a n d o m succession (an "event-related" experimental design, Josephs et aZ., 1997), or for longer periods w i t h i n terspersed rest periods (a "block" experimental design, Frackowiak et al, 1997). I n this paper, we focus on F M R I experiments conducted using a block experimental design. Even though neuronal activation occurs immediately after exposure t o the e x perimental stimulus, the vascular response evolves more slowly, resulting i n the B O L D signal. T h e temporal relationship between neuronal activation and the observed B O L D signal is called the haemodynamic response. To model the haemodynamic response, i t is common t o convolve the experimental design w i t h a so-called haemodynamic r e sponse function ( H R F ) . Poisson, gamma, and Gaussian distributions are used widely as H R F s (Friston et al, 1994). T h e region of the brain where there is neural activation is found by regressing the observed F M R I data on the expected B O L D signal, obtained as a convolution of the experimental design w i t h the H R F . O f course, this depends on a well-specified H R F . 2.2 F M R I d a t a


106

Observed F M R I d a t a are four-dimensional, i n space and t i m e . A t each t i m e p o i n t , a three-dimensional image of the brain is acquired, called a volume.

Each volume

consists of voxels, and each voxel has an associated one-dimensional t i m e series of observed signal intensities. T h e most common approach t o the analysis of F M R I data is t o consider t h e v o x els independently. A widely-used approach assumes a general linear model ( G L M ) for the voxel-wise t i m e series (Friston et aZ., 1995).

For example, after various p r e p r o -

cessing steps, i n c l u d i n g prewhitening to achieve approximately independent errors, a two-sample test statistic is computed for each voxel where the two samples correspond t o activation d a t a and rest data. A voxel is declared to be significant i f the test statistic exceeds some threshold. T h e distribution theory associated w i t h this approach is based on the assumption of Gaussianity of the observed data and the proper specification of the H R F leading t o the expected B O L D signal. For i n i t i a l data analysis, i t is enough for us t o know the length of the h a e m o d y namic delay between neural activation and changes i n the B O L D signal ( B a n d d e t t i n i et al, 1993). T h i s knowledge is used to o m i t scans acquired i n transition periods between possibly "activated" B O L D signals and "resting" B O L D signals. T h e delay between the neural activation and changes i n the B O L D signal depends on many different factors; the t y p e of s t i m u l i , the d u r a t i o n of each stimulus, and the b r a i n activation regions can all effect the length of the delay. Empirical studies have proposed methods for e s t i m a t ing H R F s t h a t can adapt t o different experimental designs. B y using the block designs described i n Section 2.1 and deleting transition data i n our preliminary analysis, we have a sample of data acquired under activation and a second sample of d a t a acquired under rest. I n the next section, we describe four possible two-sample tests t h a t m i g h t be used t o test for the presence of activation at each voxel. 2.3 T w o - s a m p l e t e s t s T h e n u l l hypothesis of no difference between the means of two populations can be investigated w i t h appropriate two-sample tests. I n w h a t follows, we summarize the four tests t o be compared where, under activation the voxel d a t a are F Y under rest t h e voxel d a t a are F Y

r

= {Yj}jeFR]

a

= { Y i } i e F A and,

here FA and J?R denote t h e activation


107

and rest acquisition times, respectively. T h e classical two-sample t-test T h e classical two-sample t-test assumes:

( A l ) Observations FY

a

and FY

are uncorrected.

r

(A2) T h e observations w i t h i n each of FY

and F y

a

have identical Gaussian d i s t r i b u -

r

tions; t h a t is, FYf (A3) al =

~

Gau(/JL * F l , a) * F J ) ;

/ G {a,r}.

f

al

T o test t h e hypothesis: HQ : /x < Mr versus # 1 : jJL > Mr> a

a

the classical two-sample t-test uses test statistic, T

Y -Y a

= 'j_ n a

Y

f

= - Y Y i n

and

r

, J _ \ f(n -l)s2+(n -l)3?\ n / ^ n +n -2 J a

r

r

=

a

£

f t £

i

6

F

r

^ n

" f

~

/ €

;

{a,r},

1

where F is t h e set of activation times F A (rest times FR) i f / is t h e number of t h e observations i n the sample F Y

a

: a ( / = r ) , and n

(n )

a

r

(FY ). r

I f Assumptions ( A l ) , ( A 2 ) , and (A3) are satisfied, the classical two-sample t-test w i t h significance level a is: Accept H

0

i f T < t {l d

- a)

Accept Hi otherwise, where t j ( l — a) is the 100(1 - a) percentile of the t distribution on d = n degrees of freedom.

a

+ n - 2 r


108

T h e W e l c h test T h e Welch test (Welch, 1937) is used t o test the same hypotheses (2.1), b u t i t assumes only ( A l ) and ( A 2 ) ; t h a t is, i t is possible t h a t o\±

a*. Welch (1937) has shown t h a t

under the n u l l hypothesis HQ, the test statistic

la. n 0

i

it fir

has approximately a t d i s t r i b u t i o n w i t h

degrees of freedom. I n practice, the population variances a j , crj? i n (2.4) are estimated from data using sample variances

s?- T h e Welch test w i t h significance level a is:

Accept H

0

i f T* < t (l e

-

a)

Accept Hi otherwise, where the cut-off value i ( l — a ) is based on fractional degrees of freedom and is obtained e

by interpolation of the ^ ( 1 — a) cut-off levels based on the nearest integers d t o e. T h e C W test T h e C W test (Cressie and W h i t f o r d , 1986) also tests hypotheses (2.1), b u t makes only Assumption ( A l ) ; t h a t is, i t is possible t h a t the data are non-Gaussian w i t h unequal variances. T o account for this, we use the same statistic T* given by (2.3) as Welch, b u t m o d i f y its n u l l d i s t r i b u t i o n according t o the skewnesses oj3 , a^ a

kurtoses a^

ai

r

r

and the excess

of the non-Gaussian activation and rest distributions, respectively.

B y calculating the Cornish-Fisher expansion of T * , Cressie and W h i t f o r d (1986) show t h a t under Assumption ( A l ) and HQ, the d i s t r i b u t i o n of T* is approximately t h a t of the r a n d o m variable,


109

where ?7, Z are i . i . d . iV(0,1) and 1/2

9 =

T h e C W test w i t h significance level a is Accept H

i f T * < v{l -

0

a)

Accept Hi otherwise, where v(l simulation.

- a) is the 100(1 - a ) percentile of the d i s t r i b u t i o n of V, obtained byAs for the Welch test, the population moments i n (2.5) and (2.6) are

estimated f r o m data using sample versions; see Section 3.3. T h e Wilcoxon R a n k ( W R ) Test T h e W R test (Wilcoxon, 1945) makes only assumption ( A l ) , as does the C W test. I n addition, i t assumes t h a t the distribution function F(y)

of the observations FY

continuous and the d i s t r i b u t i o n function of the observations FY

r

is

is F(y — 6), for 8 ₏ R.

a

T h e n the W R statistic tests the hypotheses, : S < 0 versus Hi : 5 > 0.

H

0

(2.7)

I n order t o test (2.7), the W R test sums the ranks of each of the FY

values i n the

a

combined sample of N = n + n a

r

data consisting of the FY

a

and FY

r

from smallest t o largest. Let Ri denote the rank of Yi\ i G FA.

values ordered

T h e test statistic for

the W R test is ieFA

A n exact p-value is then computed based on the null distribution (S = 0) of W , which is obtained by considering a l l possible N\ permutations of ranks of the FY

and

However, this is computationally demanding for large n

a

a

a

and n . For large n r

we approximate the d i s t r i b u t i o n of the centered and scaled version of w

*

=

W - .5 - n (n a

y/n n (n a

r

a

a

FY . r

and n , r

W,

+ n + l)/2 r

+ n + 1)/12 r

w i t h a standard normal (Hollander and Wolfe, 1999). Hence the W R test w i t h s i g n i f i cance level a is:


110

Accept H

0

i f W* < z(l -

a)

Accept jFfi otherwise, where z(l — a) is the 100(1 — a) percentile of the Gaussian d i s t r i b u t i o n w i t h zero mean and u n i t standard deviation. 3. M e t h o d s o f A n a l y s i s a n d C o m p a r i s o n s

I n this section, we continue t o consider inference based on a single generic voxel. Simultaneous inference involving all voxels is considered i n Section 4. 3.1 A p p l i c a t i o n of T w o - S a m p l e T e s t s t o F M R I D a t a L e t T be t h e set of acquisition times of the observed intensities associated w i t h t h e given voxel. Assuming the subject was exposed t o only one t y p e of neural activation, T can be d i v i d e d i n t o three groups: the time points F A where activation of the B O L D signal is expected, the time points FR during which the B O L D signal is expected t o be i n a rest state, and the t i m e points B corresponding t o the transition periods between the activation a n d the rest times. A n example of such a division of t i m e points is illustrated i n Figure ??. I n the two-sample tests considered i n this article, one sample corresponds t o F A and other sample corresponds t o FR; intensities corresponding t o B are o m i t t e d f r o m further analysis.

Figure 1 about here

Consider the two-sample tests of #0 versus Hi given i n Section 2. For a given voxel and a given test, accepting the alternative hypothesis Hi means t h a t the associated voxel is declared t o be activated by the experimental stimulus. 3.2 S i m u l a t e d F M R I d a t a Six datasets were obtained f r o m 3 healthy volunteers (1 female, 2 males) using a 1.5T Signa scanner. T h e data were collected under rest conditions; t h a t is, the subjects were not exposed t o any stimulus during the experiment and they were instructed t o


in relax i n the scanner w i t h their eyes closed. One such rest dataset was obtained f r o m the first male subject (30 years old), two rest datasets were obtained f r o m the second male subject (27 years o l d ) , and three rest datasets were obtained f r o m the female (30 years o l d) . Each dataset consisted of 200 volumes, every observed volume contained 28 slices, and each slice h a d 64x64 voxels. These datasets were preprocessed for m o t i o n correction and prewhitened t o make the t i m e series uncorrelated (using t h e software F E A T , which is p a r t of the F S L package; see S m i t h et al, 2001). We created activation datasets by essentially adding a signal having known nitude

and location of t h e activation t o each preprocessed rest dataset.

mag-

T h e signal

component was calibrated against an image acquired from a previous unrelated visualactivation F M R I experiment; see Figure ?? for an example. B y a p p l y i n g the signal i n t h e locations acquired f r o m a previous visual experiment, we avoided the p o s s i b i l i t y of applying the signal near so-called default regions (regions w h i c h show decreased neuronal activity d u r i n g the activation of the stimulus) and their confounding effects on t h e simulated signal. T h e activation datasets alternated blocks of 10 t i m e points of rest w i t h 10 t i m e points o f activation. T h e average peak-signal change, defined as a ratio between the average of t h e intensities under the activation and t h e average of the intensities measured d u r i n g t h e rest periods for the most activated voxel, was set t o be 3%. Each dataset contains 200 time points; the three sets of t i m e points F A ,

FR,

and B were obtained assuming a haemodynamic delay of 3 t i m e periods, resulting i n = 70 and n = 73.

n

a

r

Figure 2 about here

3.3 V i o l a t i o n s o f e q u a l v a r i a n c e s a n d G a u s s i a n i t y a s s u m p t i o n s Several methods were used t o assess the degree of departure of the activation datasets f r o m (A2) and ( A 3 ) . Consider a generic voxel and recall from Section 1 t h a t FY

a

= {Yi}i YA e

make up the so-called "activated" sample and FY

r

= { l j } j p f i make e

up the "rest" sample. To investigate the violation of Assumption (A3) given i n Section 2, thereby a l lowing a% ^ cr^, we computed the sample variances for FY

a

and FY

r

for each voxel


112

i n each activation dataset.

T h e pairs of sample variances of active and rest samples

for all voxels t h a t are located i n subject's b r a i n (out of a l l 64 x 64 x 28 = 114,688 voxels, only 2,2340 of t h e m were located i n subject's brain) are p l o t t e d i n Figure ??; the 45-degree line corresponding t o equal variances is superimposed. I n a l l panels, and especially i n 3(c), we see some points far from the diagonal, which suggests t h a t the assumption of homogeneity is violated for three voxels. A formal F-test (a = 0.05) of equal variances detected 1,225 o u t of 22,340 (5.5%) b r a i n voxels t o have significantly different sample variances, and visual inspection of these voxels indicated no spatial pattern. T h i s indicates t h a t , overall, unequal variances may not be a serious problem for these F M R I data.

Figure 3 about here

To investigate departures from Gaussianity, Assumption ( A 2 ) , we computed t h e sample skewness and sample excess kurtosis for FY

a

and F Y , for a l l six activation r

datasets. For the activation sample these are:

<* S i e F A ^ ~ ^ a )

n

and likewise we computed as

r

and

4

_ o

for the rest sample.

To illustrate graphically the relationship between skewness and kurtosis, we chose one activation dataset. T h e pairs ( a 3 , S 4 ) for the 22,340 b r a i n voxels f r o m one a c t i a

a

vation dataset are p l o t t e d on the left panel of Figure ??, and the pairs ( S 3 , a ) are r

4 r

plotted on the right panel. For Gaussian data, the p l o t t e d pairs should be very close t o the origin. I n Figure ??, we observe strong departures f r o m zero skewness and zero excess kurtosis i n b o t h panels. Thus, we might expect an improvement i n hypotheses testing for activation using the C W test or the W R test over the classical t-test or the Welch test.

Figure 4 about here

two-sample


113

More formally, we calculated the Shapiro-Wilk test (e.g., Royston, 1982) for n o r m a l i t y (a = .05) for each voxel and rest/activation combination. For the dataset used i n Figure ??, Table ?? summarizes the number (out of 22,430) of b r a i n voxels t h a t were significantly non-Gaussian. A b o u t 12% of activated samples and about 1 1 % of rest samples were declared significant by the Shapiro-Wilk test; i f the samples were Gaussian, we w o u l d expect only 5% to be declared significant. M o r e t h a n 20% of voxels were declared significant i n at least one of the activated or rest samples.

Table 1: Brain-voxels declared significant using Shapiro-Wilk test (a = .05) based on one of the six datasets.

Activated samples Significant

N o t significant

Total

Rest

Significant

647

2095

2742 (12.3%)

samples

N o t significant

1774

17824

19598

2421 (10.8%)

19919

22340

Total

T h e spatial d i s t r i b u t i o n of the voxels declared significant is shown i n Figure ??; while they are distributed fairly homogeneously between regions of the b r a i n , there is some indication t h a t , w i t h i n a region, they can clump together.

Figure 5 about here

4. R e s u l t s A l l four two-sample tests were used to test for activation i n each voxel. We o b tained p-values as i n Section 2 where the p-value for the C W test was obtained from simulation of the r a n d o m variable given by (2.5) and that for the W R test was obtained from the standard n o r m a l approximation to W*. Because of the multiple hypotheses being tested (one for each brain voxel), the v o x els declared as active were obtained by comparing the p-values w i t h a* =

of brain voxels}


114

w i t h a = .05. T h i s is t h e voxelwise Bonferroni-adjusted level of significance based o n an overall level of significance of a = .05. Voxels w i t h p-values less t h a n or equal t o a* were pronounced active. Because the activation p a t t e r n of each dataset was k n o w n , we can estimate a n d compare t h e sizes and powers of the two-sample tests. Let A denote t h e set of voxels t o which an activation signal has been added and R the set of voxels w i t h no added activation. Let b r i g h t denote t h e voxels i n A declared t o be active, and let .Awrong denote t h e voxels i n A n o t declared active. A l l voxels f r o m category R can be similarly divided into T^nghtj those non-activated voxels n o t declared active, a n d 7ÂŁwrong> those non-activated voxels which were declared active. T h e achieved size of each test was estimated by

S = (|?ewrong|/|^|), where \C\ = # voxels i n the region C of the brain. T h e q u a n t i t y a is also called t h e falsepositive rate and should be comparable t o the desired familywise level of significance a ( = .05). I f a < a , t h e test is conservative. T h e power of each test was estimated b y

which is t h e true-positive rate. Table ?? lists t h e estimated sizes and powers of each test for a l l six simulated F M R I datasets. A l l four tests were consistently very conservative, w i t h t h e Wilcoxon test being the most conservative.

T h e classical t-test and Welch test h a d equivalent

power, which was consistently greater t h a n t h a t of the Wilcoxon test. T h e C W test was t h e most powerful test, u n i f o r m l y over the six datasets.


» A * : mmmx

115

Table 2: Estimated size and power of the four two-sample tests for the six datatsets.

Dataset Classical t-test

Welch

CW

WR

a

7T

a

7T

a

7T

a

7T

1

.496E-4

.289

.496E-4

.288

.992E-4

.305

0

.277

2

0

.208

3

0

.221

0

217

0

.235

0

.202

4

.583E-4

.233

.583E-4

.233

1.750E-4

.253

.583E-4

.224

5

0

.205

0

.205

0

.223

0

.188

6

0

.239

0

.237 27.527E-4

7.466E-4 .208 19.927E-4

.224 4.479E-4 .200

1.101E-4 .227

.251

Table ?? gives a more detailed comparison of the classical t-test and the C W test for one of t h e datasets. W h i l e 626 out of 2,173 activated b r a i n voxels were correctly detected as significant by b o t h tests, 37 additional activation voxels were correctly detected by the C W test t h a t were n o t identified by the classical t-test.

O n l y one

activation voxel was identified by t h e classical t-test t h a t was missed by t h e C W test.

Table 3: Comparison of the performance of the CW test and the classical t-test. based on one of the six datasets C W test Voxels f r o m TZ

Voxels from A

Voxels

Ann

Classical

from A

^wrong

t-test

Voxels

^right

f r o m TZ

^-wrong

5. D i s c u s s i o n a n d C o n c l u s i o n s

Aight

^wrong

626

1

37

1509

T^wrong

^right

20165

1

0

1


116

W h i l e the results were obtained from only one type of scanner, the 1.5T Signa G E , and w i t h F M R I d a t a for three subjects, they show t h a t F M R I data can e x h i b i t b o t h unequal variances and non-Gaussianity. Using the Shapiro-Wilk test, more t h a n 20% of voxels i n the dataset were declared significant i n one or b o t h of t h e rest or activated samples. We believe t h a t more powerful scanners w i l l lead t o data t h a t are even more non-Gaussian, since their finer spatial resolution involves less averaging of the response. T h e Welch test is valid for unequal variances b u t when non-Gaussianity is s u s pected, the C W test accounts for b o t h . T h e W R test is a nonparametric analog of the classical t-test. I n the six datasets studied i n Section 3, non-Gaussianity was a bigger problem t h a n unequal variances. T h e results i n Section 4 showed t h a t the C W test performed better t h a n the other three tests. These results suggest t h a t the C W test should replace any standard use of the classical parametric or nonparamentric two-sample tests based on F M R I data. Acknowledgement T h i s research was supported by the Office of Naval Research under grants N0001499-1-0214 and N00014-02-1-0052 and by the National Science Foundation G r a n t D M S 0406026. T h e authors w o u l d like to t h a n k Antonio Algaze and Petra Schmalbrock for providing the F M R I data and the members of FMRD3, Oxford U K for i n i t i a l consultat i o n about simulating activation F M R I datasets. Perceptive comments b y the referees led t o improvements i n the exposition and strengthening of our conclusions. References

Bandettini, P. A., Jesmanowicz A., Wong, E. C. and Hyde, J . S. (1993). Processing strategies for time-course data sets i n functional M R I of the human brain. Magnetic Resonance in Medicine 30, 161-173. Cressie, N. and Whitford, H. J . (1986). How to use the two sample t-test. Biometrical

Journal

28, 131-148. Frackowiak, R. S. J . , Friston, K. J . , Frith, C. D., Dolan, R. J. and Mazziotta, J. C. (1997). Human Brain Function. Academic Press. Friston, K. J.,. Holmes, A. P., Worsley, K. J., Poline, J. B., Frith, C. D. and Frackowiak, R. S.


HAS: mmmmx

117

J. (1995). Statistical parametric maps in functional imaging: A general linear approach. Human Brain Mapping 2, 189-210. Friston, K. J., Jezzard, P. and Turner, R. (1994). Analysis of functional M R I time-series. Human Brain Mapping 2, 69-78. Hollander and Wolfe, (***** add initials ****) (1999). Nonparametric

Statistical Methods,

2nd edn. John Wiley and Sons. Josephs, O., Turner, R. and Friston, K. J. (1997). Event-related fMRI. Human Brain Mapping 5, 243-248. Royston, P. (1982). A n extension of Shapiro and Wilk's W test for normality to large samples. Applied Statistics 31, 115-124. Smith, S. M . , Bannister, P., Beckmann, C , Brady, M . , Clare, S., Flitney, D., Hansen, P., Jenkinson, J., Leibovici, D., Ripley, B., Woolrich, M . and Zhang, Y . (2001). FSL: New tools for functional and structural brain image analysis. Neurolmage 13, S249. Welch, B. L. (1937). The significance of the difference between two means when the population variances are unequal. Biometrika 29, 350-362. Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics

1, 80-83.


118

A n Evaluation of Multiple Behavioral Risk Factors for Cancer i n a Working Class, Multi-Ethnic Population

Abstract

Behavioral risk factors for cancer tend to cluster within individuals,

which can compound risk beyond that associated with the individual risk factors alone. There has been increasing attention paid to the prevalence of multiple risk factors (MRF) for cancer, and to the importance of designing interventions that help individuals reduce their risks across multiple behaviors simultaneously. The purpose of this paper is to develop methodology to identify an optimal linear c o m bination of multiple risk factors (score function) which would facilitate evaluation of cancer interventions. Key words:

Community based research, conditional logistic regression, multiple

risk factors, random effects.

1. Introduction Despite the considerable biomedical advances of the last half-century, facilitating improvement i n lifestyle behaviors remains the most efficacious population-level strategy for reducing cancer risk. Estimates vary, but suggest that over fifty percent of new cancer cases and up to one-third of cancer mortality could be prevented though improvements i n health behavior practices (American Cancer Society, 2004; Doll and Peto, 1981). A 19 percent decline i n the rate at which new cancer cases occur, and a 29 percent decline in the rate of cancer deaths, could potentially be achieved by 2015, if prevention efforts were heightened and behavior change sustained. This would translate to the prevention of approximately 100,000 cancer cases and 60,000 cancer deaths each year, by the year 2015 (National Cancer Policy Board and Institute of Medicine, 2003). There is ample epidemiological evidence for the consideration of red meat consumption, physical activity, and folic acid intake i n cancer prevention efforts. Regular physical activity lowers the risk of cancers of the colon, breast, and possibly prostate ( Colditz, Cannuscio, and Frazier, 1997; Priedenreich and Rohan, (1995).). A n additional 30 percent of cancer deaths can be attributed to adult diet ( Anonymous, 1996); higher intake of red meat has been associated with increased risk of colon ( Sandhu, White and McPherson, 2001) and prostate cancers ( Michaud, Augustsson, Rimm, Stampfer, Willett, and Giovannucci 2001). Associated with


119

both physical inactivity and diet is obesity, which may account for between 25-30 percent of cancers of the colon, breast (postmenopausal), endometrium, kidney, and esophagus (Vainio and Bianchini, 2002). Folic acid is protective against colon cancer ( Giovannucci, Stampfer, Colditz, Hunter, Fuchs, Rosner, Speizer, and Willett, 1998); long-term multi-vitamin use, in particular has been found to reduce risk for colon cancer, likely because of its folic acid content (Giovannucci et al. 1998). The risk for many diseases, including colon cancer, is associated with multiple behavioral risk factors (MRF); these behaviors are highly interrelated and tend to cluster within i n d i v i d uals. For example, those who eat high-fat diets are also more likely to be sedentary, suggesting that the behaviors may be mutually reinforcing (see e.g., Emmons, Marcus, Linnan, Rossi, and Abrams, 1999). Change in one behavioral risk factor thus may serve as a stimulus or gateway for change i n the other health behaviors (see e.g., Emmons et al. 1999), and there are overarching behavioral principles and intervention frameworks that guide behavior change efforts across risk factors. Consequently, to facilitate population-level reductions in cancer risk, i t may be inefficient to target discrete behavioral risk factors, when similar principles might be applied simultaneously to multiple behaviors (Institute of Medicine, 2000). The literature provides little consensus as to the most appropriate analytic strategy for evaluating the efficacy of M R F interventions; most studies have analyzed the various outcomes independently or by creating a simplistic sum (e.g., 1 RF + 1 RF = 2RFs) (see e.g., Prochaska and Sallis 2004; Campbell, James, Hudson, Carr, Jackson, Oakes, Demissie, Farrell, and Tessaro, 2004). This could be problematic, because the use of separate analytic strategies may result in improper inferences regarding the effect of an MRF intervention because of correlation among the factors. Such strategies may overlook the clustering effect brought about by the a g glomeration of multiple behavioral risk factors and have been criticized as being too simplistic. The purpose of this paper is to develop a methodology to identify an optimal linear combination of multiple behavioral risk factors (MRF score function) for cancer that would best facilitate evaluation of an M R F cancer intervention. 2.

Methods

2.1 S t u d y design The data analyzed in this paper are from the Harvard Cancer Prevention Program Project (HCPPP) Healthy Directions, which is composed of two randomized controlled trials, one in health centers (HC) ( Emmons, Stoddard, Gutheil, Suarez, Lobb, and Fletcher 2003), and another in small businesses (SB) (Hunt, Stoddard, Barbeau, Wallace, and Sorensen 2003).


120

The overarching goal of the HCPPP was to create a new generation of cancer prevention interventions that would be effective among working class, multi-ethnic populations. Together, the two arms of the trial were successful i n enrolling a sub-population of the multi-ethnic working class population i n eastern Massachusetts. The study aims and sampling strategies are published in greater detail elsewhere (Emmons et al, 2003; Hunt et al, 2003). 2.2 H e a l t h centers Healthy Directions-HC (Emmons et al) was a randomized controlled trial conducted i n collaboration w i t h a large health care delivery system, comprised of 14 multi-specialty medical group practices that serve over 270,000 patients. Ten of the fourteen health centers were invited to participate i n this study, and all agreed. Health center served as the unit of randomization and intervention. Briefly, patients who resided in low income, multi-ethnic neighborhoods (defined using census block-groups that were predominantly working class, impoverished, or with low levels of education) were identified and approached for participation through their health center. Individuals identified through geocoding to be residents in the target neighborhoods were deemed eligible i f they met the following criteria: (1) being 18-75 years old, (2) having a well-care or follow-up visit scheduled with a participating provider, (3) being able to speak and read either English or Spanish, (4) not having cancer at the time of enrollment, (5) not being employed by the participating health centers, (6) not being employed by a worksite participating in the companion small business study, and (7) providing consent to participate in the randomized study. A l l providers practicing i n the Internal Medicine Departments of the health centers were approached for permission to recruit from among their patient pools. Provider participation averaged 83% across sites (range 50%-100%; 97 clinicians). Patients scheduled for appointments with the participating providers and in the eligible age range were identified through the automated central appointment system. Study staff attempted to recruit 8,963 potentially eligible candidates; 2,547 (28%) individuals were unreachable. Among the 6,414 p o tential subjects reached, 867 (14%) were ineligible, 3,330 (52%) refused, and 2,219 (35%) were enrolled. Assuming that 14% of those not reached were also ineligible, the response rate is 29% of those assumed eligible. The cohort recruited at baseline was contacted by telephone after the intervention period to complete a follow-up survey. Of the 2,219 who completed the baseline survey (n=1088 intervention condition; n=1131 control condition), 1,954 (88%) completed the follow-up survey. The follow-up response rate was equivalent across conditions. 2.3 S m a l l business The Healthy Directions-SB study (Hunt et al, 2003) was a randomized controlled trial in which the worksite was the unit of randomization and intervention. Worksites were identified


121

using the Dun and Bradstreet database to locate small businesses w i t h Standard Industrial Classification (SIC) codes 20-39 (manufacturing industries) and employing between 50-150 e m ployees. Additional inclusion criteria included: (1) employing a multi-ethnic population (defined as 25% of workers being first-or second-generation immigrants or people of color), (2) having a turnover rate of less than 20% in the previous year, (3) being autonomous i n decision-making power to participate i n a study, and (4) agreeing to be randomly assigned to the intervention condition. One hundred thirty-three (133) companies met the eligibility criteria, and of these, 26 agreed to participate ( Barbeau, Wallace, Lederman, Lightman, Stoddard and Sorensen 2004). Data were collected using interviewer-administered surveys among individuals who were permanent employees and worked 20 hours or more per week. On site interviews were administered on company time i n the language (either English, Spanish, Portuguese, or Vietnamese) preferred by respondents. Two cross-sectional samples were collected, one at baseline in which 1,740 participants from 26 worksites completed the survey (response rate 84%). The second sample was collected at follow-up 1,408 participants in 24 worksites (during the course of the intervention two worksites dropped out, one intervention and one control) w i t h a response rate of 77%. 974 participants (518 i n control worksites and 456 i n intervention worksites) completed both the baseline and follow-up surveys forming the embedded cohort used in this analysis. 2.4 D a t a a n d analysis The goals of the intervention were to: (1) increase fruit and vegetable intake, (2) decrease red meat consumption, (3) increase physical activity levels, and (4) increase daily multivitamin usage. The following variables assess the individual risk factors measured on a continuous scale: number of servings of fruit and vegetables per day, number of servings of red meat consumed per week (RM), and hours of moderate or vigorous physical activity per week (PA). The fourth measure is a binary variable indicating use of a multi-vitamin on 6 or 7 days per week (MV). I n order to keep all variables on an equivalent time scale, we created a new variable for fruit and vegetable consumption that calculated the amount of fruits and vegetables consumed in one week (FV) by multiplying the current measure of fruit and vegetable intake by seven. The continuous variables (FV, R M , PA) were standardized using the formula in Equation 2.1;

where V are the original values for the continuous variables (FV, R M , PA), Pos and P95 are the fifth and ninety-fifth percentile values respectively for a given variable and STV are the new standardized variables (STFV, STRM, and STPA respectively). Standardization was i m plemented for consistency (to make a one unit change in one variable similar to a one unit


122

change in another) and interpretability. The 5

t/l

and 9 5

th

percentiles were used to minimize

the influence of outliers. For the purposes of identifying an optimal linear combination that would show an intervention effect we restricted our sample to only those subjects who received the intervention, responded to both the baseline and follow-up surveys, and have complete data for the four risk behaviors. As opposed to the usual situation of observing how the covariate vector or a linear combination of the covariate vector will change because of treatment, the idea here is to determine how the covariate vector or the linear combination will predict the intervention status. This is similar i n spirit to a matched case-control analysis. A popular method for the analysis of longitudinal data with a dichotomous outcome is a mixed effects logistic regression model. A mixed effects logistic regression model w i t h a logit link will have the form: (2.2)

= a + /3'X .

log

i

ij

Here Y y , i — 1,. . . , n , j = 1,2, denotes the indicator of intervention time (i.e. pre-intervention Yn = 0 and post-intervention Y*2 = 1), Xy is the covariate vector, and o is a random cluster effect.

The subscript i is an indicator for individual and the subscript j is an indicator for

time. Each individual subject i is a cluster of two sets of observations, pre-intervention and post-intervention. The random effect variable aÂť can be thought of as measuring an individual's demographic characteristics (i.e., age, gender, race). I n our analysis, we want to control for an individual's specific demographic characteristics, therefore, we treat the random effect variable a,i as a nuisance parameter and condition i t out of the model. We can condition them out by using the conditional likelihood based on the fact that Yn +

= 1. We are left with a

conditional logistic regression model. These types of models are often used to analyze matched case-control studies, where the outcome of interest is whether a subject is a case or control. I n this framework we intend to model

Iogit(JMYy = I K ) ) =

(2.3)

where an optimal linear combination, or the best score, will be fi'X. We set up our data as i f i t came from a 1:1 matched case-control study; each individual is a cluster of two observations, one "case" and one "control". One observation is pre-intervention ("control"/baseline) and the second observation is post-intervention ("case"/follow-up).

At

each time point (pre and post-intervention) each subject has a vector (containing STFV, STRM, STPA, and M V ) of covariates.


123

For matched case-control studies with one case per matched set, the likelihood function for the conditional logistic regression reduces to the partial likelihood of the Cox model for the continuous time scale (Hosmer and Lemeshow 1998). We created dummy survival times so that all cases have the same event time and the corresponding controls are censored at a later time. We used Proc PHREG in SAS to fit the conditional logistic regression model by forming a 1

stratum for each matched set (individual id number). This allowed us to obtain estimates for P. 3. Results Using the combined Health Center and Small Business data from the Healthy Directions baseline and follow-up surveys on the 1,209 study participants that received the intervention, we found an optimal score function for the four risk factors: score = 1.05 * STFV

+ 1.70 * MV + 0.25 * STPA

- 1.35 * STRM.

(3.1)

The score is a summary measure of the health behaviors of a subject based on these four factors. From this score, we can see that increasing the number of fruits and vegetables consumed per week, taking a multivitamin six or more days a week, increasing the amount of physical activity done i n a week, and/or decreasing the amount of red meat consumed i n a week will increase the score for a subject which in turn means an overall improvement i n health behaviors. The dynamics of the score are consistent with the goals of the intervention. A participant can increase their health behavior score by changing one risk factor, or combinations of the four risk factors in a manner consistent with the goals of the intervention. We believe that these factors not only have individual effects, but that some factors may also have compounding effects. This belief is based on previous evidence of the interrelationships seen in moclifying behavioral risk factors (see e.g., Emmons et al, 2004; Butterfield et al, 2004). Therefore, we looked for significant interactions between the four variables. Table ?? shows the analysis of maximum likelihood estimates for our final model. I n our final score function (see Equation 3.2), we multiply the effects (parameter estimates) by 100 to increase the range of the scores as well as to simplify interpretation.


124

Table 1: Analysis of Maximum Likelihood Estimates

Parameter Estimate

Standard Error

P-Value

STFV

0.576

0.303

0.0570

MV

2.008

0.2078

<.0001

STPA

0.232

0.193

0.2294

STRM

-1.515

0.343

<.0001

STFV*STEM

1.229

0.565

0.0296

MV*STRM

-0.707

0.343

0.0392

Standardized Variable

score

=

57.6 * STFV

+ 200.8 * MV + 23.2 * STPA

+ 122.9 * STFV

* STRM

- 151.5 *

- 70.7 * MV * STRM

STRM (3.2)

There was a significant interaction between the amount of fruits and vegetables consumed per week and the amount of red meat consumed per week, sugessting that changing both b e haviors simultaneously is better than changing either behavior alone, but the effect of changing both behaviors is not equal to the sum of the individual changes on the M R F score. There was also a significant interaction between multivitamin usage more than six times a week and the amount of red meat consumed per week, suggesting that changing either behavior alone is good, but changing both behaviors simultaneously will result i n an even larger increase on the MRF score.


125 Table 2: Examples of changes in individual risk factor measures and resulting MRP score

Baseline values

FV

MV

PA

RM

M R F Score

20

0

4

5

-30.23

35

1

10

1

247.46

+15

+1

+6

-4

+277.69

35

0

4

5

17.39

+15

0

0

0

+47.62

20

1

4

5

135.22

0

+1

0

0

+165.45

20

0

10

5

-19.09

0

0

+6

0

+11.14

20

0

4

1

14.64

0

0

0

-4

+44.87

35

0

4

1

72.82

+15

0

0

-4

+103.05

Case 1: Optimal values at final Final values change Case 2: Improves only FV Final values change Case 3: Improves only MV Final values change Case 4- Improves only PA Final values change Case 5: Improves Only RM Final values change Case 6: Improves FV and RM Final values change

Table ?? displays a few examples of how a change i n an individual risk factor from the baseline case to the optimal case will change the score. I f we consider the first row of Table ?? to be a baseline value in which a subject consumes 20 servings of fruits and vegetables per week, does not take a multivitamin six or more days a week, has four hours of physical activity per week, and consumes five servings of red meat per week (the average values for study subjects at baseline, meeting only the recommend level of physical activity), the standardized values would be 0.32,0,0.32, and 0.5 respectively. Therefore the score for a subject at baseline would be

score = 57.6*0.32+200.8*0+23.3*0.32-151.5*0.5+122.9*0.32*0.5-70.7*0*0.5= -30.2. (3.3)

We can consider an arbitrary optimal case as a subject who consumes 35 servings of fruits


126

and vegetables per week (or five a day), takes a multivitamin 6 or more days a week, engages in 10 hours of physical activity per week, and eats one serving of red meat per week (meeting and/or exceeding all of the recommended levels). Table ?? shows the effects of these changes on the score from the baseline case to the optimal case for each variable alone and the effects of combinations of two and three variables. Figure ?? compares our final model (MRF, Equation 3.2) with a main effects model (a model without interactions) showing that the main effects model can both overestimate and underestimate scores predicted from the M R F model due to the absence of the two significant interactions.

Table 3: Score changes with one, two, and three variable changes

Variables Changed

Score Change

FV

47.62

MV

165.45

PA

11.14

RM

44.87

FV + M V

213.07

F V + PA

58.76

FV + R M

72.82

M V + PA

176.59

MV + RM

238.60

PA + R M

56.00

F V + M V + PA

224.21

FV + M V + RM

266.55

F V + PA + R M

83.96

M V + PA + R M

249.73

Although we used only those subjects that received the intervention to develop the score, the score is generalizable to the entire study population. I t was created, and is most useful for, the purpose of comparing the subjects that received the intervention to those that received usual care, because i t provides a summary measure of the health behaviors of a subject on all intervention risk factors pre and post-intervention. There were 1,297 subjects that received usual care and took both the baseline and follow-up surveys. These subjects can be considered controls for the effect of the intervention. Figure ?? shows box plots of score comparing baseline and follow-up for subjects that received the intervention compared to those that received usual care. I n the intervention group, the mean score at baseline was 48.1, while the mean score


127

at follow up was 104.3. I n the usual care group the mean score at baseline was 40.4, and the mean score at follow-up was 53.2. The mean change in score for the usual care group was 12.8, while the mean change i n score for the intervention group was 56.2. There was a statistically significant difference in the mean change in score from baseline to follow-up when comparing the usual care group to the intervention group (p<0.001). The intervention group showed greater improvements i n score at follow-up proving the intervention quite successful. 4. Discussion Increasing attention has been paid to multiple risk factor interventions, across a range of disease outcomes, both because adverse behavioral risk factors tend to cluster within i n dividuals and because of recognition of the utility of facilitating change across multiple risk behaviors. However, most M R F studies to date have used individual risk factor methods to analyze intervention effects (see e.g., Prochaska and Sallis (2004); Campbell et al, 2004). As shown i n Figure ??, the main effects model both over-estimates (e.g., F V & PA & RM) and under-estimates (e.g., M V & PA & RM) the scores predicted from the M R F model, depending on the combination of variables and the degree of change for a given participant in the intervention. Thus, such analytic models may compromise determinations of the efficacy of a M R F intervention. We were successful in modeling a linear combination of behavioral risk factors including interactions between risk factors, an effort that represents an advance over the existing methods for analyzing M R F intervention efficacy. To illustrate, note that in our final model there are two interaction terms. One between the amount of fruits and vegetables consumed per week and the amount of red meat consumed per week, and another between multivitamin usage more than six times a week and the amount of red meat consumed per week. Looking at Table ??, we can see that w i t h all the other variables held constant, a change in fruit and vegetable consumption alone from 20 to 35 servings per week will increase the score by 47.62, and a decrease in red meat alone from 5 to 1 servings per week will increase the score by 44.87. However, because of the interaction term, if both variables are changed by the amounts indicated the score would increase by 72.82, which because of the interaction is a smaller than 92.49, the sum of the individual changes. Similarly, if a subject begins to take a multivitamin daily the score will increase by 165.45, and i f they decrease red meat from 5 to 1 serving per week the score will increase by 44.87. However, if a participant begins to take a multivitamin daily and decreases red meat consumption by 4 servings per week the score will increase by 238.60, a larger increase than 210.32 that you would get by adding 165.45 from taking a multivitamin daily and 44.87 by decreasing red meat consumption. Cluster effects are not captured by main effects models and axe an advantage of this method.


128

There are some limitations to the method proposed here, namely that the score function depends on the efficacy of the intervention to determine variable weighting. For example, if the intervention was most effective at increasing multivitamin use, the weight (coefficient) for the multivitamin use variable would be largest in magnitude, whereas if the intervention was least effective i n changing the participants' physical activity patterns, the weight (coefficient) for the physical activity variable would be the smallest in magnitude. I n some cases then, the weights may be a proxy for the amount of participant effort necessary to change the health behavior. For example, i n this study we saw that multivitamin usage had the largest weight and thus the most influence on the score. There are at least two potential explanations for this finding. First, the promotion of multivitamin usage may require less participant burden when compared to the other health behaviors (e.g., physical activity).

Thus, i t may be easier for participants to modify their

multivitamin use; this supposition appears to be supported by the finding of an almost thirty percent increase from baseline to follow-up of the number of subjects taking a multivitamin daily. However, i t is important not to undermine the significance of a change in multivitamin usage which is strongly related to the prevention of disease outcomes. Sustained use of multivitamins containing folic acid have been associated with the reduction i n risks for numerous conditions including colorectal cancer and cardiovascular disease (Ggiovannucci et al, (2002); Fairfield and Fletcher, 2002). Physical activity on the other hand, is among the most challenging health behaviors addressed i n the study to intervene upon. I n this population, 66 percent of the subjects were getting the recommended level of physical activity at baseline, and 69 percent at follow-up. Of those subjects that were not at or above the target level of physical activity at baseline, almost 9.5 percent were at or above the target level at follow-up. Another factor to consider is that multivitamin usage was treated as a binary variable in our models. That is, many potential changes are captured in the categorization of either taking a multivitamin 6 or more times a week or not doing so. Relative to increasing one serving of fruits and vegetables a week, decreasing one serving of red meat in a week, or increasing an hour of physical activity a week, this is a substantial change. Although the purpose of our method was to develop a health behavior score (composite variable), there are some limitations to using this type of variable. The purpose of such a variable is to allow for easy comparisons of the four factors with one number. When there are changes in the score, however, a composite variable does not provide any insight into which individual risk factor (s) have contributed to the change. Another potential limitation of applying this method to the HCPPP data is the merging of the two cohorts, small businesses and health centers. Our method develops a score function


129

that is independent of the population but not independent of the intervention. By combining the two data sets, we have made the assumption that the interventions given to these two populations are the same. I n reality, although the two interventions were quite similar, they were not identical. We decided, however, to combine the two cohorts i n order to increase power, and to create a universal score that could be applied to both cohorts. This not only allowed us to make comparisons within a cohort, but between cohorts. Taking these Umitations into account, our methodology remains preferable compared to existing techniques that do not accord weights to the risk factors or adjust for cluster effects. I n summary, we have developed a score that effectively integrates multiple behavioral cancer risk factors into one measure, irrespective of individual demographic factors. We believe that the methods are generalizable to other working class multi-ethnic populations, and future research should be done to evaluate the effectiveness of these methods in other groups. The p r i mary strength of the methodology used to develop the score is that i t can be easily implemented to develop scores for other populations, for other combinations of behavioral risk factors, or for other disease outcomes (e.g., cardiovascular disease). Given the increasing attention being paid to the development of M R F interventions, we believe the described method to be the preferred means of analysis in comparison to previously used strategies. Ultimately, we believe that analytic focus on examining clusters of behavioral risk factors will enhance the design of multiple risk factor intervention approaches.

Figure 1 about here

Figure 2 about here

Acknowledgements The research of Melody Goodman was supported by National Institute of Child Health and Human Development grant 5 F31 HD043695. The research of Dr. L i was supported by National Institute of Health grant R01CA95747. The research of Dr. Bennett, Dr. Stoddard, and Dr. Emmons was supported by grant 5 P01 CA75308 from the National Institutes of Health, and support to the Dana-Farber Cancer Institute by Liberty Mutual, National Grid, and the Patterson Fellowship Fund. The statistical output for this paper was generated using SAS/STAT software, Version 8 of the SAS System for Windows. Copyright速 1999-2001 SAS Institute Inc. SAS and all other


130

SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc., Cary, NC, USA. References

American Cancer Society (2004).

Cancer Facts and Figures. Technical Report, American

Cancer Society. Anonymous (1996).

Harvard Report on Cancer prevention Volume: 1 Causes of Human

Cancer, Cancer Causes and Control 7, S3-S9. Barbeau, E. M . , Wallace, L., Lederman, R., Lightman, N . , Stoddard, A. and Sorensen, G. (2004). Recruiting small manufacturing worksites that employ multi-ethnic, low-wage workers to a cancer prevention research trial. Preventing Chronic Disease 1 1-9. Butterfield, R. M . , Park, E. R., Puleo, E., Mertens, A., Gritz, E. R., L i , F. P., and Emmons, K. (2004). Multiple risk behaviors among smokers i n the childhood cancer survivors cohort. Psychooncology 13, 619-629. Campbell, M . K., James, A., Hudson, M . A., Carr, C , Jackson, E., Oakes, V . , Demissie, S., Farrell, D. and Tessaro, I . (2004). Improving multiple behaviors for colorectal cancer prevention among african american church members, Health Psychol 23, 492-502. Colditz, G. A., Cannuscio, C , and Frazier, A. (1997). Physical activity and reduced risk of colon cancer: Implications for prevention. Cancer Causes and Control 8, 649-667. Doll, R. and R. Peto (1981). The causes of cancer : quantitative estimates of avoidable risks of cancer in the United States today, J. Natl. Cancer Inst. 66, 1191-1308. Emmons, K. M . , Marcus, B. H., Linnan, L . A., Rossi, J . S. and Abrams, D. B. (1999) Mechanisms in multiple risk factor interventions: Smoking, physical activity, and dietary fat intake among manufacturing workers. Preventive Medicine 23, 481-489. Emmons, K . M . , Stoddard, A. M . , Gutheil, C , Suarez, E. C , Lobb, R. and Fletcher, R. (2003).

Cancer prevention for working class, multi-ethnic populations through health

centers: The healthy directions study. Cancer Causes and Control 14, 727-737. Fairfield, K. M and Fletcher, R. H. (2002). Vitamins for chronic disease prevention in adults: scientific review. Journal of the American Medical Association 287, 3116-3126. Friedenreich, C M . , and Rohan, T. E. (1995). Physical activity and risk of breast cancer. European Journal of Cancer Prevention

4, 145-151.

Giovannucci, E., Stampfer, M . J . , Colditz, G., Hunter, D., Fuchs , C , Rosner, B., Speizer, F. and Willett, W . (1998). Multivitamin use, folate, and colon cancer i n women i n the Nurse's Health Study. Annals of Internal Medicine 129, 517-524.


131

Hosmer, D. W., and Lemeshow, S. (1998). Encyclopeida of Biostatistics,

2327-2333. John

Wiley. Hunt, M . K., Stoddard, A., Barbeau, E. M . , Wallace, L. and Sorensen, G. (2003). Cancer prevention for working class, multiethnic populations through small businesses: The Healthy Directions Study. Cancer Causes & Control 14, 749-760. Institute of Medicine (2000). Promoting Health: Intervention Strategies from Social and Behavioral Research. National Academy Press. Michaud, D. S., Augustsson, K., Rimm, E. B., Stampfer, M . J . , Willett, W. C. and Giovannucci, E. (2001). A prospective study on intake of animal products and risk of prostate cancer. Cancer Causes & Control 12, 557-567. National Cancer Policy Board and Institute of Medicine (2003). Fulfilling the potential of cancer prevention and early detection, Technical Report, Washington D. C. Prochaska, J . J . and Sallis, J.F. (2004). A randomized controlled trial of single versus multiple health behavior change: promoting physical activity and nutrition among adolescents. Health Psychology 23, 314^318. Sandhu, M . S. and White, I . R. and McPherson, K. (2001). Systematic review of the prospective cohort studies on meat consumption and colorectal cancer risk: A meta-analytical approach. Cancer Epidemiology, Biomarkers & Prevention 10, 439-446. Vainio, H . and Bianchini, F. (2002).

IARC

Handbooks of Cancer Prevention.

Weight Control and Physical Activity. IARC Press.

Volume 6:


132

Reducing Subjectivity in the Likelihood

Abstract

Some scientists prefer to exercise substantial judgment in formulating

a likelihood function for their data. Others prefer to t r y to get the data to tell them which likelihood is most appropriate.

We suggest here that one way to

reduce the judgment component of the likelihood function is to adopt a mixture of potential likelihoods and let the data determine the weights on each likelihood. We distinguish several different types of subjectivity in the likelihood function and show with examples how these subjective elements may be given more equitable treatment.

Key words: Mixture likelihood, model averaging, subjectivity.

1. I n t r o d u c t i o n We propose methods for modeling the likelihood function that will require fewer subjective judgments. We first discuss the nature of the problem of subjectivity i n the likelihood function; then we review some related research; and finally, we define a mixture likelihood function and suggest estimation procedures that reduce the effects of subjective views imposed on the observed data. 1.1 S t a t e m e n t o f t h e p r o b l e m I t is sometimes desirable that beliefs of experimenters should be brought into a scientific analysis in ways that minimally distort the measured data (see, for example, Hogarth, 1980; Kyberg and Smokier, 1980; Lad, 1996). But that having been said, scientists observing data sometimes interpret the data points subjectively, according to what they want the data to show, and according to how precisely they believe the data points were measured. The latter procedure is of course quite common. This subjective interpretation of observed data may be totally at the unconscious level, or i t may be purposeful (with the purposeful interpretation, the analysis may become fraudulent; see for example, Grayson, 1995, 1997; Howson and Urbach, 1990; and Press and Tanur, 2001). The subjective interpretation of empirical data in medicine was discussed by Kaptchuk (2003). He stated (page 1, op.

tit):


133

Doctors are being encouraged to improve their critical appraisal skills to make better use of medical research. But when using these skills, i t is important to remember that interpretation of data is inevitably subjective and can itself result in bias. Facts do not accumulate on the blank slates of researchers' minds, and data simply do not speak for themselves. Good science inevitably embodies a t e n sion between the empiricism of concrete data and the rationalism of deeply held convictions. Unbiased interpretation of data is as important as performing rigorous experiments. This evaluative process is never totally objective or completely independent of scientists' convictions or theoretical apparatus.

Statistical analysis of a data set most often proceeds by summarizing the distribution of the data in terms of its likelihood function. I n order to specify the form of the likelihood function, various assumptions are made about the data, such as mutual independence, identical distributions, unimodality, etc.

After the likelihood function has been specified, additional

assumptions are sometimes made (significance levels thought to be appropriate are specified, a prior distribution about the underlying unobservable quantities may be brought i n , etc.). Analysis of the data generally proceeds by trying to keep the Ukelihood function treatment of the data as simple as possible, so that the scientist or analyst will introduce minimal distortion of the data. The analyst tries not to discard data, and tries to maximize the chance of understanding what nature is trying to tell us through the revealed data about the underlying phenomenon. I n this way, when the analysis of the data has been completed, the claim can reasonably be made that the conclusions drawn from the analysis approximate, if not precisely reflect, the laws of nature, rather than the possible misinterpretations and misunderstaJidings of the laws of nature by human beings. I t will be useful to first briefly define what we mean by objectivity and subjectivity, in this context. According to Mandik (2001) \

The word objectivity refers to the view that the truth of a thing is independent from the observing subject. The notion of objectivity entails that certain things exist independently from the mind, or that they are at least in an external sphere. Objective truths are independent of human wishes and beliefs.

The notion of

objectivity is especially relevant to the status of our various ideas, and the question is to what extent objectivity is possible for thought, and to what extent i t is necessary. 1

Mandik, P. (2001).

The Internet

Encyclopedia

http://www.utm.edU/reseaxch/iep/o/objectiv.htm.

of Philosophy.

See


134

This is but one of many definitions that have been suggested. The elusive quest for objectivity i n science has been, and remains, an important topic of discussion among historians and philosophers of science (for extensive additional discussions of the meaning of "objectivity", see for example, Bower, 1998; Porter, 1995, 1996; and Daston and Galison 1992). For some, scientific objectivity involves the search for certainty in knowledge about one of nature's wellkept secrets, independent of what human beings believe; but in many cases, we find that what we earlier thought to be true about nature, turns out later to be questionable. I n an interesting example from physics, Folger, 2003, pointed out that:

Pioneer 10, launched in 1972, is now some 8 billion miles from home. But is has been slowing down, as if the gravitational pull on i t from the sun is growing progressively stronger the farther away i t gets. Milgrom proposed (see the M O N D pages-MOdified Newtonian Dynamics)

2

that Newton's laws might change at these

accelerations. I f Milgrom is right, Newton's and Einstein's laws will be i n for some major tweaking.

Sometimes the scientist has such deep understanding and insight into the phenomenon he/she is studying that the scientist's own predictions of what should be found from the analysis are far superior to what the data analysis seems to indicate. I n some cases the beliefs of the scientist or analyst are so strong, even before actually taking any data that bear on the phenomenon, that the data are interpreted or manipulated so that they will reflect these preconceived views of the scientist. Any preconceived personal views (views held before taking any data), weak or strong, are what we refer to in this context as subjectivity. 1.2 R e l a t e d Research One approach to reducing the effects of differing assumptions about likelihoods may be found i n a line of research that involves use of the empirical likelihood function.

I n this a p -

proach, most useful in large samples, a discretized, binned, version of the empirical cdf, instead of a specific likelihood function, is used. Inference is then made from a multinomial distribution. A n unfortunate feature of this approach is the additional unknown parameters that are concomitantly introduced into the model. See: Owen, 1988, 2001. For typically small and moderate size samples this could be a problem, but for the massive data sets typical of data mining applications (see, for example: Berry and Linoff (1997); and Hastie, Tibshirani, and Friedman, 2001) such an approach could be a helpful alternative. 2

M O N D pages — h t t p : / / w w w . a s t r o . u m d . e d u / s s m / m o n d /


135

We show in the next section how we might understand and account for some types of subjectivity that sometimes enters the likelihood function, and might not be desired. We will use the definition and form of the likelihood function in which for absolutely continuous random variables, up to a proportionality constant, i t is the joint probability density function of the observables given the unobservables. 2. T y p e s of Subjectivity in the Likelihood Function We distinguish three of the types of likelihood subjectivity problems that may occur:

(a) how to determine the distributional form of the likelihood function in a way that is largely objective, but permits the data themselves to guide the modeling as to whether the data are Normally-distributed, or Gamma-distributed, or possibly follow some other convenient d i s t r i bution. We call this problem, "distributional

subjectivity";

(b) how to treat observed data that have possibly been weighted subjectively so that some data points are valued more heavily than others, and some are even ignored; we call this problem, "weighted-data

(c)

subjectivity;

how to account for the nature of the experiment used to obtain the data that may have

favored one type of response over another; we call this problem, "experiment

subjectivity".

We treat each of these types of subjectivity i n Section 3. 3. Reducing Likelihood Subjectivity 3.1 T h e mixture likelihood We use a convex mixture of various likelihoods for the data; the usual likelihood function results as a special case. Suppose an experiment is repeated n times with the resulting one-dimensional data o u t comes:

X\,X2,

• •. ,x . n

We suppose that there are

J

models for the data that potentially we

might reasonably entertain. For simplicity, merely to suggest a general type of approach, we consider problems involving only one unknown parameter, namely, the means of the J d i s t r i butions, U).


136

I n some situations, the parameters may be quite different from one another but they can generally be related functionally. For example, the case of distinguishing between the means of normal and log-normal distributions, where the mean parameter has different meanings i n the two cases is sometimes particularly interesting. I n such cases, functional relationships among the parameters are required. Suppose, in the one-parameter problem, we can assume these data to be mutually independent and identically distributed, and we agree to adopt the likelihood function for Model tj(x\,...

, x \ rrij,iv) = n

ij(x\mj,u>).

Define a "mixture likelihood function", LM(XI,

• • •»x I w) = L (x n

M

| w),

such that: L (x\u) M

= E { likelihood } = E deiV(x)\u]\ Mo

j = ] T £ j ( x \u)P(m \u>) 5

(3.1)

i=i

where ij(x\mj u) y

denotes the usual likelihood function of the data under model m^, £(x\w)

denotes a model-independent likelihood function, and P(mj\u)

denotes the prior probability

of model rrij. The mixture likelihood function is of course a likelihood function itself. I f there were only one model ( J = 1), LM reduces to the ordinary likelihood. The mixture likelihood function explicitly assumes that we should combine different models in a linear way.

Other

possibilities exist of course, and perhaps in certain cases, they are even more desirable. But because for a wide variety of cases, the linear assumption seems appropriate, we will retain this assumption throughout. We next address the issue of how to reduce model subjectivity (how to choose the weights). 3.2 Reducing "model subjectivity" I n some instances, the scientist has very strong, theory-based, beliefs about how the data were generated, and how the corresponding likelihood function should behave. I n such instances, especially in small samples, the analyst should surely use that information to permit the desired likelihood function to emerge. I n other situations where the scientist/analyst wants the data to speak as loudly as possible relative to the scientist's pre-conceived beliefs, there is no unique way to accomplish this objective. The approach suggested here is to take equal weights in the mixture. Accordingly, take all P(rrij\u) in eqn. (3.1) to be equal (discrete uniform distribution). This interpretation of equal treatment for the different models is:


137

(1) i n keeping with the approach frequently used for weighting in mixture models to express indifference or ignorance among the various components in the mixture;

(2)

i t is the procedure suggested by Laplace when he adopted his Principle of Insufficient

Reason (Laplace, 1812, 1814);

(3) i t is consistent with a basic result of information theory that the distribution that corresponds to maximum entropy, or minimum information, is the uniform distribution.

This gives the mixture likelihood function (equally-weighted average likelihood): 1 LM{X\UJ)

3

= j5^j(£|mj,w).

(3.2)

For example, suppose there are just two potential models ( J = 2) that might reasonably represent the data: N(u), 1) and a Student ^-distribution centered at u>, with 3 degrees of freedom (a fat-tail distribution that has a population mean).

Then, the mixture likelihood

function becomes: r

/ , N

1 fA

1

r 1/

x

2

i

TT

m / /5(l/2,m/2) m

2

1

/ 0

Clearly each term in equation (3.3) is non-negative and integrates to one (with respect to x ) , so

LM{X\UJ}

is a bone fide likelihood function for the data (as would be the case whichever

models we choose). I n some situations, one scientist might favor the normal distribution for representing the distribution of the data, while another might favor the Student t-distribution. By using

LM{X\UJ}

to represent the likelihood function for all inferences, the analyst reduces the

model subjectivity in the description of the data distribution. Maximum likelihood estimation of u is now more complicated numerically than i t would be with use of either the normal or the Student t distributions separately, but the numerical problem is straightforward (see numerical example below) and easily generalizes to more than two possible ordinary likelihoods. We next numerically illustrate the example suggested in this section of how to reduce model subjectivity when the models under consideration are the N(u, 1) and the Student £3 centered at 10. We randomly generated a total of 20 observations, 10 observations from £3, a Student £-distribution with 3 degrees of freedom centered at x = 10, and 10 observations from iV(10,1). The resulting data are shown in columns 2 and 3 of Table l a . Then, using the Newton-Raphson method, we calculated the mixed M L E . I t is given at the bottom of Column 2


138

as: u> = 9.9168. To illustrate variability, there are four replications of this entire process shown in Table l a ; the four resulting mixed maximum likelihood estimates (mixed MLE's) are also shown i n Table l a .

Table l a : Four replications of model subjectivity

t

normal

t

normal

t

normal

t

normal

1

11.1861

9.6734

8.1266

11.182

8.9931

8.331

11.476

9.8325

2

9.9749

11.542

11.092

10.175

10.641

10.131

10.922

11.051

3

8.5632

10.259

11.374

11.720

9.8717

7.8108

10.270

10.642

4

5.5471

9.4442

9.3422

10.757

8.8824

8.3177

8.3906

9.0293

5

9.5188

10.779

13.189

9.8871

9.7579

9.4354

11.899

8.8359

6

10.994

9.3448

9.6007

9.715

10.385

10.092

9.5234

10.566

7

9.1875

9.9779

9.9069

9.7106

13.659

9.4326

14.559

9.495

8

11.283

9.2274

8.3785

9.8394

9.5543

10.361

10.177

10.247

9

8.7574

10.724

10.073

11.637

9.2285

9.0399

10.155

9.0938

10

7.9804

11.263

10.379

9.4837

11.274

9.7291

9.2795

10.366

Mixed M L E

9.9168

10.240

9.6237

10.116

For comparison purposes, we also computed the separate ordinary MLE's assuming all 20 observations were generated from a normal, and then, that all 20 observations were generated from a ÂŁ3 distribution. Results are given i n Table l b .

Table l b : Separate MLE's For normal and Student data

Normal M L E

9.761

10.278

9.7463

10.291

ÂŁ -MLE

9.924

10.187

9.6104

10.111

3

Thus, i t may be seen that in the first instance, while the mixed M L E is 9.9168, the M L E assuming all 20 observations came from a normal is 9.7614, whereas the M L E assuming all 20 observations came from a t is 9.9240. Results for the other 3 cases are shown in Tables l a and 3

l b as well. Depending upon the assumptions made for the modeling, results for the mixture M L E obtained from the model averaging may differ substantially from those of the separate models, or not.


139

3.3 Reducing "weighted-data subjectivity" We examine two distinct cases of weighted data subjectivity and model the two cases separately below.

Case 1 —

Several Observers (Scientists) Rate theSame Data Points Differently

I n this case, different observers (scientists) might interpret the same points differently. Some observers might view certain points as mistakes (outliers that were generated from different distributions from the other points), and therefore delete them from the analysis; and others might, according to their own beliefs, weight certain points more heavily than others (perhaps difficult-to-measure points might be weighted less heavily because the error associated with the measurement might be greater than with most of the other points; perhaps certain points obtained were measured under censored conditions; etc.). For simplicity, assume the data points are mutually independent. We define the Ukelihood function for Observer Ok as: % where: pk(SjkXj\Ok) Pk{SjkXj\Ok)

I « ) = jjV&kXj j=i

| OM k

Pk{5ikxAOk

\

(3-4)

= 1> i f Observer Ok includes the data point Xj i n the analysis, and

= 0 if not; Sjk denotes the weight that Observer k places on observation Xj, f(xj\w)

denotes the pdf (probability density function) of Xj, conditional on u. The mixure likelihood function may be defined as: LM(X\V)

= =

where Pkipk)

^{likelihood} = Edata{h(x\v)} K ]>>(x|u;)P (O ), &=i fc

fc

(3.5)

denotes the prior probability that the data analyst places on the model that has

been developed by Observer k. To be objective (or indifferent among the choices), in the sense we have been discussing, we take Pk{Ok) = l/K, for all k. Then, L M ( X \ U ) - ^£ (x\u) k

(3.6)

As a simple example, suppose that all K observers adopt the same distribution for the data, say, N(u,l)

(in Section 3.2 the analyst adopted two different possible distributions for

the data), and assume that they weight the points in the same way, so that Sjk = 1 for all fc,


140

for all points they include i n their analyses, but they may include different points. Then, since the n observations are independent,

Pk(xj\Ok)

(3.7)

To be specific, suppose that n = 102, and that there are two observers, 0\ and

0. 2

Suppose further that 0\ believes ÂŁ102 is an outlier, and 0

believes that both rcioi and ÂŁ102

are outliers, but they agree that the first 100 points (x\,...

,Xioo) should be included i n their

2

analyses. Then, PifellOi)

=

1

for j = 1,2,..., 101,

=

0,

=

1

=

0,

for j = 102,

also, Pi(x \\0 ) j

2

for j = 1,2,..., 100, for j = 101,102,

Then, / 1 \ (^=J

ti(x\u)

= h=

e (x\u)

/ 1 = e =\^=j

l exp{-iX>;-") }>

1 0 1

1 0 1

2

(3.8)

and 2

2

V

0

0

ex {-

100

(3.9)

P

Then, ^ 101

1 2

(3.10)

We may now estimate u by maximizing LM{X\UJ)

with respect to v. Note first that i f we

let m , n2 be the numbers of data points used in the respective analyses of Observers 0\ and O 2 , they are also the numbers of terms i n the two summations, and in this example, n\ = 101 and 7i2 = 100. We may readily find by ordinary differentiation, the mixture maximum likelihood estimator (mixture M L E ) to be: w = a(u)xi

+ [1 - a(u)]x , 2

0 < a(u) < 1,

(3.11)


8ÂŁAm:

wmmmx

141

Table 2a: Four replications of weighted-data subjectivity

Observation

tf(io,i)

JV(10,1)

JV(10,1)

1

8.3959

7.6748

8.1260

7.7977

2

8.4063

7.8796

8.5249

8.8122

3

8.559

7.9954

9.6225

8.9922

4

8.7975

8.7684

9.6490

9.0079

5

9.3082

8.9002

9.7041

9.0501

6

9.6001

8.9819

9.7444

9.1783

7

9.8433

9.2957

9.7660

9.2580

8

9.9802

9.3553

10.0400

9.3645

9

10.2570

9.3687

10.1180

9.4404

10

10.5710

9.5069

10.3150

9.7344

11

10.6690

9.6790

10.4280

9.8685

12

10.6900

9.8179

10.5690

10.0880

13

10.7120

9.8868

10.5780

10.2120

14

10.7140

10.0860

10.6230

10.2380

15

10.8160

10.3790

10.6770

10.3900

16

10.8580

10.4620

10.7310

10.4440

17 18

11.1910

10.5510

10.7990

10.5690

11.2540

10.9440

10.8960

10.7810

19

12.0000

12.0000

12.0000

12.0000

20

13.0000

13.0000

13.0000

13.0000

where: a ( w )

- n ^ M+n ^ M

101

101

( 3

-

1 2 )

100

(3.13)

That is, we find the interesting result that (tb\ÂŁ/2) is a weighted average (actually a convex combination) of the separate MLE's that the two observers might adopt separately, and the weights are their respective proportions of their ordinary likelihoods, an intuitively sensible result. But note that because a(u) depends upon u>, equations.(3.11) and (3.12) must be jointly solved numerically for u>.


142

While i n large samples, the (continuous) data will generally ultimately swamp any prior distribution weights placed on the data points (see Le Cam, 1956), i n small or moderate size samples, certain very influential points that may have been deleted from an analysis can have substantial effects on the interpretation of the experiment outcomes. We next illustrate this example numerically. We randomly generated 18 points from iV(0,1). We then ordered the points, and added 2 larger outliers. We assumed the first observer dropped the largest point as an outlier, and the second observer dropped the two largest points as outliers. We then calculated the mixture M L E numerically from equation. (3.11) using the Newton-Raphson method. We replicated the procedure four times to examine variation. Data are shown i n Table 2a. Calculations of MLE's for the data i n Table 2a are given i n Table 2b:

Table 2b: MLE's for data with outliers

Mixture M L E

10.0406

9.4205

10.0568

9.6267

^18

10.0346

9.4185

10.0506

9.6237

^19

10.1380

9.5544

10.1532

9.7487

We see that for the data in column 2 of Table 2b, for example, the mixture M L E was 10.0406. Had the observers carried out separate MLE's, with Observer 1 dropping only the last observation, he would have found his M L E to be 10.1380, while Observer 2 who dropped both of the last 2 observations would have found her M L E to be 10.0346. While the differences are not large they are intended to be illustrative.

Case 2 —

One Observer (Scientist)Rates Each Data Point Differently

The second case of weighted-data subjectivity involves a single scientist weighting the importance of the data points differently from one another. Here we envision a single scientist who has carried out an experiment many times, but sometimes, for one reason or another, the scientist carried out the experiment with extremely small error, whereas on some other occasions, the scientist associated the experimental outcomes with considerably more error. Thus, which observed results had small associated error, and which had large associated error might differ from one replication of the experiment to the next.


143

In this context there is just one scientist who rates his/her experimental data differentially, according to how "well" the data point was measured, or what he/she thought should have occurred, or whatever. This is the more typical situation, compared w i t h the first case. The mixture likelihood function is obtained from equations (3.4) and (3.5), for K = 1, as: n LM{X\U)

=i (x\u)P {0 } 1

1

1

|Oi,o>)P

=

(5il|0l)

•

(3-14)

3=1

To follow the paradigm suggested here we should take 6ji = 1 for every j . Of course the individual scientist would often argue that he/she knows better than anyone else that certain points were really not as good as others, and should therefore be down-weighted. A now-classical example of this type of subjectivity of special historical interest has been documented w i t h real data. Dr.

I t involves the data collected by R. A. Millikan (1868-1953).

Millikan was an American physicist who successfully measured the charge on a single

electron, winning a Nobel Prize i n 1923 for this famous oil-drop experiment (as well as other prizes). Holton (1978) scrutinized Millikan's laboratory notebooks and found that Millikan had repeated his oil-drop experiment 39 times, obtaining outcomes: x i , . . . ,239 for the charge on the electron. Holton reported that Millikan had given each of his original sets of observations a personal quality-of-measurement rating: "best", 'Very good", "good", "fair", and no rating at all for discarded measurements (we interpret his weights to represent his prior probabilities for these measurements). The distribution of his rating results is summarized in the Table 3.

Table 3: Millikan's measurements

rating

effective

descriptions

raating

Sji = Weight

number of measurements

best

4

4/10

2

very good

3

3/10

7

good

2

2/10

10

fair

1

1/10

13

discard

no rating

7

For Millikan, pi(-) — 1, for 32 data points and pi(-) = 0 for the discarded 7 points. We order the measurements according to their effective ratings, from "best" to "fair", and form the weighted average. The estimated value of the charge on the electron is then given by the


144

weighted average: 4

2

ioI>

ÂŤ=

+

3 10

7=1

2

9

I>

1 9

1

102>io

+

7=3

10

3 2

5>"

7=20

Millikan formed the weighted average of his measurements and accordingly estimated the charge on the electron as 4.85 x 1 0 ~ average would have been 4.70 x 1 0 obtained by other researchers. electron, today, is 4.77 x 1 0 ~

10

- 1 0

esu (electrostatic units). The ordinary equally weighted esu. I n his reported value he also averaged in the values

By contrast, the accepted value for "e", the charge on the esu. But the impressive closeness of Millikan's values w i t h

10

today's accepted value is deceptive; i t occurred only because his values were based upon, "a faulty value for the viscosity of air, which when corrected, increases the discrepancy w i t h the modern value by over 40%" (Mathews, 1998). 3.4 Reducing "experiment subjectivity" Suppose there are two experiments that might be performed: E ("g" for "good"), and Eg g

( " ÂŁ " for "not good"). I n E the scientist knows that the experiment will contain one or more g

variables that might produce effects that will be confounded with the effect of fundamental interest. I n E , there are likely to be fewer such confounding variables, so the scientist believes g

that he/she is more likely to be able to distinguish the effect he/she is seeking. Concomitantly, i t may be that by carrying out E , the scientist is missing the important variables that suggest g

that the effect sought is really artifactual, and the seeming effect is explainable in other ways. Because the scientist is so convinced that the effect sought is real and not artifactual, he/she reasons that E is a "cleaner" and more promising experiment. The scientist might even argue, g

in a moment of enthusiastic zeal, that E is cheaper and/or less subject to error. g

I n both experiments, for simplicity of interpretation, we assume the data are normally distributed with variance equal to 1. Suppose that the scientist referred to above, call him/her Scientist A , would like to show that the population mean for the underlying phenomenon of interest is positive. I f Scientist A carries out E , i t is more likely that the sample mean x g

will be positive than if Scientist A carries out E wherein the sample mean y will imply the g

alternative hypothesis H : g

that the population mean is not positive. I f E

g

is performed the

scientist believes results are either unlikely to be supportive of the theory, or they are likely to be sufficiently marginal so that the theory will be in doubt. A priori, the experimenter adjudges the chances for concluding H : the population mean is positive, when p e r f o r m i n g ^ as greater g

than the chances for concluding that the population mean is positive when performing E . g

Consequently, Scientist A decides to perform E . g


145

Suppose some other scientist, say Scientist B, performs E , and subsequently observes y s

(using the same sample size, n ) . Let 9 denote an indexing parameter such that 9 = 1 i f the hypothesis H is true, and 9 = 0 if the hypothesis H is false. g

g

L { d a t a 19} = £{lokelihobd} = E M

= £(x | E , 0 ) P { £ } + *(y | g

e x p e r i m e n t

[£(data 19)]

0)P{i%}

f f

The mixture likelihood function becomes: LM{data 10} = P{E }^L 9

e x p { - | ( S - 9 ) } + P{E,}-^L

exp{-|(y -

2

0) }. 2

A n investigator cognizant of both experiments has both and available. I n the same spirit of a desire for equity of treatment in the likelihood function, the investigator takes P{E } g

P{E } g

=

= 0.5. Then, L M { X , y\9} = \ [ ^

e x p { - ^ ( x - 9?}

+

exp{-|te -

9?)

Define z = (x + y)/2. Then, combining terms shows that: L M { Z \ ° } = \ j= :

exp{-n/4}exp{-n(z

-

9) }. 2

Thus, the M L E for 9 is clearly: 9 = z = (x + y)/2. I f Scientist A were correct i n his/her a priori assessments of what was likely to happen i n the experiment, 9 is likely to be closer to zero than x (or even negative), a result that would tend to vitiate Scientist A's conclusions. For example, for Scientist A's experiment, E , we generated 100 observations from i V ( l , 1) g

and found x = 1.0598. Then, for Scientist B's experiment, E , we generated 100 observations g

from i V ( - l , l ) and found y = -.9531. So the generalized M L E , 0, is 0.053, a sample value just barely positive, which might not be convincing in many contexts for asserting that the population mean is really positive. 4. Conclusions We have been concerned with how to reduce the effects of a scientist's pre-conceived beliefs in the analysis of his/her supposedly objectively-observed data. We have found that we can reduce the effect of some of those subjective interpretations by using a mixture likelihood function, and then choosing the mixture weights that weigh the various interpretations of the data equally.


146

References

Berry, M . J . , and Linoff, G. (1997). Data Mining Techniques. John Wiley. Bower, B. (1998). Objective visions: Historians track the rise and times of scientific objectivity. Science News 154, 360-362. Daston, L . J . and Galison, P. (1992). The image of objectivity. Representations

40, 81-128.

Folger, T. (2003). Nailing down gravity: New ideas about the most mysterious power in the universe. Discover Magazine, Oct., 2003, 34-41. Grayson, L . (1995). Scientific Deception. The British Library. Grayson, L. (1997). Scientific Deception - An Update.: The British Library. Hastie, T., Tibshirani, R., and Friedman, J. (2001). The Elements of Statistical

Learning.

Springer-Verlag. Hogarth, R. (1980). Judgment and Choice. John Wiley. Holton, G. (1978). Sub-electrons, presuppositions, and the Millikan-Ehrenhafb dispute. I n The Scientific Imagination:

Case Studies (Edited by Gerald Holton), 25-83. The Cambridge

University Press. Howson, C. and Urbach, P. (1990). Scientific Reasoning:

The Bayesian Approach.

Open

Court Publishing Co. Kaptchuk, T. J . (2003). Effect of interpretive bias on research evidence. British

Medical

Journal 326, 1453-1455. Kyberg, H . E. Jr., and Smokier, H . E., Editors (1980). Studies in Subjective

Probability.

Robert E. Krieger Publishing Co. Lad, F. (1996). Operational Subjective Statistical Methods:

A Mathematical,

Philosophical,

and Historical Introduction. John Wiley. Laplace, P. S. (1812). Theorie Analytique des Probabilities.

3

Paris: Courcier.

Laplace, P. S. (1814). Essai Philosophique sur les Probabilities. 3

4

Paris.

T h e second, third, and fourth editions appeared in 1814, 1818, and 1820, respectively. I t is reprinted

in Oeuvres Completes de Laplace, Vol. V I I , 1847, Paris: Gauthier Villars. 4

T h i s book went through five editions (the fifth was in 1825) revised by Laplace. T h e s i x t h edition

appeared in English translation by Dover Publications, New Y o r k , i n 1951.

W h i l e this philosophical

essay appeared separately i n 1814, it also appeared as a preface to his earlier work, Theorie Analytique des Probabilities.


147

Le Cam, L. (1956). On the asymptotic theory of estimation and testing hypotheses. Third Berkeley

Symposium on Math.

Statist.

And Prob.

Proc.

1, 128-156. University of

California Press, p. 308. ****** Please check where the p.308 come from? *** Mathews, Robert A. J . (1998). Facts versus factions: The use and abuse of subjectivity in scientific research. Cambridge, England: The European Science and Environment Forum, Working Paper 2/98, September, 1998. Owen, A. (1988).

5

Empirical likelihood ratio confidence intervals for a single functional.

Biometrika 75, 237-249. Owen, A. (2001). Empirical Likelihood. Chapman and Hall. Porter, T . (1995). Trust in Numbers:

The Pursuit of Objectivity in Science and Public

Life.

Princeton University Press. Porter, T. (1996). Statistics, social science, and the culture of objectivity. Zeitschrift fur GeschichtsvAssenschaften

Oesterreichische

7, 177-191.

Press, S. J . , and Tanur, J. M . (2001). The Subjectivity of Scientists and the Bayesian John Wiley and Sons.

See http://www.esef.org., p.5.

Approach.


148

Application of One Sided t-tests and a Generalized Experiment Wise Error Rate to High-Density Oligonucleotide Microarray Experiments: A n Example Using Arabidopsis

Abstract.

Motivation: A formidable challenge i n the analysis of microarray

data is the identification of those genes that exhibit differential expression. The objectives of this research were to examine the utility of simple ANOYA, one sided t tests, natural log transformation, and a generalized experiment wise error rate methodology for analysis of such experiments. As a test case, we analyzed a Affymetrix GeneChip microarray experiment designed to test for the effect of a CHD3 chromatin remodeling factor, PICKLE, and an inhibitor of the plant hormone gibberellin (GA), on the expression of 8256 Arabidopsis thaliana genes. Results: The GFWER(fc) is defined as the probability of rejecting k or more true null hypothesis at a given p level. Computing probabilities by GFWER(fc) was shown to be simple to apply and, depending on the value of k, can greatly increase power. A k value as small as 2 or 3 was concluded to be adequate for large or small experiments respectively. A one sided t-test along with GFWER(2)=.05 identified 43 genes as exhibiting PICKLE-dependent expression. Expression of all 43 genes was re-examined by qRT-PCR, of which 36 (83.7%) were confirmed to exhibit PICKLE-dependent expression. Key words: ********** Please add keywords ***

1. Introduction The advent of inexpensive microarray technology has enabled individual laboratories to easily obtain a global perspective on the expression pattern of thousands of genes. This powerful technology has allowed investigators to diagnose early cancers ( K i m , J . W. and Wang, X. W., 2003; Zhang et al., 2003), discover genes that contribute to quantitative traits (Gu et al, 2002), and detect coordinated gene regulation during pivotal developmental events such as embryogenesis and sexual maturation (Girke et al, 2000; Lo et al, 2003; Ruuska et al, 2002). The first generation microarrays were generally based on two dye methodologies. These cDNA microarray experiments involve hybridizing two mRNA samples, each of which has been converted into cDNA and labelled with its own fluorophore, on a single glass slide that has


149

been spotted with 10,000-20,000 cDNA probes. I n contrast, more recent high-density oligonucleotide microarrays, such as those offered by Affymetrix , provide direct information about the expression levels i n an mRNA sample and can have a much higher density (Yang and Speed, 2002). The majority of methodologies for microarray analysis have been developed for two dye spotted arrays (Kerr et al, 2000; Kerr and Churchill, 2001; Lee et al, 2003, Nguyan et al., 2004, for review see Quackenbush, 2001 and Yang and Speed, 2002). Unfortunately these two-dye spotted arrays also pose other statistical issues, such as normalization to correct for dye bias. Furthermore i f more than 2 treatments are used, it is not possible to compare all treatments on the same chip thus necessitating an Incomplete Block Design (IBD) type design (Kerr and Churchill, 2001). As such, special experimental designs, such as the reference and rotational design are needed for correct analysis (Kerr and Churchill, 2001; Quackenbush, 2001 and Yang and Speed, 2002). In contrast, oligonucleotide microarrays use a single dye technology and pose some advantages, including a greatly increased density of genes and simplified experimental design because treatment effects are tested independently on each chip, eliminating the need for I B D designs. Nevertheless, statistical issues remain, such as normality of residuals, homogeneity of residual variance, correlation of errors within an array, and correlation of biological samples across arrays. Mixed model methods for analysis of microarray experiment, proposed by Wolfinger et al. (2001), solves most of these issues (see Craig et al, 2003 for review). However, the complexity of analysis dramatically increases with these advanced methods. Unfortunately, many of the current practitioners of microarray technology do not possess the mathematical expertise necessary to meaningfully employ these methods. On the other hand ANOVA is a tool that is easy to implement with methods common to most researchers. Kerr and Churchill (2001) conclude that "The analysis of variance (ANOVA) is a natural tool for studying data from experiments with multiple categorical factors". The first objective of this research was to examine the utility of simple ANOVA for analysis of replicated oligonucleotide microarrays experiments. The motivation was given eloquently by Kerr and Churchill (2001) who stated " A n advantage of model based data analysis such as ANOVA is that a model helps the analyst explore the data. I f one finds a model inadequate, discovering why i t is inadequate can help the analyst identify sources of variation and bias." A secondary objective of this study was to show how using a one sided t-test can be used to increase power. The final objective was to introduce an alternative method to increase power


150

by accepting a base number of false positive with high probability. The ANOVA is particularly suited to analyzing data from microarray experiments that employ a replicated factorial arrangement of treatments. A n example of such an experimental design is one i n which the investigator looks at gene expression i n wild-type and mutant plants in the presence or absence of an added chemical. Many microarray studies incorporate this type of experimental design, e.g. the response of genes in nontumbrigenic and tumorigenic tissues to different concentrations of toxic or therapeutic drugs (Lundquist et al, 2002; Martinez et al, 2002) or the response of genes from different tissues to estrogen or other hormones (Abe et al, 2003; Faccioli et al, 2002; Fujita et al, 2003; Goda et al, 2002). This design easily extends into any number of genotypes (or tissues) by any number of developmental time points (or biochemical exposures). The primary biological objective of this research was to understand how a CHD3-chromatin remodeling factor, P I C K L E , and a plant growth regulator, gibberellin (GA), regulate gene expression during germination of Arabidopsis seeds (Rider et al, 2003). P I C K L E is necessary for repression of embryonic traits in Arabidopsis (Ogas et al, 1997). Expression of the embryonic state i n pickle seedlings is inhibited by the plant growth regulator gibberellin (GA) and is enhanced by application of uniconazole-P, an inhibitor of GA biosynthesis (Izumi et al, 1985; Ogas et al, 1997). Specifically, gene expression was examined in wild-type and pickle seeds grown in the absence and presence of 10~ M uniconazole-P. Thus the genotypes were 'wild 8

type' vs. the pickle mutant, and biochemical exposure was to either 1 0

- 8

M uniconazole-P or

no uniconazole-P during seed germination. Our working hypothesis was that PICKLE functions during germination to repress genes that promote embryonic identity. I n support of such a hypothesis, the transcript levels of two positive regulators of embryogenesis, L E A F Y COTYLEDON1 (LEC1) and L E A F Y C O T Y L E DON2 (LEC2) (Lotan et al, 1998; Stone et al, 2001), are elevated during germination of pickle seedlings (Ogas et al, 1999; Rider et al, 2003). Our interest was to find new genes that e x hibited PICKLE-dependent expression, i.e. were up regulated. As such, we had a natural one sided test. 2. Biological Methods Seeds and tissues from the Arabidopsis pickle-1

mutant (in a Columbia ecotype back-

ground) and wild-type Columbia were used for all investigations. Plants were grown as described previously (Ogas et al, 1997; Rider et al, 2003).


151

The Affymetrix GeneChip Arabidopsis Genome Array contained 8256 sets of oligos rep6

resenting approximately 30% of the Arabidopsis thaliana

transcriptome. A 2 x 2 factorial

arrangement of treatments were examined. The first treatment was genotype (pickle mutant vs. wild type), the second treatment was uniconazole (applied vs. control), the treatment combinations were designated pkl, Upkl, wt and Uwt (pickle mutant untreated, pickle mutant treated with uniconazole-P, wild type untreated, and wild type treated with uniconazole-P) were each represented by four biological replicates (n = 4) for a total of 16 chips (Rider et al., 2003). 3. Statistically Methods 3.1 T h e A N O V A , partitions, and transformations The model for the completely randomized design (CRD) associated with the fc-th spot (or gene) is V^^ = A * + * + â‚Ź ^ where T

is the expression (or log transform) for the fc-th gene, in the

replicate of the i-th treatment; fj, is the overall mean;

j-th

k

is the effect of the 2-th treatment

on that gene, and ej^- is random residual. For maximum information treatment effects are further partitioned into main effects and interactions. The partitioning should be reduced to single degree of freedom tests by use of orthogonal contrasts. Because the ANOVA must be completed for each spot on the array, methods to automate the test are needed. To accomplish this goal, we use the well-known result that any single degree of F tests can equivalently be constructed as a t-test (Gill, 1978). A simple t-test for any contrast can be computed with the means procedure in SAS or in any standard spreadsheet, such as Excel. The t-test also offers the advantage of being able to test for a one sided alternative. I n some experiments, as in this one, the researchers may only be interested in genes that are either up or down regulated, as a result, the power to detect those genes will be greatly increased. For expression type data, the variance is usually correlated with the mean, violating a critical assumption for the ANOVA. For such data, transforming to logs will usually correct this problem. Interpretation of log transformed data also better meets the interest of the biologist as significant differences are interpreted as being significant ratios on a non-transformed basis, i.e. the difference between logs of numbers is the same as the log of a ratio. A log base 2 is interpreted as fold change, while base 10 is interpreted as orders of magnitude difference. Natural logs have not been widely used for array data but perhaps represents the most valid biological interpretation due to kinetics. A common rate equation in chemistry is where the rate of change in product (dY) per unit of time (dt) is proportional (c) to the product thus dY = cYdt. The solution to this differential equation is Y = ce*. Therefore by taking 6

p a r t no. 510429, Affymetrix, S a n t a C l a r a , C A

(Y),


152

Source of Variation

Degrees of Freedom

Mean Square

t-1

MS(T)

Genotypes (C\)

1

MS(Ci)

Inhibitor {C )

1

MS(C )

Interaction of

1

MS(C )

t(r-l)

MS(E)

Treatments

2

2

3

Genotype x Inhibitor (C3) W i t h i n Error

Table 2: Coefficients for partitions of treatment effects.

Treatment

Treatment Combination

Contrast Coefficients

Genotype

Inhibitor

C\j

1- pkl

pickle

None

1

1

1

2-Upkl

pickle

Uniconazole

1

-1

-1

3-wt

wild type

None

—1

1

-1

4- Uwt

wild type

Uniconazole

—1

-1

1

MS(C ) m

c

= r ( £ C jF«) /(£)C^.). 3 3 m

2

(C ) m j

2 j

(3.1)

natural logs, the expression is linearized into a rate equation, \n(Y) = In c + 1 . I f t is constant across biological replications, then variation in expression is due to linear differences in the rate constant c, the gene regulatory factor. Differences due to treatments are then interpreted as linear differences in gene regulatory factors (rate constants). The vast majority of array data will require such a transformation, however, curiously these data better met the assumption when non-transformed. To check this assumption for any data, compute the within gene variance for each gene (the residual error variance in the ANOVA),


I S A * : W^mmt.

153

then plot that against the average expression level for that gene. Any slope significantly different from zero (a zero slope is parallel to the x axis) indicates that the data require a transformation before the analysis proceeds. For a given gene, because each treatment combination was randomized onto each of 4 biological replicates, the experiment as detailed above is a 2 x 2 factorial arrangement of treatments i n a completely randomized design (CRD). The ANOVA for this design with treatment effects partitioned is given in Table 1. The mean squares for the partitions can be found using the following formula along with the contrast coefficients given in Table 2 The F test, which is distributed as F with 1 and t(r — 1) degrees of freedom, is then computed as the ratio of F = MS(C )/MS(E).

This test is equivalently computed as t

m

-*m —

(3.2)

i

which has t(r — 1) degrees of freedom. From these formula i t is easy to verify that the calculated value F = t

2

-Fi,t(r-i) =

(*t(r-i)) 2

and from tables one can verify corresponding critical values, i.e.

However, when calculated as a t-test the sign of the contrast is p r e -

served, thus allowing a one tailed test. This approach will extend to any contrast for any number of treatments, provided the sum of the coefficients for that contrast is zero. To be orthogonal with other contrasts the sum of the cross products must also sum to zero. For this analysis, our hypothesis was that one or more genes existed for which the expression level was elevated i n pickle mutants, regardless of uniconazole treatment. This hypothesis was based on an expression pattern similar to that of LEC1 and LEC2. Thus the primary contrast of interest was the main effect of genotype ( C i ) . Because we were only looking for a similar pattern (up regulation), the power to detect up regulated genes increased. Use of prior information to increase power is more cost effective than increasing the number of biological replicates. I n other experiments additional contrasts may be of equal or greater importance, this may be particularly true of the interaction of genotypes with uniconazole treatment ( C 3 ) , which test the hypothesis that application of uniconazole has a different effect on one genotype than the other. The critical value of t depends on a number of factors, including one- vs.

two-sided

alternatives, degrees of freedom (df) for estimation of error variance, and acceptable type I


154

error rates. Choosing an acceptable Type I error rate is discussed i n the next section. 3.2 Generalized experiment wise error rate ( G F W E R ( k ) ) Experimenters have long recognized that if a comparison wise type I error rate (CWER) is used across a great number of tests, a large proportion of declared significant differences would be false. For example analysis of array data involves thousands of comparisons, consequently, if a per comparison error rate of 0.05 were used for our analysis, more than 413 of the 8256 tests would be expected to be declared significant by chance alone. The most widely used approaches to control Type I errors i n multiple tests is based on controlling the family wise Type I error rate (FWER) (Fernando et al, 2004). The FWER is the probability of rejecting one or more true null hypotheses, i.e. the probability of accepting one or more false positives. A common method for controlling the FWER is the Bonferroni or Sidak (1967) adjustments. However, the F W E R with those adjustments is too conservative i f the cost of false negatives is high relative to the cost of false positives, i.e. they sacrifice power to avoid accepting false positives. Methods have been developed to address this issue by allowing for some false positives among those declared significant, such as the false discovery rate (FDR, Benjamini and Hochberg, 1995; Reiner, et al, 2003; see Nguyen, 2005 for general discussion on this i s sue). Alternatives to the FDR have since been proposed that take into account the expected number of false null hypothesis and other modifications (see Fernando et al, 2004 for review). However, all methods used to estimate an FDR make assumptions about the distribution of truly expressed genes. As a result, the FDR will either be too liberal or conservative. Here we present an alternative that does not attempt to establish an FDR. Rather the method is an extension of the F W E R methodology to allow for a higher family wise error rate. The development is as follows: Assume a strictly null distribution from which N independent test statistics are computed, from which N independent decisions are made at the same critical threshold level. The probability that any one decision is incorrect is p. A n incorrect decision is defined as rejecting a true null hypothesis. W i t h multiple tests, the probability of exactly m incorrect and N — m correct decisions is

P(m = incorrect \N = decisions ) = (" ) p ( l — p)N—m TTh m

L

The usual FWER = £(1) is the probability of rejecting 1 or more true null hypotheses found as:


155

«1)= X)P ( -P) m

1

i V

"

(-)

r o

3

4

m=l

or equivalently, 1 minus the probability of no incorrect decisions,

«l) = l - ( l - p ) "

(3.5)

which is Sidak's (1967) equation. The value of p per comparison (CWER) is found such that the £(1) is achieved, i.e.

p = 1 - eMi-Umm

(3. ) 6

Stated in the reverse, there is a 1-FWER probability of no incorrect decisions among the N decisions made, i.e.

w

« = £ Q p m=l

(

m

i

- p ) " "

m

( - ) 3

?

^

A generalization of this procedure is to divide the total probability of making Type I errors into parts associated w i t h how many errors are likely to be made at a given probability. Among the N decisions made, define £(k) as the probability of rejecting k or more true null hypotheses and u(k) as the probability of rejecting fewer than k true null hypotheses, f(fc) +u(k)

= 1,

where

N

£ « = £ p

m

( i - r i " -

m

(3-8)

m=k k-1

co(k)=J^p (l-p) m

N m

(3.9)

m=0

If for a given k, the value for £(k) is set to a small value, then among those tests declared significant, one accepts that there will be a high probability of k — 1 false positives plus a low probability of k or more false positives. Therefore, a new type of error rate is defined as GFWER(fc), which is strictly the probability of making k or more incorrect decisions at a given level of p, and ignores the probability of less than k Type I errors. The latter type of errors are considered acceptable in order to gain power and decrease the Type I I error rate. For a more


156

general development of the generalized family wise error rate see van der Laan (2004). The GFWER(fc) cannot be solved for directly, but solutions can be found by iteration. SAS source code used to compute adjusted p values for any £(k) and N is given at our web site. However, Equations (3.8) and (3.9) can also be approximated by the normal as follows: I f X is binomial with n trials and probability of success p, then P[X>r\**

~ y/np(l-p)J

(

r

n

p

^

'

where $ is the cumulative distribution of standard normal distribution. Tables 3 and 4 give p values for, respectively, a one- and two-tailed alternative, and £(h) — .05. Associated critical values of t are given in Tables 5 and 6 for experiments with 6 and 60 df for estimating error variance. Note that for all k values, the critical value of t for a one-sided test is between 12 and 13% smaller, with corresponding increases in power. Table 3 shows that by allowing for 2 or more false positives in a 1 sided t-test increases the adjusted p value by 6.5 times, and thereby also increasing the power of the test. Results presented i n Tables 3 show that for the range of N examined (i.e. N > 1000) the ratios of p values for GFWER(fc) to that of G F W E R ( l ) are independent of JV. Thus, for such chips, once the Sidak p values are found, GFWER(fc) can be found by multiplication using the constants given i n the table.

Table 3: Adjusted p values for k = 1 to 5, chips of size 1,000 and 50,000 and a one-tailed GFWER(fc)=5%.

Number of Tests

k ,000 p-valuexlO

6

50,000 Ratio*

p-value x l O

6

Ratio*

1

51.29

2

335.02

6.5

6.70

6.5

3

783.41

15.3

15.66

15.3

4

1320.01

25.7

26.38

25.7

5

1913.31

37.3

38.23

37.3

1.025

Ratio of p-values to that of G F W E R ( l )


157 Table 4: Adjusted p-values for k = 1 to 5, chips of size 1,000 and 50,000 and a two-tailed GFWER(fc)=5%.

50,000

1,000 p- value x l O

p-value x l O

6

1

25.63

.521

2

167.5

3.35

3

391.7

7.83

4

660.0

13.19

5

956.65

19.15

6

Table 5: The six genes for which the qRT-PCR assay detected no expression i n untreated wild type seed. Transcripts were detected in untreated pickle seeds. Transcripts were also detected for both wild type and pickle seeds (Uwt and Upkl) germinated in the presence of uniconazole-p, thus permitting calculation of Upickle fold change relative to Uwt. The mean values from the arrays are included for illustration. # P r is the number of times Affymetrix Microarray Suite software (v. 5.0) labeled a gene 'present' for the 16 gene chips used for this investigation.

A G I Code

Mean values (4 chips)

q R T - P C R fold change

Upickle wt pickle Uwt Upickle

#Pr

wt

pickle

Uwt

At3gl6410

16

4535

14225

3630

18074

At4g27140

15

1000

2365

417

3214

-

Atlg67330

4

170

701

97

1255

-

At5gl3930

16

46304

-

At3g23220

16

1611

2606

1364

2560

-

Atlg09750

16

2005

3200

2178

5193

-

18459 37623 18471

Putative ID/function

-

+ + + + +

1

204.3

Jacalin type lectin

1

8.95

2S1 seed storage protein

1

3.75

uncharacterized

1

1.75

TT4/chalcone synthase

1

1.43

ERFl/transcription factor

1

0.58

nucleoid-like protein

An important issue is what value of k should one use. The value of k should be set as small as possible without sacrificing too much power. For an experiment of a given size, the rate at which power increases is dependent on the critical value of t. Examination of Tables 5 and 6 shows that the greatest decrease in the critical value of t, with either large or small experiment, comes from increasing k from 1 to 2. For large experiments increasing k beyond 2,


158

or for small increasing k beyond 3, brings about much smaller incremental decreases in t. Prom these results, some general guidelines can be deduced for choice of k. Regardless of the number of spots on a chip, a k value of 2 or 3 should be adequate for large and small experiments respectively.

Table 6:

Presence of uniconazole-p increases derepression of

PICKLE-

dependent genes i n pickle seedlings.

qPCR Ratios

Putative Function

A G I Code

pkl/Wt

Upk/Wt

Upk/pkl

At5g01600

2.90

8.82

3.04

maturation

At3gl6420

4.75

11.41

2.40

defense

Atlg73190

1.79

2.96

1.65

maturation

At2g28790

1.77

2.90

1.64

Atlg20620

2.33

3.51

1.50

At5g54740

2.97

4.10

1.43

At4gl9810

2.43

3.33

1.37

At3g52500

5.55

7.55

1.36

At3gl6430

1.55

2.08

1.34

Atlg05510

1.88

2.53

1.34

At3gl6460

4.64

5.22

1.13

At4g08685

2.61

2.78

1.06

At2g35810

4.24

4.24

1.00

At2gl9590

2.50

2.24

0.90

At4g37410

2.38

1.95

0.82

At5gl2030

5.36

2.68

0.50

maturation

defense defense

desiccation

4. Biological Verification: Q R T - P C R analysis Those genes found significant with ANOVA were re-analyzed using qRT-PCR to compare results. The qRT-PCR method, while more precise than the chip analysis, is still subject to error. The method is based on PCR amplification of mRNA in the sample until a pre-determined threshold is obtained. Because the amplification is a doubling with each cycle, the accuracy of the method is questionable if there exists less than a 2 fold difference in mRNA between the two treatments. qRT-PCR is also subject to biological variability between samples and should therefore also be replicated and treated to statistical analysis. However, replicated qRT-PCR


159

analysis for each gene would be extremely expensive and time consuming. Therefore within the Umitations of this experiment, and recognizing those limitations, we defined confirmation of PJC/ifZriÂŁ-dependent expression as a two-fold or greater increase i n expression level of a given gene in pickle versus wild-type seed when grown in either the absence or presence of uniconazoleP. qRT-PCR was used to compare transcript levels in pickle versus wild-type seed grown in the absence of uniconazole-P as well as transcript levels in pickle versus wild-type seed grown i n the presence of uniconazole-P. Quantitative RT-PCR was performed on an A B I sequence detection system using RNA from one of the biological replicates previously generated (Rider et al, 2003). Oligonucleotide primer sequences and primer concentrations used are listed in supplementary Table 2S available at the web site. 5. Results and Discussion 5.1 Statistical issues For this experiment, we used ÂŁ(2) = .05. Allowing for one false positive raised the adjusted p value from 6.21 x 10~ to 4.1 x 10~ and correspondingly increased the power of the test The 6

5

ANOVA method selected 43 genes, less than one of which was expected to be a false positive based on the experimentwise selection criteria that we employed (8256 x 4.1 x 10~ = .33). Our 5

qRT-PCR analysis supported 36 of the 43 genes (Figure 1). A surprising result of this study was that qRT-PCR did not detect transcripts in wild-type seeds for 6 of the 43 genes identified as having expression differences based on analysis of the array data (Table 5). Although this observation is consistent w i t h the hypothesis that P I C K L E represses expression of these genes in wild-type seeds to facilitate the developmental transition from embryo to seedling, the array expression values did not suggest absence of transcripts in wild-type seeds.

figure 1 about here

There are at least two possible explanations for the elevated number of observed false positives. Affymetrix constructed this GeneChip when the sequence of the Arabidopsis genome was only partially completed. Inflated expression values for some oligos may have arisen from cross hybridization to unintended targets. I n fact, two of the false positives were false because qRT-PCR detected no expression in germinating seeds under any condition. Alternatively, as previously discussed, the discrepancy may be due to different criteria used to determine success for each method. The qRT-PCR data should only be viewed as supporting evidence, not confirmatory.


160

5.2 Biological Inferences PICKLE

is necessary to repress expression of embryonic traits i n Arabidopsis seedlings.

Previous analysis of genes that exhibit PICKLE-dependent

repression identified genes associ-

ated w i t h various stages of seed development. ANOVA identified genes associated with seed development, including 2S albumin genes, HSP17.6, and several lectin-like genes (Guerche et al, 1990; Lenman et al, 1993; Ruuska et al, 2002; Sun et al, 2001). I n all, 10 of the genes (28%) identified and confirmed by qRT-PCR analysis were associated with embryo development or exhibit sequence similarity to genes involved in embryo development (Table IS, available at the web site). Additional studies will be necessary to determine i f the other 26 genes that showed PICKLE-dependent expression i n the germinating seed are also involved i n some aspect of embryo development. Previous expression analysis did not suggest a specific role for uniconazole-P i n increasing penetrance of the pickle root phenotype i n pickle seedlings (Rider et al, 2003). This analysis revealed that the extent of derepression of many of the genes that exhibit PICKLE-dependent

repression is enhanced by the presence of uniconazole-P (Figure 1,

black bars versus white bars). The magnitude of this enhancement, however, was often due i n large part to the fact that the presence of uniconazole-P resulted in decreased expression of the gene relative to wild-type seed imbibed i n the absence of uniconazole-P (data not shown). I n order to examine the effect of combining the pickle mutation with exposure to uniconazoleP, we compared the fold change values of genes in pickle versus w t seedlings (pkl/wt) and the fold change values of genes i n pickle treated with uniconazole-P versus w t seedlings (Upkl/wt) as determined by qRT-PCR (Table 6). I n order to make this analysis comparable to previous analysis of the dataset, either the ratio p k l / w t or the ratio U p k l / w t or both had to be > 2 for a gene to be included in this analysis. Genes for which a transcript was not detected i n wild-type seedlings were excluded from this analysis. Sixteen genes identified with ANOVA met these expression criteria. We found that the presence of uniconazole-P did increase expression of many of these genes in pickle seedlings; the transcript level of 10 genes increased 33% or more when pickle seeds were imbibed in the presence of uniconazole-P. I n contrast, a previous analysis of the same array data identified no genes for which the corresponding transcript was increased by treatment of pickle seeds with uniconazole-P (Rider et al, 2003). Uniconazole-P increases the probability that primary roots of the pickle mutant will e x press embryonic differentiation traits (Ogas et al, 1997). Genes associated with seed development exhibit elevated expression i n pickle seedlings, suggesting that the expression of these genes contributes to the ability of pickle seedling to express embryonic traits after germination (Rider et al, 2003). The discovery that the presence of uniconazole-P enhances the expression of 10 genes in pickle seedlings, 5 of which (50%) are involved in seed development or exhibit


161

sequence similarity to genes involved in seed development, suggests for the first time that the increased penetrance of embryonic traits in pickle seedlings treated with uniconazole-P may be mediated in part through changes in gene expression. Specifically, our results are consistent with the hypothesis that GA acts in concert with PICKLE during germination to repress e x pression of genes that promote embryonic traits. Further characterization of the genes identified here may facilitate subsequent genetic and biochemical analysis of the GA signal transduction pathway that mediates this response. 5.3 Utility We have shown that a simple ANOVA method can identify a manageable number of candidate genes for differential expression from a gene expression array, most of which were real. Although we only applied the approach to an experiment that incorporated a simple class-by-treatment design, i t is applicable to any full factorial design and is computationally straightforward. Previous analysis of the array data employed a modified fold change (MFC) approach (Rider et al, 2003) and failed to detect many of the genes identified by ANOVA. I n addition, our current analysis demonstrates that treatment of pickle seedlings with uniconazoleP enhances the derepression of PICKLE-dependent

genes during germination. These results

reinforce the power of ANOVA versus a method that emphasizes fold-change. The practical utility of the GFWER(fc) method is derived from allowing the user to i n f l u ence the number of genes identified by selecting the appropriate value for k, the number of false positives allowed above the threshold significance level. A critical question is what value of k will result i n the greatest increase in power with the lowest number of Type I errors. A simple power analysis showed that regardless of the number of spots on a chip, a k value of 2 or 3 should be adequate for large and small experiments respectively. Although the GFWER(fc) and FDR are closely related and greatly increase the power of the experiment by relaxing the Type 1 error rate, the application of the GFWER(fc) does not attempt to project an FDR, rather, we only set the maximum number of false positives under the null hypothesis. Calculations for an exact FDR would require knowledge of 1) the number of truly expressed genes, 2) the signal to noise ratio, and 3) their distribution. Without knowing these factors, the FDR as calculated by any of the current methods is an approximation. As a result, the GFWER(fc) may be more or less conservative than FDR methods, depending on the particular experiment. However, the GFWER(fc) is constant and independent of the experiment, which i n itself is appealing. This gives rise to another interesting difference between the methods. The expected number of false positives can be determined a prion with the GFWER(fc) because the rate is independent of the data, whereas w i t h the FDR (and newer methods as reviewed by Fernando et al, 2004) calculations are dependent on the data and one has to wait until the list is generated to deter-


162

mine what the expected number of false positives will be. This difference could be critical i n the planning stage of an experiment. Acknowledgements We thank Guilherme Rosa for helpful comments and discussion during preparation of the manuscript, Jim Henderson for helping to generate the RNA used for this study and Howard Edenberg for chip hybridization and calculation of expression values. Funding: Partial F u n d ing for this research was provided by: JO National Institutes of Health (R01GM059770-0TA1 and 5R01GM59770-02); JRS The Indiana 21-st Century Research and Development Fund and Purdue Research Foundation; SDR BASF ; W M U S D A / N M 9803430 Animal Genetic Mechanisms. This is journal paper number 17605 of the Purdue University Agricultural Experiment Station. Supplemental tables used in the analysis are available at: http://www.biochem.purdue.edu/research/ogas

Jab/arrays / JPmethod / .

References

Abe, H . , Urao, T., Ito, T., Seki, M . , Shinozaki, K., and Yamaguchi-Shinozaki, K. (2003). Arabidopsis AtMYC2 (bHLH) and AtMYB2 (MYB) function as transcriptional activators in abscisic acid signaling. Plant Cell 15, 63-78. Benjamini, Y., and Hochberg, Y. (1995). Controlling the false discovery rate —

A practical

and powerful approach to multiple testing. Journal of the Royal Statistical Society

Series

B 57, 289-300. Black M . A., and Doerge R. W. (2002) Calculation of the minimum number of replicate spots required for detection of significant gene expression fold change in microarray experiments. Bioinformatics

18, 1609-1616.

Craig B. A., Black M . A., and Doerge R. W. (2003). Gene expression data: The technology and statistical analysis. J. Agricultural Biological and Environmental Statistics 8, 1-28. Faccioli, P., Lagonigro, M . , Cecco, L., de, Stanca, A., Alberici, R., Terzi, V., and de Cecco, L. (2002). Analysis of differential expression of barley ESTs during cold acclimatization using microarray technology. Plant Biol. 4, 630-639. Fernando, R. L . , Nettleton, D., Southey, B. R., Dekkers, J. C. M . , Rothschild, M . F., and Soller M . (2004). Controlling the proportion of false positives i n multiple dependent tests. Genetics 166, 611-619. Fujita, N . , Jaye, D. L . , Kajita, M . , Geigerman, C , Moreno, C. S., and Wade, P. A. (2003). MTA3, a Mi-2/NuRD complex subunit, regulates an invasive growth pathway in breast


163

cancer. Cell 113, 207-219. Gill, J . L. (1978). Design and Analysis of Experiments in the Animal and Medial

Sciences.

Girke, T., Todd, J . , Ruuska, S., White, J . , Benning, C., and Ohlrogge, J. (2000). Microarray analysis of developing Arabidopsis seeds. Plant Physiol 124, 1570-1581. Goda, H . , Shimada, Y., Asami, T., Fujioka, S., and Yoshida, S. (2002). Microarray analysis of brassinosteroid-regulated genes i n arabidopsis. Plant Physiol 130, 1319-1334. Gu, C. C., Rao, D. C., Stormo, G., Hicks, C., T., and Province, M . A. (2002). Role of gene expression microarray analysis in finding complex disease. Genes.

Genet Epidemiol 23,

37-56. Guerche, P., Tire, C., De Sa, F. G., De Clercq, A., Van Montagu, M . , and Krebbers, E. (1990). Differential expression of the arabidopsis 2S albumin genes and the effect of increasing gene family Size. Plant Cell 2, 469-478. Izumi, K., Kamiya, Y., Sakurai, A., Oshio, H., and Takahashi, N . (1985). Studies of sites of action of a new plant growth retardant

(E)-l-(4-chlorophenyl)-4,4-dimethyl-2-(l,2,4-

triazol-l-yl)-l-penten-3-ol (S-3307) and comparative effects of its stereoisomers in a cellfree system from Cucurbita maxima. Plant Cell Physiol 26, 821-827. Kerr M . K., andChurchill G. A. (2001). Statistical design and the analysis of gene expression microarray data. Genetical Research 77, 123-128. Kerr M . K., Martin M . , and Churchill G. A. (2000). Analysis of variance for gene expression microarray data. J. Computational Biology 7, 819-837. K i m , J . W., and Wang, X. W. (2003). Gene expression profiling of preneoplastic liver disease and liver cancer: A new era for improved early detection and treatment of these deadly diseases? Carcinogenesis 24, 363-369. Lee, M . T., Whitmore, G. A., Yukhananov, R. Y . (2003). Analysis of unbalanced microarray data. Journal of Data Science 1, 103-121. Lenman, M . , Falk, A., Rodin, J . , Hoglund, A. S., Ek, B., and Rask, L. (1993). Differential expression of myrosinase gene families. Plant Physiol 103, 703-711. Lo, J., Lee, S., X u , M . , L i u , F., Ruan, H., Eun, A., He, Y., Ma, W., Wang, W., Wen, Z., and Peng, J. (2003). 15,000 unique zebrafish EST clusters and their future use in microarray for profiling gene expression patterns during embryogenesis. Genome Research 13, 4 5 5 ÂŹ 466.


164

Lotan, T., Ohto, M . , Yee, K. M . , West, M . A., Lo, R., Kwong, R. W., Yamagishi, K., Fischer, R. L., Goldberg, R. B., and Harada, J . J. (1998). Arabidopsis L E A F Y COTYLEDON1 is sufficient to induce embryo development in vegetative cells. Cell 93, 1195-1205. Lundquist, H . , Oredsson, S., and Akesson, B. (2002). Effect of quercetin oh gene expression in human cells as measured by microarrays —

a pilot study. Paper presented at: Health

promoting compounds in vegetables and fruit. Proceedings of a workshop in Karrebaeksminde, Denmark, 6 8 November, 2002. DIAS Report, Horticulture. 2002, No.29, 77 80; 10 ref. (Danmarks JordbrugsForskning; Tjele; Denmark). Martinez, J . M . , Afshari, C. A., Bushel, P. R., Masuda, A., Takahashi, T., and Walker, N . J. (2002). Differential toxicogenomic responses to 2,3,7,8-tetrachlorodibenzo-p-dioxin in malignant and nonmalignant human airway epithelial cells. Toxicol Sci. 69, 409-423. Nguyen, D. V., Wang, N . and Carroll, R. J. (2004). Evaluation of missing value estimation for microarray data. Journal of Data Science 2, 347-370. Nguyen, D. V . (2005). A unified computational framework to compare direct and sequential false discovery rate algorithms for exploratory DNA microarray studies. J. Data Science (In Press). Nitin, J . , Thatte, j . Braciale, T., Ley, K., O'Connell, M . and Lee. J . K. (2003). Local-poolederror test for identifying differentially expressed genes with a small number of replicated microarrays. Bioinformatics

19, 1945-1951.

Ogas, J . , Cheng, J . C , Sung, Z. R., and Somerville, C. (1997). Cellular differentiation regulated by gibberellin in the arabidopsis thaliana pickle mutant. Science 277, 91-94. Ogas, J . , Kaufmann, S., Henderson, J . , and Somerville, C. (1999). P I C K L E is a CHD3 chromatin-remodeUng factor that regulates the transition from embryonic to vegetative development in arabidopsis. Proc. Natl. Acad. Sci. USA 96, 13839-13844. Quackenbush, J . (2001). Computational analysis of microarray data. Nature Reviews

Genetics

2, 418-429. Reiner, A., Yekutieli, D., and Benjamini, Y. (2003). Identifying differentially expressed genes using false discovery rate controlling procedures. Bioinformatics

19, 368-375.

Rider, S. D., Henderson, J . T., Jerome, R. E., Edenberg, H. J . , Romero-Severson, J . , and Ogas, J . (2003). Coordinate repression of regulators of embryonic identity by P I C K L E during germination in arabidopsis. Plant J. 35, 33-43. Ruuska, S. A., Girke, T., Benning, C , and Ohlrogge, J. B. (2002). Contrapuntal networks of gene expression during Arabidopsis seed filling. Plant Cell 14, 1191-1206.


165

Sidak, Z. (1967). Rectangular confidence regions for means of multivariate normal distributions. J. Amer. Statis. Asso. 62, 626-******** Sokal, R. R., and Rohlf, F. J . (1995). Biometry, Third edition. W. H. Freeman and Company. Stone, S. L., Kwong, L . W., Yee, K. M . , Pelletier, J . , Lepiniec, L., Fischer, R. L., Goldberg, R. B., and Harada, J . J . (2001). L E A F Y COTYLEDON2 encodes a B3 domain transcription factor that induces embryo development. Proc. Natl. Acad. Sci. USA 98, 11806-11811. Storey, J . D. and Tibshiran, R. (2003a). Statistical significance for genome wide studies. Proc. Natl. Acad. Sci, USA 100, 9440-9445. Storey, J . D. and R. Tibshirani, R. (2003b). SAM thresholding and false discovery rates for detecting differential gene expression in DNA microarrays. I n The Analysis of Gene Expression Data: Methods and Software (Edited by G. Parmigiani, E. S. Garrett, R. A. Irizarry, S.L . Zeger). Springer. Sun, W., Bernard, C , van de Cotte, B., Van Montagu, M . , and Verbruggen, N. (2001). At-HSP17.6A, encoding a small heat-shock protein in Arabidopsis, can enhance osmotolerance upon overexpression. Plant J. 27, 407-415. van der Laan, M . J . , Dudoit, S. and Pollard, K. S. (2004). Augmentation procedures for control of the generalized family-wise error rate and tail probabilities for the proportion of false positives. Statistical Applications in Genetics and Molecular

Biology

7

Wolfinger R. D., Gibson G., Wolfinger E. D., Bennett L., Hamadeh H., Bushel P., Afshari C , Paules, R. S. (2001). Assessing gene significance from cDNA microarray expression data via mixed models. J. Computational Biology 8, 625-637. Yang, Y. H . and Speed, T. (2002). Design issues for cDNA microarray experiments.

Nature

Reviews Genetics 3, 579-588. Zhang, H., Yu, C. Y., and Singer, B. (2003). Cell and tumor classification using gene expression data: Construction of forests. Proc. Natl. Acad. Sci. USA 100, 4168-4172.

See h t t p : / / w w w . b e p r e s s . c o m / s a g m b / v o l 3 / i s s l / a r t l 4 /


第九章:讀一篇關於的論文 這是一篇「集大成」型的論文。對於統計推論一尤其是古典的!)^^!!^& &161106 ―基本上可將問題簡化爲:將111^111100(1 ^111^011

1^找出來。因爲一旦

找 了 出 來 , 計 算 ^ 1 ^ ^只是一個優化型的技術問題。有了電腦、有了軟體、只要又 肯花錢,只要未知參數^的維數不高,這工作總是可以做的。 對有些問題來說,求出111^111100(1 ^ 1 0 1 1 就 難 , 計 算 1 ^ 1 ^ 當 然 就 更 難 了 。 若 是我們將可以容易寫出111:6111100(1 61110*1011的數據叫做「完整數據1 ( ^ ? ^

(!^)

」,那麼較難寫出111^111100(1 ^110*1011的數據,是不是可以經由完整數據的111^111100(1 ^111101;1011來寫7 之所以樣的想法,多因爲不完整數據有時是因爲我們嘗試求得完整數據失敗而 得〔例如問卷中的11011-1681)01186, ?8^1;181 3115^61等)。假如有一組數據,它可以想像成 由某一組完整數據「丟掉一部分訊息」而來,那麼我們可不可以利用原來的111^111100(1 ^1011來求出相對應的、關於這組不完整數據的1^1^來呢? 這篇文章不管求出來的^1^對於統計推論是好是不好,只論求^的方法。 它的賣點在:對於所謂的「不完整數據」,作者有明確而廣泛的看法,而且可以舉出很 多例子來一因此對應用者來說,是非常有吸引力的。同時,作者將「求不完整數據 的^1^5」的基本技術,有點像「分解動作」那樣地歸納成兩個步驟,分別叫做1:步 &印)和]V[步(!^ ^^?)。其中的1\1步,對於^^^!^&^【3111117而言,還含有「可儘 量利用關於完全數據求的軟體」的能力。換句話說,對很多不完整數據的問題 1

這是本文的簡單看法。因爲要從完整才能定義不完整。世上當然有我們所直觀了解的完整數據,但又寫不

出11^611110001 ^1111011011的。


168

關於統計論文的撰寫

而言,你可以在現有的軟體上只增加一個計算迴路(^),就可以算出想要的1^1^

2

讀我的註脚需參考原始論文 。見 !^!!!!^!^]:,八.?., ^ & ! ! ^ , ! ^ . 810,1181101 80016^

!^. 8.11(1

IX

(^!^^

3011,^710,1 0^

^ 6 110^0,1

3 39, 1-22.

以下爲我的註脚。

^

^^^.第一句話便說明了本文的全部內容,是名家手筆。用字不多,但

恰到好處。第二句話直指技術面,而1110110*0116是主要的技術因素(因此收斂是必然 的)。由最後一句,便引出本文的一大堆例子來。 這些例子,有很多是被前人考慮過的。有些有的想法,有些沒有(或者那些 作者沒有明白說出〗。但將它們都看成一類而總體都能解,並有實際的爲法來解,當然 是重要的結果。 這是寫得極好的論文摘要,用字不多(也沒有用任何困難的字",但全文的內容 都被涵蓋。 9.1, ! ! ! ^ ^ ^ ! ! , 11116 1.這一句和摘要是同一意思,但多了

一詞,講法

就不大一樣。有些作者喜歡將緖論的內容差不多照抄到摘要一這是壞習慣,因爲 明擺著不肯用心,容易引起166反感。 ?!, ! ^ ^ ^ ^ ^ , 11116 4

一般論文極少自誇。此處用『61118X1^16已有一點算是

4

自誇 。這類事大敎授可以做,因爲他們的身份和品味擺在那兒。新手以不做爲宜。但 "^^。!^, 8611613111^, ^1(16 1311辟0【6X81111)168,,是用得好的。

2

因爲版權的問題,我不在此列出原文。但7/2535是有名的期刊,好一點的專業阖書館都應該有。去找一

下吧。 3 —般的統^^文,除了〖專有)名詞外。大多不用難字一文章好不是用字難或不難,而是用#^當與

否。 4

但是論文又非得説自己的東西好。所以需要你能平實地説自己好。


第九章:讀一篇關於81^的論文

169

1^1, ^【。(!!^。!!, 11116 6,在此先做6X1)011611*18.1【311111乂 ,是因爲大家在數理統計裡 一開始就會讀到,是耳熟能詳的。這是統計理論上最好用的模型:所有的好方法,在 6X1)011611*181

^ 上就一定能用而且會簡化到有直觀意義。當然,若是用不上,便強 7

烈地暗示「所提的方法有問題」。 ^.!, ^。(!!^。!!, 11116 9 - (!.!). 這一段定義何謂111001111)161:6

^0,1從某一組

001111)161)6 (^^經簡化、遺漏,,,而來。但眞的怎樣來?用嘴巴是說不淸楚的,必須用 數學式子,因爲後面要做證明,而空口白話是無法證明的。 要做硏究就得把何謂111001111)16*6

^說明白。我的意見是:公式(^)是本文的

主關鍵之一:用「積分」來說明白。對^!^&^ (!^的1^6111100(1 61110*1011積掉那些 看不到的部分,便得到11^01111)161:6

的111^111100(1 ^111^1011 。以061111)3*61:和11111)111

的功力(!^^是75年的博士,那時還是小敎授),在有了 (二)之後,本文其它的部 分,應都可手到拈來。 但能看出(匸)可不簡單。當然,看出來後再舉例子就容易了。例如若有X: ^ , ^^

100

算是001111)161:6 (!^&,它的11^6111100(1 ^11110*1011是/(^!, ^.^ 3:100|^0 。若我們丢掉了工100 ,則不完整的數據就是X: ^..,^,而我們可以用積分的方法找到這二者者的關係:

/ ( ^ , ^ ^ ^? ^99|^ ^ I

/ ( ^ , , , ^ 5^99^10010)^100

而這就是(!.!)。 這一段明確地交待了 111001111)16*6 (!扛"和001111)16*6 &^間的11^6111100(1 ^!11(^10113, 應如何連接。以後的工作,只是將這個現象用證明及例子講得淸楚。 15.1, ^1^11^011, 11116 20^這一段只是說,要「充分利用/(…^」。求(口)的極大 有兩個辦法。(巧直接把積分算出來,再求極大,但此法的條件是「能做出這個積分」; (^)設法另尋蹊徑,避免做(一般幾乎做不出來的)積分。 9.1, ! ^ ^ ^ ! ! ^ ^ , 11116 23,說明(:!.:!)未必爲11111(1116 。當然,我們可在:^, , , ^ , X 皿 中,丟掉义^,义皿,然後再得到^,...,;^ 。這也暗示了,在實際的問題裡,找到 可用的/(蚓^可能並不容易。 ^ 1 ^ 1 1 ^ 0 1 1 , 11116 25^此處進入本文的標題,謂之「點題」。注意到起名字是


170

關於統計論文的撰窝

5

― 個 學 問 。 如 ^ & ^ 叩 , 』 8 ^ 1 & , 2^都取得不錯一易記,就會想到去用。 ?

:此一頁只講一個例子。你可以直接用(^^來做,這樣做要解一個三次方程

式;也可以用1^的想法,此時不需要解任何方程式。即使最後到了浐(眞正的收斂 極限〗,也只是解一個二次式。這一頁不難,一般的博士生應可一步一步地跟著做。注 6

意到作者原可自己設定一個例子,但卻寧可用1130 (^^^

―這也是一本經典敎

本。 9.2, 11116 4特別提起861161:10 1X10^1 ,雖然下文和遺傳一點關係也沒有。作者只 是說這不是人造的不自然的例子,是眞有實驗的。 1^2, 11116 20,提「只要八步」是故意的。 1?,3, ^1316 1.最後一個0011111111中的數字,暗示的是:收斂的速度,是6X^)011611*181

1^6 。但作者卻沒有講一意在言外。 1X3, 11116 1 1)0 611(1 0【360*1011 1 . 此 一 段 敍 述 的 歷 史 因 緣 和 作 者 的 看 法 。 對 33X1:167 ( 1 9 5 8 ) 這 篇 文 章 , 注 意 到 作 者 雖 說 " ! , 但 又 加 上 3 1 ) 6 0 1 8 , 1 01101111^811068,, ^故雖在給別人^6(111:,卻不肯給足。 ,3, 11116 3 8^61: 1:8,1)16 1.此處又將5^的廣度提了一層:和。!?!!瓧65*1111811)1011拉

上關係。 15.3, 111168 7-9^注意到,雖一直在提別人的工作,但仍在說、!^181战腿!)163,,。這 等於是說別人都沒有進一步的理論一一直都在說自己好,卻不帶火氣。 11116 10.注意到"^!職乂 8 1110^686 1;116 111^111100(1,,,並說這是^ 1681111;:對自 己的結果,定要說話。 11116 14. 1)61111)81:61和11111)111都是68^6310,11中的大家,當然不會忘記63^681311 ^!)!!。^。!! 了。 ?^, 560*1011 2 , 先 只 講 滿 足 ^ : ! ) 的 指 數 族 ^ 乂 ^ ! ^ ! ^ " &^〖1力。這一段和第一

'我以前工作的公司,有一個部門叫811111&11 0*01 ,專門替新產品取名字。 '此時若在一本爛書上找例子,就不如自己來造。


171

第九章:讀一篇關於的論文

節的例子其實是一回事。只是前面是31)6018,1 &^8^1^而此處是一般的6X1)011611*131 &111117 。 15.3, 560*1011 2, 111168 1-5.這一段先自己說、让0118 168*1:1(^011,,,免得別人說。又說 360*1011 3 的 理 論 遠 不 止 此 , 但 吣 ^ ^ & ^ ! & 另 有 意 義 , 故 値 得 另 寫 一 節 。 若在五零年代,你可以分別做1)0110111131, ?0188011? 110111191,

&…。但到了

1977 ,就不能這樣地616111611118X7 。 口.3, 860*1011 2, 11116 9, 11116 10, 11116 11.注意用詞:""^^, 0011乂6乂, ^!^^".這些

都是作者小心處。表示從數理統計做問題的嚴謹。又在11116 12 ^ 1X4 11116 1中,提出 只做11811:111:81 1)8X81116*61 0856, 一直到口.4, 11116 6,這些話都是爲「小心」而說的,只是 表現作者的數理統計唸得很扎實。最後,集合^ ^《X : /(^) 〉 0》和0無關,是常 用的假設,此處要放上。因爲若沒有它,^化的求法〔即使對於00111?161:6 ^

〉都

可能有困難,本部的簡潔結論,就得不出了。 !^4, 111168 12, 14注意到,提到(^)是用"叫!!^。!^",因爲它可看成爲一組方 程式。你當然可以用^^^1011,,,將之視作一個用^(^)!:來表的6^11*1011就是。但注 意到需一致。即便是11^111100(1 6^11^10118在此也用複數。 1X4, 11116 14. "&&1111,,此詞用得精準,因爲口^)並不是6X8^17 ^ 11^611110001 6^118,41011 ^

0

11116 18.

109是不該用斜體字的。同理,在方程式裡要用1。8,^,力叫…而不

是―仫风…。但在1 0 6 3 ;裡的3:,字體卻又有不同。將來在你送出的文稿中要 注意這種小地方。 ^

111165 18-22.這一段繼續說,注意到作者一直在反覆地說明同一件事。甚至於

X是整數,但五^)不是整數都交待明白一一這些大敎授是很小心的。 11116 17. 0011^6X1^回應了 16^1118^ 6X^011611*13,1【3111117的條件。主要是爲了 (^-^)的解是唯一 一一前面所埋的伏筆,儘管很不重要,最好都能關照一若不是 爲了要用口^)的解是唯一,何必在前面又說∼!!^&矽,又說堪"^ 6X^011611*131 &111117 ?


172

關於統計論文的撰寫

9.4, 111168 11-28.這一段若由國人來寫,多半是用數學式子一個一個地套下來。但 統計學還有社會科學的味道,用太多公式,只是表示你只能推導式,卻不能解讀公式。 所以,能用講的,就用講。在這裡最能表現你的深度。 9.4, 11116 29 一 9.5, 11116 17.這一段雖然客氣地叫做01151688 1)0 ^^?^!!,但要點在 6 ^ 1 1 1 (若無此意,則不必01161688〗。雖然全是推導,但皆是形式上的推導。最後得到 的^]^^。,卻正和(?^-^?) ^ ^ ^ ( ^

一致。這是古典6^的關鍵。故需

用種種角度,一提再提。 11116 18.注意"!II 81)60181 08568 ^ 1118117极^!!!口^",仍然是給。16(11*8,但不全 給。作者絕口不提若無以前的1113117 ^^^^.,他們根本做不出來。國人的寫法太謙 虛,不好,因爲別人都不謙虛。 9.5, 11116 20,提到1966的講義。吿訴讀者「我們知道最早是誰做的」。在1966 , 有人明明有好結果,但並不寫論文,只發一個講義而已。 11116 20 -

這一段是引自81111(11361:6

。 ?8X61^1161^3117指「附加

說 明 地 」 。 這 一 段 只 是 表 示 作 者 搞 懂 了 這 篇 1 9 7 4 的 文 章 。 在 6 二 1時恰好是 (丄。)。至於在6 = 2 時 恰 好 得 到 ⑩ 暫 ! 皿 化 一 事 , 本 文 雖 有 提 到 但 未 深 究 。 後 來 1 ^ 711011188因此做了一篇不錯的文章7。 ?,5, 11116 36 - ?,6, 11116 4,這一段其實有點多餘。0111^6(1 6X1)011611*131

& 並 不

佔太多特殊位置,此處卻用它「不能得」的理由,來要改用新的!^鄉。但此 又爲下面的一般21^所包括。就文論文,此一段沒有新東西且不特出,是可有可無的 中間步。 9.6, 11116 5,注意作者以前只用"欧^!^!!!:皿【3111117,,,此就卻用"战^朋!!!^ &111117,,,何以故?以前只有一個(指1621113.1: 6^?0116111;181 ^!^),伹現在已有兩個〔 8

『65111811:

6X^011611*131 &1111117 311(1 011^6(1 6X^0116111:191 &111111^ 〉。故用複數。

11116 17.此處又回到6X1)011611*181 ^ 1 1 ^ ,這相當於0^160^1^ 。當你做了更廣 的一步,常需要和已知的、知道是對的結果相互驗證。如果不合,就是某一就算錯了。 11116 22 40 611(1 0【860*1011 2^這一段話把63,76818,11 1X16*110(1 6X461151011就全包括 7

乙.I1!!。画(舰?).】11338 44, 226^233^


173

第九章:讀一篇關於5)1^1的論文

了。好好地改寫,可作一篇博士論文呢! ^

100^0^注意到評審對於某一個字的字義的挑剔。英文用字,有時比中文要

精確。其實中文也可以寫得精確,只是大家都有壞習慣了不去要求而已。國人的英文 已不如洋人,如遣詞用句再下肯用心8,人家的地盤上,文章不易被接受,是明擺著的。 愼之,愼之。 1X6, 560*1011 3,此一節是技術性的:證明定理。這是國人學者的強項,但統計學的 結果不在於在數學的難度。這幾個定理都不能算難一只是說明在甚麼時候可 以用而已。定理一當然不難,因爲基本上, ? 7的0句這個式子便已足夠。若自〔3^ 來 看 , 0 ^ 的 定 義 , 是 能 夠 讓 ! ^ ) 1的算法而已〔(^)是观111^0^11的結果〉。這 是「看出定理較難,證明反而容易的定理。事實上,直到9.8, 11116 3都沒有太難。 ,8, 11116 12,此一段說明前面證明的是甚麼。文中先說丄(々^) ?,再說一)―

最後還得去說0^ ―

0

這類事一般都需要條件。所謂的好期刊,一般都會要求作者好好把條件列出來, 好好證一證,並且希望你所用的條件不能再弱。 1^8, ^ 巧 ) , ^ ) . 符 號 0 1 0 , 0 2 0 猛 一 看 沒 有 定 義 。 仔 細 想 , 其 實 ^ 比 ) , 就是定義。 11116 32,用"肌11151;&1106 0^ & 081^,,是用語的小心。 1X8, 11116 32 ^0 611(10 5

這一段的證明,你看不看都無所謂。但對於「投稿一流

期刊」而言,這樣的段子就非有不可。如果你要磨鍊自己手上功夫,不妨試作去補足 所有的技術細節。這些一般在上課是不敎〖因爲太^911〗,但硏究上你該都理淸楚。 這四個定理都在說甚麼?眞正所需的條件爲何?這類細節,將來你的論文做到有初步 結果時都要一一補上 9 一一對某些期刊而言,這才算600(1 (!!!^ ^

44

9.9, 11116 30^ 0811 1)6 63511^ ^61166(1…"雖是廢話,但也要說。因爲否則這些定理 的條件是否有模型能滿足都不知道10。但作者卻小心地說'!II 1118117〖11^11^,,,這暗 3

~8將心比心,如果你評審一篇洋人用不通的中文稿,#^他通過嗎? 9 儘管可能放在附錄,或甚至要求你刪去,有細節而被要求刪去和無細節被認爲不夠嚴謹而受拒,是兩回事。 10 有時,爲了證明定理就加條件,結果條件太多,以致「滿足該條件的情形」變成空集合。因此説明自己的 模型的確存在。爲了嚴謹也是重要的。


174

關於統計論文的撰寓

示著"!10〖111 311 08565^ ,也是自我保護但又不負面的寫法。 這些都是號稱爲了嚴謹而玩的文字遊戲。注意到眞正的要點是(^^基本上是 ^

^ ! ! ! ^ ! ! , 化 ^ 0 1 ^ 。這些定理都是化妝後的結果:眞正用2^去做問題的人,大

概都不會去查條件滿足與否一一除非做出來的結果自己都不信。 ^10, 111168 1-25.這一段說話,是爲了表現學問而多寫的』111^ 。完全看不出作 者是否眞的證明過,還是憑經驗亂猜。但三個作者都是38X^(1敎授(^^(!那時是 38818133111;

?10&^^。!:),應該不會弄虛做假。

1^10,

111163 26-32,這是爲了回應仏!^

1, 0011111111 3 。也可將仏!^ 1, 00^11111 3 看

作爲伏筆,現在才回應。 ?,10,

11116

33 1:0 !).]!, 611(1 0 ^ 560*1011 3,這裡在儘力向深處走,但又語焉不詳。爲

何用到860011(1 (^!:^!^時,便會8^)66(1 ^ 0011^6^61106? (?.]^) 0 1

(^^)說的是甚

麼?爲何與收斂速度有關?此類言語,不容易說。因爲說得不對時,內行人便看得出 來,便成爲畫虎類犬了。 自11116 45起的一段話,是回頭再做11*61^1116 ^ 1 6 ^

。前人的類似工作,要一一承

認。但作者仍然在說別人未竟全功〔如"!1111181181 51)60131 03863,, , ^ 1 ^ 0 1 1 ^ 160051111;1011 0?,, "(!0 1101: &0115 011出!^^"等。極力說前人雖有建樹但都缺臨門一脚。 最後,還是回到8^681811 ,和以前的話輝映。這是作者寫作用心處。 ,10, 11116 1 1)0

611(1

0^860*1011

3,此段整體而言,仍然是在說「我們對所舉的

^諸性質,都儘量做了」。這是用來堵 1 6 ^ 6 6 用的〈我們已非常努力了,別多問細節 了)。因爲(^细這個函數得要算得出來才行,其它都是空話,因此文字方面有點枯 燥,就不足爲奇了。

,11,

560*1011 4, 111168

1-9.整個86&1011 4都是在給例子。這裡說、1*1161:

1133 1)6611

01 0811 1)6 1136(1^因此挑明了這些例子都不見得是作者的發明。這一節的主要目的是, 對於所舉的111001111)16*6 ^的問題中,將合理的001111)1^6

^的形式想出來(雖不

一定!!!!^^)。並導出8和^兩步。 !). 11,

860*1011 4.1.1协^21 ;

611(1 0? 360*1011 4以下的各小節的寫法都頗類似(但


第九章:讀一篇關於的論文

175

英文用字卻都有差別》先介紹一個情形,再將問題改裝成1^01111)1^ ^ 的 形 式 , 並 指出相對應的8和IV!兩步,應如何做。

總體而言,這是一篇蠻囉嗦的文章。它的眞實例容其實只有〈1^和定理一,其 它的都是佐料。能舉出那麼多例子是作者們的本事。它表面不難,但將那麼多以前的 東西整理得只用2和]VI兩步就弄明白了,是不簡單的。 更要緊的,是這個文章有市場。它的架勢是:幾乎所有的已知關於1^01111)^6 ^的^!^)的問題(或者8^81311的問題、都可以放在這個架構下討論。使用 的市場一大,哪一個期刊會拒絕它?


第十章.人在江湖 武林弟子藝成之日,拜別師父下山,就進入江湖。以後是否成名立萬,全靠自己 的努力。 當你拿到博士的那一天,如果你還預備搞科硏,如果你不是去那種不准對外發表 的機密單位,那麼你就算是進入了 「以發表論文來求生存」的江湖。江湖中有黑道白 道。當然,你是名門弟子,一開始算是白道。 白道有白道的規矩。下面所列,不全是白道的規矩。有些是你師父在平常就該敎 的。如果他忘了,你不妨拿來參考。

不弄虛作假 寫論文的目的是爲硏究的成果做紀錄,做紀錄的目的是讓後面的人據此可以更 向前進。我們所做的這類學問是累積型的\牛頓說他的成績,都是因爲他能站在巨 人的肩上的原故。要看高看遠看深,當然要站得高。 因爲是累積型的工作,所以要正確。若你的結果毫無用處,別人根本不會用,就算 錯了也不會對科學有影響。但若是你的結果表面甚好,但其中有不能瀰補的大漏洞2, 別人容易由此可以得到更好的結果,這樣就會有大問題了。 學術論文的基本要求是誠實和嚴謹。準此,論文裡的小錯可以原諒,但不可以故 1 2

像老子的《道德經》之類,是非累積型的。 邏辑這回事是有趣的,若是你的錯誤結果被廣泛利用,從這條路走下去,不久就會發現你論文裡有問题。

這時,無心的錯或是有心的誤導便一目了然。


178

關於統計論文的撰寫

3

意弄錯,尤其不能在關鍵處故意弄錯 。

引用明確 4

論文中所引用的文獻,主要以專書和其它學利期刊的論文爲主 。至於一般的技 5

術報吿,開會的紀錄10011&161106 ^^!!!^) ,專書的一章,網路上所貼的文章,某處 6

的碩士論文等,,,,這類比較不入流的事物,能避則避 —一這些都是塗在臉化妝品, 你總不希望評審人覺得你在用劣質化妝品罷。 引用論文時,可以不必提你所引用的在文中何處(有時你還是要提在860*1011 3.4 或者6(111^1011

(^)之類〉。但引用專書時,則最好要提章節或頁碼,以方便讀者去查。

這一方面是禮貌,一方面則表示「你眞的讀過」。 因此,你引用的文獻,應該是你讀過的(當然不必是全部〗。若引用的是冷門資料, 有些期刊就會要求你寄一仍複印去(給評審人參考)。

誰先做出 "?11011^是學術工作者最在乎的事情之一。因爲硏究要求的就是求新求變,因 此「這件事是誰先做出來的」就不能含糊。例如引用到』8^1&時,你就需要提到 ^11611011111^111^ 。但爲甚麼!^町(^^^)7明明在(^朋!!。!!!!!

(^)之後,卻要提起?

你若是內行,就知道這兩篇文章有基本的不同,而化&巧的看法要深刻得多。 準此,你也要保護你的口101埘。明明是你做的,被人搶先一步發表,那你的論文 (至少在好期刊上)就泡湯了。 關於!^0^ 7 的保護,口說無憑。我曾聽到的故事說:有一篇投出的文章被拒, 但過了一陣,這個作者被要求評審一篇類似的文章,眞是「類似」,因爲這篇新文章和 ~~3另一個理由是:在關^,這類錯太容易被内^^住。例如我也在做同一問题,有同""^,爲甚麼你做 得出來^做不出來?競爭者總會用心查一查。 4 較弱期刊的論文效引用多了,會減少#^文的#。 6 這有例外:如1^0066(111168 0 【 ^ 6 6 6 ^ 6 1 6 7 571111)08111111 ,雖是開會紀錄,卻是極有聲望的。其它困内的 幾篇有名的技術報告(如2&011在前述1)001^1"&?的文章^^斤引用的關於11111111*68111131』40^1&的8611 1^158 丁 ^ ^ 因 爲 反 而 讓 你 顯 得 内 行 。 ) 則 不 在 此 限 。 6 因此你就知道爲甚麼要少在三流期刊上投稿,因爲會較少人引用,而01*3^011的數目,暗示^^文重要的 程度。 1^67的文章,其實只是一個半頁的摘要。 7


第十章:人在江湖

179

他的「舊作」,相差只在他的。一律被改爲0 。類似的可怕故事並不是沒有,投稿到 有聲望的期刊一般不會遇到這樣事,當你小有名氣之後別人也不見得眞敢這樣做。但 是,把你的文章壓一壓,同時再做一篇比你的內容更多的文章吃掉你大部分可以做的 6X^61181011

,卻是可能的。

保護的方法是:要求你的工作單位建立一套有時間、有文號的技術報吿系列。這 樣,你的工作出來的成績,因爲你工作單位的背書,就比較受到保護。例如你大可寄 信給期刊的主編、對方的學術領導、或者相關國際學會的理事長等,說你在1999年 7月已做出該結果來,有本校的技術報吿爲證。這樣的信當然會有影響8。如果那人抄 得十分明確,他的日子不會好過。因爲學術圈子其實不大,這樣的作爲會貽笑國際也。

不可硬拗 若是你的文章有錯被別人挑出來,當然第一步是確認是否眞是你的錯9。若沒錯, 當然是頂回去,用詞不必強烈,維持學術上的樸克面孔就好。別忘了還是要感謝別人 讀了你的文章。若有不能修改的錯,你也只好承認10〖並還得在用詞上感謝別人^。

長袖可舞 人際關係永遠是重要的,在學術圈子裡亦然。學術裡會看實力,學問上的和學術 資源上的實力。例如假如你手上有一大筆預算支援一些項目,或者你是某不錯期刊的 主編,總會多受一點尊重^。沒有辦法一大家都要吃飯。杜甫詩:同學少年皆不賤, 五陵裘馬自輕肥。現在大家都差不多,說不定你的學問還好些。但十年後爲甚麼有所 不同?用心的話,錢愈花愈多,學術資源也是愈用愈多。你若是老啃著那一畝三分地, 除非裡面能冒出石油,長遠下去,場面怎會變大? 「在家靠父母,出外靠朋友」。單人隻劍的獨行俠,走江湖可不容易。煮酒放歌,交 友論劍,也是白道人物可以做的。 熱心而肯辦事的學者機會會多一點。你若是有這樣的服務性格,不妨多入世一

8

這樣的信,若是由你的單位领導來寫,就有「捍衛本單位人員的學術權益」的意思。 注意到,若是別人有錯在先,你因爲引用錯的結果而犯錯,這也算你的錯^誰叫你不察,不夠用功^^ 10 —般好期刊都允許作者去信更正已發現的錯,這類事當然是愈少愈好。 "^!:類事隨著你的權力而來,也隨著你的權力而去。你最好是做莊周的時候用心做莊周,做蝴蝶的時候用 9

心做蝴I


180

關於統計論文的撰寫

點。有些雜務不妨交給自己的學生做12,但這裡有分寸,不要過分。需知你的學生並 不 儍 , 這 類 事 英 文 叫 " ^ ^ 811(1 ^

,中文是願打願挨。

退一步沒有海闥天空 做硏究指的是在第一線做硏究。意思是說你總是在做最新的工作,要發明或發現 新的東西,而這是要和全世界的一小撮最好的人在比。好期刊不會因爲你的行政職位 高低來影響是否接受你的論文。即使你曾經在第一線,但學問如逆水行舟,不進則退。 你若是有三年的停滯,你就是有三年的停滯。要追回世界水準,也許你還有功力,不 需三年。但是你就是要重下功夫才行。

別人也不見得多利害 世上是有一些高手怪傑之類,吾等小民硬是比不過。但不要怕,1(3的分布大概還 是差不多110111181

。做硏究工作就不能沒有氣性。所謂的「氣不可衰」,前已言及。

多半的人都是在軟木頭上鑽洞。你若是一心搶快,就不要咪咪摸摸的。將學術資 源搞起來(如要求本單位訂閱重要期刊),固定去查閱可能的對手有甚麼新的技術報 吿,儘量去找一些別人沒有的數據總之,別閑著。 別一個方法是做較難一點的。對於較難的問題13,因爲投入卩產出比不高,一般精 明的搶快型學者是不太肯做的。你若是在偏遠地區,學術資源少,不妨試這條路。當 然,你需要注意保護你的1)1101:11^ 。

自己也沒有多利害 14

意思是,不要選自己做不出來的題目 。硏究工作雖有時候要搶快,但基本上還 是要靠穩扎穩打。選題要。題目要有一點趣味,(^)至少看起來要有影響,^自己 做得出來…如果你還有餘力,留一點空間給別人做。

12 13

例如在主辦學術^^時,總需要赠事。 注意不建議你短無謂的難題,要選難而有影響的。^型的題目^^而功勞不大,畢竟,把一個房子

打掃掉最後的1;011811垃圾再關上門,是無趣的亊。 1 4 你 可 以 問 : 不 短 怎 滅 不 出 ? \^611,用心嘴一兩個月無妨,但是「知止」也是重要的品行。


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.