Nothing Special   »   [go: up one dir, main page]

Statistics (Student) 2023

Download as pdf or txt
Download as pdf or txt
You are on page 1of 165

Statistics (1)

Department of Finance

National University of Kaohsiung

Lecturer: Hsin-Yi Yu (余歆儀)


Statistics (1)
2023

Title: Statistics (1)


Department: Department of Finance
Year: 2
Pre-requisites: Recommend to pass the course Calculus
Post-requisites: Statistics (2)
Course Organiser: Hsin-Yi Yu (余歆儀)
Duration: 18 Weeks
Office hours: Will be announced in the class
Email: hyyu@nuk.edu.tw

COURSE DESCRIPTION

The course aims to develop in students an understanding of the basic and advanced
statistics. The course has a quantitative slant, and is designed to give a theoretical
introduction to basic statistics. The course also help students become statistically
literate, develop a conceptual understanding of basic statistical principles, learn to use
technology (SPSS in particular) to analyze data and aid in conceptual understanding.
Furthermore, the course also teaches students to use statistics to help understand and
solve real-world problems

COURSE OBJECTIVES AND LEARNING OUTCOMES

Knowledge and Understanding


On completion of the course, students should be able:
a) to explain the meaning of statistical numbers and how they are calculated
b) to describe the theory of statistics
c) to discuss and solve real-world problems by using statistics

TEXTBOOK

現代統計學
作者:林惠玲、陳正倉
出版社:雙葉書廊
ISBN:9789579096805

1
REQUIREMENTS

A way to save your work in the course, a calculator will be needed. It should be
emphasized that this course will cover a great deal of material at a RAPID pace. As a
rule of thumb, you should expect to spend a minimum of one to two hours for every
hour spent in class reviewing material covered in lecture and homework. This means I
expect you to work a minimum of three to six hours outside of class. This course
requires a considerable amount of preparation and extra study time, and should plan
accordingly.

GRADING

Attendance: 10%
Mid-term: 45%
Final exam: 45%

Attention: Exams/Quizzes: You will NOT be allowed any extra credit projects, etc. to
compensate for a poor average. Everyone must be given the same opportunity to do
well in this class. Individual exams WILL NOT be supplied; however, I may use
attendance and class participation to make adjustments at the end of the semester.

CLASS SCHEDULE AND READING ASSIGNMENTS (Semester 1)

(The schedule is only used for reference, may be revised by the lecturer.)
Week Textbook Homework/Quiz
Week 1. (Review Calculus)
Introduction and basic (A) Chapter 1
mathematical tools
Week 2. (A) Chapter 2
Charts and Graphs
Week 3. (A) Chapter 3
Descriptive Statistics
Week 4. (A) Chapter 4, Chapter 5.1-5.2
Probability (discrete)
Week 5. (A) Chapter 5.1-5.6
Probability (continuous)

2
Week 6. (A) Chapter 6
Probability Distributions
(discrete)
Week 7. (A) Chapter 7
Probability Distributions
(continuous)
Week 8. (A) Chapter 7
Probability Distributions
(continuous)
Week 9. (A) Chapter 8
Sampling Methods and
Sampling Distributions (1)
Week 10. Chapter 8
Sampling Methods and
Sampling Distributions (1)
Week 11. (A) Chapter 8
Sampling Methods and
Sampling Distributions (2)
Week 12. (A) Chapter 9
Estimation for Single
Populations (1)
Week 13. (A) Chapter 10
Estimation for Single
Populations (2)
Week 14. (A) Chapter 11.1-11.3
Statistical Inference:
Hypothesis Testing for a
Single Sample (1)
Week 15. (A) Chapter 11.4-11.6; Chapter
Statistical Inference: 12.1-12.3
Hypothesis Testing for a
Single Sample (2)
Week 16. (A) Chapter 12.4-12.6
Statistical Inferences about
Two Populations
Week 17. May be used for catching the
Review and conclusion progress.

3
Week 18. Including the materials from
Final Exam Week 1 to Week 17.

以下規則事關個人權益,請睜大眼睛切實詳讀。若因為忽略規則而導致權
益喪失,後果自負。閱後請於文件底部簽名。

1. 上課請勿遲到,若遲到,請由後門進入。

2. 請每堂課攜帶講義或課本。

3. 課程內容以講義為主,課本為輔,習題則會指定課本裡的練習題。

4. 本課程重瞭解輕記憶,所以兩次期中考可攜帶半張 A4 大小的公式紙

(單面),以幫助記憶;期末考的考試範圍為整學期的授課內容,可攜

帶一張 A4 大小的公式紙(單面)。

5. 為了保持評分之公正客觀,點名未到 (包含上課抽點回答問題),不允

許補點名(點名結束之前進教室可算是有出席),除非發生不可抗力事

件(例如生病、意外、天災等),若要補點名,必須出示學校認可之請

假證明,並在一週內請假,逾時視為曠課。何者為學校認可之請假證明,

以學校規定為準。

6. 請注意,生理假根據「國立高雄大學學生請假辦法 1」,每月以一次為

原則,無須出示證明。但一次不超過兩天,超過兩天者,以病假論,應

改請病假,若無在一週內改請病假,以曠課論。

7. 點名集滿五次未到者,酌扣學期總成績 3 分。

8. 考試時若遇到不可抗力事件(例如生病、意外、天災等),可在考試之

後一週內提出補考申請並提出學校認可之請假證明。申請方式包括:親

自口頭告知、電子郵件、電話。補考之時間地點由師生雙方溝通決定。

但若是因為個人成績不佳而申請補考,則一律不接受,因為每個人應該

1
https://sa.nuk.edu.tw/var/file/9/1009/img/442/153133469.pdf

4
都有相同的時間和機會來爭取優良的考試成績。

9. 補考題目難易度會隨著距離考試當天日期越遠而越難。

10. 學期總成績採取絕對公平制,不滿 59.5 分可四捨五入成為 60 分者(只

看小數點下第一位),一律無法通過,任何理由都不接受。

11. 本課程為必修,按照系上規定,要去它系修習本系必修,必須在本系至

少修課過一次。講白話點,你要被當過才能改修外系的統計,所以建議

不要輕易退選,退選之後下次你還是無法去外系修課。

12. 學習上若有困難或障礙,請隨時告訴授課教師,將會安排助教做課程上

的輔導。請善用助教時間,這是你的權益。

13. 每次考試後接著的那一個禮拜上課當天,將會由助教發還考卷並檢討答

案,不可代領考卷。請把握機會檢查你的考卷是否有改錯、成績登記是

否正確。

14. 若發還考卷當天無法出席,之後要核對考卷則必須聯絡我,我會來我的

研究室與你一起核對考卷,而且你只能看自己的考卷,不可以翻看別人

的考卷。因此事後來閱卷,只能核對是否有明明答對卻被改錯,或是總

分加錯之情形。

15. 期末作業統一繳交格式如下:

 使用 A4 白色紙張

 打字,若有數學公式,請使用 WORD 方程式編輯器或是 LaTex

文書編輯軟體

 禁止手寫

 第一張紙書寫科目名稱、姓名、學號

 第二張紙開始撰寫答題內容

 單面列印

 加註頁碼

 於左上角裝訂好
5
 違反以上格式者作業以零分計算

16. 歡迎大家針對講義、課本、習題答案與授課有錯誤的地方提出指正,若

能指出多個錯誤,你的名字將會列入感謝名單。

感謝名單

99 級金管二 方玉璇

100 級金管二 曾奕力

101 級金管二 李思慧 黃上娟 周盈君 潘可佳

102 級金管二 王韻婷 官姿伶

重要日期

放假:10/9, 1/1

期中考:11/6

期末考:12/25

期末檢討:1/8

6
Chapter 1 Introduction and Data Collection

Question: What is statistics?

最早期的統計問題主要是以人為研究對象,戶口普查與人口統計是每一個國家的
政府機關都要做的工作,如此則當戰爭發生時,才知要徵召那些人去作戰。人類
的聰明智慧進一步知道統計問題欲研究的對象可以是人、事、物等等。因此,一
個統計問題欲研究對象之所有份子所成的集合,稱為母體(population)。例如:
台大醫院想了解93 年度該院新生兒之平均體重,則93 年度台大醫院所有新生兒
所成的集合,為此研究的母體。

母體的部份集合,稱為樣本(sample)。承上例,從93 年度台大醫院新生兒中隨
機抽出200 位,則此200 位新生兒所成的集合,為此研究的樣本。

母體資料的特性值,稱為母體參數(population parameter),簡稱參數。例如:
96 年度台大醫院所有新生兒之平均體重(稱為母體平均數 µ ),為此處所謂的
參數。

樣本資料的特性值,稱為樣本統計量(sample statistic),簡稱統計量。例如:從
93 年度台大醫院新生兒中隨機抽出200 位之平均體重(稱為樣本平均數X ),
為此處所謂的統計量。

統計學(statistics)為蒐集、整理、陳示、分析與解釋統計資料,在不確定
的(uncertainty)情形下,由樣本所獲得的訊息(information),經歸納演繹分析,
對母體特性(characteristic)做推論,並做成決策的科學方法。統計問題亦因而分
成:(1)敘述統計(descriptive statistics):研討如何蒐集、整理、陳示統計資料。
(2)推論統計(inferential statistics):研討如何利用樣本資料對母體作估計、檢定、
預測及決策。

例如:一個聰慧的經理人,如何善用統計方法,作出正確的決策:

10
(1) 取得與問題有關的統計資料(data)。
(2) 使用統計方法,得到統計資料所傳達的訊息(information)。
(3) 作出正確的決策(decision)。

例如:可口可樂公司生產很多種可樂產品,欲瞭解消費者對其產品的喜好情
形,做了一次市場調查,獲得與問題有關的統計資料,使用統計方法做計算分
析,得到下列的訊息:
(1) 購買Coca-Cola Classic 的消費者平均年齡超過30 歲。
(2) 購買Coke 的消費者平均年齡十幾歲。
(3) 購買Diet Coke 的消費者特別關心體重及糖份吸收問題。
(4) 購買Caffeine-Free Diet Coke 的消費者特別關心健康問題。
可口可樂公司行銷部經理,根據上述的訊息,在擬定行銷策略及廣告設計上,
都可作出效率高且正確的決策。

例如:
花旗集團與大聯資產管理聯合委託的「亞洲投資人群像」調查,從台灣、香港
與新加坡抽出2500 位基金與股票投資人作調查,得到下列的訊息:
(1) 台灣和香港的投資人比新加坡人精明,新加坡人評估風險與利潤時太過小
心。
(2) 香港投資人在購買股票和基金時大膽,虧錢也比較冷靜。
(3) 台灣投資人「頗願意冒險投資,但對投資損失最不甘心」。
(4) 新加坡人會過早把績優投資脫手,對表現不佳的投資卻抱得太久。
(5) 比起美國人來,這三個主要亞洲市場的投資人顯得高度自信,高估自己
在金融市場打滾的能力。
(6) 亞洲投資人把金融顧問當成明牌而非長期金融規劃的來源。
(7) 亞洲人比較會受情緒影響,「容易買賣太多、太頻繁」。
花旗集團與大聯資產管理,根據上述的訊息,在擬定行銷策略、廣告及金融
商品設計上,都可作出效率高且正確的決策。

統計計算工具可使用:(1) 統計用計算機:CASIO fx-95MS 或其他廠牌型號。


(2) 統計套裝軟體:如Excel、Minitab、SPSS、SAS 等。

各種科學之間是用科學方法連貫起來的,而在這些方法中包括了演繹法跟歸納
法。演繹法就是數學、歸納法就是統計學。要應用演繹法或歸納法便少不了要
做數字上的紀錄,而那些將觀測現象變成數值的設施即是科學儀器。統計未來
發展包括政府統計、生物醫學統計、人事管理、財務分析、工業統計(含品管
及生管)、行銷研究、民意及市場調查、保險精算、經濟分析等。

11
Chapter 2 Presenting Data in Tables and Charts

1. 辨別下列資料的型態,何者是屬量資料?何者是屬性資料?
(a) 棒球選手之制服背號。
(b) 學生之學號。
(c) 百貨公司商品之售價。
(d) 馬拉松賽選手跑完全程所花費時間。

一、編製次數分配表之步驟與練習。

統計資料編成次數表之基本假設
 集中分配:各組觀測值都等於組中點值。
 均勻分怖:各組觀測值都是等距離分佈於組內。

A. 決定研究對象、搜集必需之資料。
B. 依大小排序(Array)
i. 求算全距 Range=max-min。
C. 決定組數 No. of class;組數太少,則可能有重要的訊息被隱藏起來;組數
太 多,則反而會使資料更加混亂,而變得毫無意義。
i. 根據樣本數的大小,決定組數,建議採用
(n:樣本數,k:組數)。
D. 計算組距 (Class Interval):
i. C=R/k R:全距,k:組數(取一方便之數即可)。
E. 決定組界。
F. 計算每一組的組中點、發生的次數、相對次數(百分比)、累積次數、累積
相對次數。
i. 組中點 =(上界+下界)/2
G. 分類計次與編表繪圖

2. 某班數學成績如下,請編製次數分配表。

12
45,51,53,60,61,61,63,65,66,67
68,74,76,76,78,86,88,88,96,98
請寫出組中點、組界、絕對次數、相對比例、以上和以下累加次數。

3. 隨機觀察50位顧客,使用自動櫃員機,完成交易所花費的時間(單位:秒)
如下所示:
33 65 22 74 41 59 42 83 64 53
77 49 51 31 53 48 67 36 58 89
65 85 55 45 75 39 57 62 46 25
42 54 68 73 34 52 66 43 70 52
51 61 35 46 27 75 59 69 57 47
利用上述資料編製次數分配表、相對比例分配表、以上累積次數分配表、以下
累積次數分配表。

13
二、直方圖(Histogram)可區分為:
(1) 次數直方圖(Frequency histogram):縱座標代表次數。
(2) 相對次數直方圖(Relative frequency histogram):以長方形(長條)的面
積代表相對次數,因此縱座標的高度 = 相對比例 / 組距。相對次數直方
圖的所有長方形(長條)面積和為 1,亦即相對比例總和為 1。

4. 請利用例 3 的分配表,做出次數直方圖、相對次數直方圖。

14
Chapter 3 Numerical Descriptive Measures

我們可計算統計測量數,以顯示資料的特性。我們將資料區分為已分組資料

(grouped data )及未分組資料 ( ungrouped data )兩種。所謂分組資料是指資料已

經被分類分組,而未分組資料或組資料 ( raw data )是尚未被分類分組的資料。

一.未分組資料的中央趨勢

用來描述中心位置或中央趨勢的測量數主要有三種:平均數 (mean)、中位

數 (median)、及眾數 (mode),它們具代表性與綜性。

(一) 平均數 算數平均數 (arithmetic)

幾何平均數 (geometric)

 算數平均數:( µ , x )

算術平均數

所有觀察值的總和除以觀察值的個數即為算術平均數。算術平均數在數

線上代表資料的平衡點。

設 Χ 為變數如薪資收入、價格、男女性別、成績等。若為母體資料,而

觀察值有 N 個,分別為 x1 , x 2 ,…, x N ,則母體平均數(以符號 µ 表示)為:

母體平均數
N

∑x i
x1 + x 2 +  + xN
µ= i =1
= (4.1)
N N
若為樣本資料,而其觀察值有n個,分別為 x1 , x 2 ,  , x N ,則樣本平均數(以

符號 Χ 表示)為:

15
樣本平均數
n

∑x i
x1 + x2 +  + x n
Χ= i =1
= (4.2)
n n

▲ 算術平均數的特質:

(a) 算術平均數是資料的平衡點

所謂資料的平衡點,是指平均數左邊的觀察值與平均數的距離的總和,

等於平均數右邊的觀察值與平均數的距離的總和。

(b) 各觀察值與平均數間的差的總和等於零
N n

∑ (x
i =1
i − µ ) = 0 或 ∑ ( xi − Χ) = 0
i =1

(c) 各觀察值與平均數之差的平方和最小
N 2 N 2

各觀察值與平均數之差的平方和最小表示 ∑ ( xi − µ ) 在 ∑ ( xi − Α) 中
i =1 i =1
n 2 n 2

最小,或 ∑ ( xi − Χ) 在 ∑ ( xi − Α) 中最小,式中 Α 為任意觀察值。


i =1 i =1

(d) 它的優點是使用到每一個觀察值,缺點則是易受極端值的影響。

(e) 可進行代數的演算

算術平均數可以進行代數的演算,分別說明如下:

(f) 若 Χ 的線性函數表示為 Υ = a + bΧ ,則

µ Υ = a + bµ Χ

式中, µ Υ 為 Υ 之母體平均數, µ Χ 為 Χ 之母體平均數。

Υ = a + bΧ

(g) 可對觀察值予以加權(加權平均數)

當觀察值有不同的重要性時,則可對每一個觀察值給予一個權數

(weight),用以代表其重要性,然後再計算其平均數。如以 Wi 代表各觀

察值的加權數,於是可得加權的算術平均數 (weighted arithmetic mean)

16
如下:

加權算術平均數
N

∑W x
n
i i ∑W x i i
母體: µW = i =1
N
(4.7) 樣本: Χ W = i =1 (4.8)
∑W
n

i =1
i ∑W
i =1
i

 幾何平均數(G)

若資料為等比數列,如國民生產毛額成長率、物價上漲率、投資報酬率,

則應以幾何平均數來代表該等資料的中心位置。設 Χ 為變數,若為母體資

料,而有 Ν 個觀察值 x1 , x 2 ,  , x N,且均為正數,則母體的幾何平均數 G 為:

母體的幾何平均數

1
 N N
G = N x1 x 2  x N =  ∏ xi  (4.9)
 i =1 

若為樣本資料,有 n 觀察值 χ1 , χ 2 ,  , χ N ,則樣本的幾何平均數 g 為:

樣本的幾何平均數

1
 n n
g = n x1 ⋅ x 2  x n =  ∏ xi  (4.10)
 i =1 

幾何平均數是用來求等比數列的平均數,如百分比比率、指數等的平均數,

以及求算某一期間平均成長率等。

▲幾何平均數的性質

n n n
(a) n ∏( xi / γ i ) = n ∏ xi n ∏γ i
i =1 i =1 i =1

(b) 不易進行統計推論

▲幾何平均數的應用

17
幾何平均數最常用來計算投資報酬率

幾何平均數投資報酬率

G = [(1 + R1 )(1 + R2 ) (1 + Rn )]n − 1


1

式中 Ri 為第 i 期的投資報酬率。

▲ 幾何平均數的性質

n n n
(1) n Π ( xi / yi ) = n Π xi n Π yi
i =1 i =1 i =1

例如 X 為國民所得,Y 為人口數,則 X/Y 為平均每人所得,要求算其平


均成長率可以計算 X/Y 的幾何平均數,或分別計算 X 與 Y 的幾何平均
數,再將兩個幾何平均數相除。

(2) 適合衡量等比數列的中央位置,但不易進行統計推論。

▲ (補充) 報酬率的計算

One-period simple return:


𝑃𝑃𝑡𝑡 − 𝑃𝑃𝑡𝑡−1 𝑃𝑃𝑡𝑡
𝑅𝑅𝑡𝑡 = = −1
𝑃𝑃𝑡𝑡−1 𝑃𝑃𝑡𝑡−1
If there is dividend,
𝑃𝑃𝑡𝑡 + 𝐷𝐷𝑡𝑡 − 𝑃𝑃𝑡𝑡−1 𝑃𝑃𝑡𝑡 + 𝐷𝐷𝑡𝑡
𝑅𝑅𝑡𝑡 = = −1
𝑃𝑃𝑡𝑡−1 𝑃𝑃𝑡𝑡−1

Compound return: The k-period simple gross return is just the product of the k one-

period simple gross return involved.

Annualized (average) return: Use the geometric mean of the k one-period simple gross

return iovloved.

隨著計息頻率的增加,有效年利率也不斷的上升如果計息頻率再繼續細分下去,

18
每小時、每分鐘、每秒鐘……最後的極限是每一瞬間,當每一瞬間都不斷計息時,

稱為連續複利 (Continuous Compounding)。

若年收益率為 14%,1000 元資金投資兩年後的期末資金應為:

1000(1+14%)2 = 1299.6 (元)

若每年內複利生息 2 次(每六個月複利一次),則期終資金為:

1000(1+14%/2)2*2=1301.8 (元)

若每年內複利生息 4 次,則期終資金為:

1000(1+14%/4) 2*4=1316.8 (元)

所以,若以 R 代表年利率,m 代表每期(每年)內的複利次數,n 代表投資期

限(n 年),則以 C0 元投資 n 期(年)後所得的期末資金應為:

式中,R/m 代表小期內的收益率。根據上式,可以分析連續複利收益率的概

念以及計算方法。若將單一期(1 年)內的複利次數(m)增加,則投資收益將會以更

快的速度複利生息。也就是說,在單一期內複利生息的次數愈多,計算複利的期

間也就愈縮短。當複利次數增至無限大時(m→∞),投資收益將在每一瞬息間複

利生息。這種瞬息複利生息的複利稱為連複利生息(Continuously Compounding)。

那麼連續複利會不會導致期末資金的無限大?運用極限知識,有:

所以,在持續複利生息下,C0 元投資 n 期(年)後所得的期末資金應為:

𝑃𝑃𝑡𝑡
連續負利率則為 𝑟𝑟𝑡𝑡 = ln � � = ln(1 + 𝑅𝑅𝑡𝑡 )
𝑃𝑃𝑡𝑡−1

若有股利 𝑟𝑟𝑡𝑡 = ln(𝑃𝑃𝑡𝑡 + 𝐷𝐷𝑡𝑡 ) − ln(𝑃𝑃𝑡𝑡−1 )

Example

19
台積電股價變動比的幾何平均數為? 幾何平均報酬率為?

計算投資報酬率不能用算術平均。舉例來說,小陳與小林各拿 100 萬投資,小陳


第 1 年賺了 100%、第 2 年賠了 50%;小林第 1 年賺了 10%、第 2 年還是賺了
10%。以「算術平均報酬率」計算:

小陳的報酬率為:
(100%-50%)÷2=25%
小林的報酬率為:
(10%+10%)÷2=10%
「幾何平均報酬率」,是一種複利的概念,可以從一段時間的累積報酬率回推出
年化報酬率。以小林為例,第 1 年賺了 10%,原來的 100 萬元增加至 110 萬元,
第 2 年再賺 10%,是讓第 1 年結束後所累積的 110 萬元,再增加 10%,產生複
利效果,2 年下來賺了 21 萬元。算法如下:

100 萬元×(1+10%)×(1+10%)-100 萬元本金=21 萬元

小林 2 年下來累積報酬率為 21%,計算出的幾何平均年報酬率是 10%,這樣算


出來的年化報酬率才是真實報酬率。了解兩種報酬率算法的差異後,可以發現小
陳因為 2 年累積報酬率為零,所以年化報酬率當然也是零;反之,小林 2 年累積
報酬率為 21%,年化報酬率為 10%。小林的年化投資報酬率遠優於小陳。

(二) 中位數 ( M e )

20
中位數

中位數是依數值大小順序排列的觀察值中居於中央的那一個數值。

如前所述,當資料中有極端值存在時,算術平均數不是一個良好的指標。

此時可以中位數來代表資料的中央趨勢。中位數是一組觀察值的中央值。

中位數最常用於順序資料,也可以用於區間或比例資料。

▲中位數的求算

設 X 為變數,其母體察值由小而大排列為 x1 < x 2 <  < x N , Ν 為觀察值的個

數。

(a) 若 N 為奇數,則中位數 me 為數列中第( N + 1 )/2 個的那一個數值。

(b) 若 N 為偶數,則取( N + 1 )/2 前後兩個數之平均數為中位數。

同理,若資料為樣本資料,觀察值之個數為 n ,其中位數的求取方法與上面的

母體中位數相同。

▲中位數的特質

(a) ∑x i − me 為 ∑ xi − A 中之最小,亦即 ∑ xi − me ≤ ∑ xi − A (A 為任意

數) 。此乃意指一組觀察值中,若欲尋找一個代表值使觀察值與代表值的距

離和為最小,則該代表值即為中位數。

(b) 不受極端值的影響。中位數只是觀察值數列中的一個數值,因此當然不受

極端值的影響,故對觀察值的變化不敏感。

(三) 眾數 ( M o ) ( M d )

眾數

眾數是指觀察值中出現次數最多的那一個數值或類別。

21
▲眾數的性質

(a) 不受極端值的影響

(b) 可能有多個或一個也沒有

(c) 對觀察值的個數或數值變化的感應不靈敏

(d) 眾數因可能有多個或沒有,因此眾數比中位數及平均數較少使用。

表2 中央趨勢統計測量數之比較
統計測量數 優 點 缺 點
算術平均數 1.資料的重心。資料無極端值 1.若有極端值存在時,則不具代
或偏態時,具代表性。 表性。
2.適合代數演算 2.資料如為偏態,則代表性較差。
3.考慮所有觀察值,敏感度高。
4.觀察值與平均數差平方和最小
5.適合統計推論的工作
幾何平均數 1.適合等比資料 1.不適合一般資料
2.敏感度高 2.不適合作統計推論
中位數 1.適用於有極端值的資料 1.不適合代數演算
2.適用於偏態資料 2.對觀察值敏感性低
3.觀察值與中位數絕對差和最小 3.不易進行母數統計推論
4.可做無母數統計推論
眾數 1.適用於有極端值的資料 1.可能不只一個或不存在
2.適用於偏態資料 2.敏感性低
3.適用於質的資料 3.不能做統計推論

(四) 四分位數 ( Q1 )

四分位數是衡量順序資料前 25%、前 50%及前 75%三個位置的統計測量數,

亦即,四分位數是將觀察值從最小值到最大值分成四等份各 25%的分位數。

四分位數

四分位數是將順序資料的觀察值分成四等份數值的分位數,亦即,四分位

數有第 1,第 2,第 3 三個四分位數。

22
令第 i 個四分位數記為 Qi (i = 1,2,3) ,是指至少有 i / 4 的觀察值小於等於該數

值,且至少有(4- i )/4 的觀察值大於等於該數值。

▲四分位數的求算

▲十分位數的求算

▲百分位數的求算

𝐾𝐾 = (𝑛𝑛 ∗ i)/100
i th percentile, n 為樣本個數。

若 K 為整數,則取 K 與 K+1 個兩個數值的平均數為第 i 個十分位數。

若 K 不為整數,則取小數位數近位為整數的那個數值為第 i 個十分位數。

Example Please compute the 80th and 50th percentile for the following data.

3710 3755 3850 3880 3880 3890 3920 3940 3950 4050 4130

4325

二.未分組資料的分散度

平均數、中位數與眾數只是用來表示資料的中心位置 (集中或聚集情形),而

未能呈現出資料的分散情形。如第 3 章所述,直方圖可以顯現資料的分散情

形,但是圖形的表現仍然無法精確的顯示資料的分散情況。而若要精確表現

出資料的分散情形,則可利用全距 (range)、四分位距 (interquartile range)、

變異數 (variance)與標準差 (standard deviation)等來表示。

(一) 全距 (range)

23
全距為觀察值中最大值減去最小值後的數值,以符號 R 表示。亦即:

R=最大值-最小值

▲缺點

(a) 資料的單位不同,不能比較。如台北市一月氣溫與七月降雨量,前者是

度數,後者為公釐,無法根據 R 的大小判斷其分散程度。

(b) 當資料單位相同,且全距相同時,我們亦不能下結論說兩個資料的分散

程度相同。若資料之分配如下圖,兩者全距相同,但分散程度卻不同。

(c) 全距只考慮最大與最小兩個觀察值,並未考慮所有的觀察值,故不能精

確的反應全體觀察值的分散情形。它與平均數一樣受極端值的影響。
f(x)

(二) 四分位距 (Inter Quartile Range, IQR)

由於全距受到極端值的影響,為了避免此一缺點,可計算四分位距(IQR)

IQR=Q 3 -Q 1,四分位距是第 3 四分位數減去第 1 四分位數,它是以中間 50%

資料的頭尾值相差的大小來衡量分散程度。

(三) 平均絕對離差、絕對均差 (Deviation about the mean)

平均絕對離差
N
1 1 n
母體:MAD =
N

i =1
xi − µ (4.12) 樣本:mad = ∑ xi − Χ
n i =1
(4.13)

平均絕對離差是所有觀察值與平均數之差絕對值的總和除以所有觀察值的

個數。平均絕對離差值越大表示分散程度越高。

24
(四) 變異數 (Variance)

所有母體觀察值與其平均數離差的平方和除以所有觀察值的個數稱為母體

變異數,以符號 σ 2 表示如下:

母體變異數

∑ (x − µ )
1
σ2 =
2
(4.14)
N
式中: µ :母體平均數,N:母體個數。

σ 2 的計算公式:

∑ (x − µ )
1
σ2 =
2

=
1
N
(∑ x 2
− Νµ 2 = ) 1
N
∑x 2
− µ2 (4.15)

所有觀察值與樣本平均數離差的平方和除以觀察值的個數減 1 所得的結果

稱為樣本變異數,以 S 2 表示如下:

樣本變異數

S2 =
1
n −1
∑ x−Χ ( )
2
(4.16)

中: Χ :樣本平均數, n :樣本數。

S 2 的計算公式為 (證明請參閱附錄):

S2 =
1
n −1
(∑ x 2
− nΧ
2
) (4.17)

▲自由度問題

樣本變異數的公式中其分母為 n − 1,不為 n 。計算樣本變異數時,因 S 2 失去一

個自由度,因此以 n − 1 代替 n 。自由度是隨機變量可以自由變動的數目,有關

自由度的說明請參看第 11.3.2 節。

▲Variance 的性質:

(a) 變異數的值大於等於 0,若變異數為 0 時,其意義是所有觀察值均相同,沒

25
有變異(分散)。

(b) 若同一組資料單位不同,其變異數亦不相同。

(c) 單位相同可作比較。

(d) 考慮每一個觀察數值。

(e) 適合代數演算。

(f) 設 Y = a + bX , X 的母體變異數 σ X2 ,標準差為 σ X ,則 Υ 的母體變異數與標

準差分別為 σ Y2 與 σ Y :

σ Y2 = b 2σ X2 , σ Y = b σ X

該代數計算性質,在樣本時為:

S Y2 = b 2 S X2 , S Y = b S X

(g) 設有兩組資料X與Y,X的母體平均數與變異數分別為 µ X 、 σ X2 ,Y的母體

平均數與變異數分別為 µ Y , σ Y2 ,則兩組資料之全體變異數為:

σ =
[ ]
Ν X σ X2 + (µ X − µ ) + Ν Y σ Y2 + (µ Y − µ )
2
2
[ 2
]
Ν X + ΝY

Ν X µ X + Ν Y µY
其中: µ = , N X :X母體元素個數; Ν Y :Y母體元素個數。
Ν X + ΝY
若是樣本時則為:

S 2
=
[(n X ] [ (
− 1)S X2 + n X ( Χ − A) 2 + (nY − 1)S Y2 + nY Υ − A )]
2

n X + nY − 1

n X ⋅ X + nY ⋅ Υ
其中:A = , n X :X的樣本觀察值的個數, nY :Y的樣本觀
n X + nY

值的個數。

【Proof】

26
N1 N2

∑ (x1i − µ ) + ∑ (x2i − µ )
2 2

σ2 = i =1 i =1

N1 + N 2

 N1
[ ] [ 2 
]
N2

∑ ( x1i − µ1 ) + (µ1 − µ ) + ∑ ( x 2i − µ 2 ) + (µ 2 − µ ) 
1
=
2 2 2

N 1 + N 2  i =1 i =1 

=
1
N1 + N 2
{
N 1σ 12 + N 1 (µ1 − µ ) + N 2σ 22 + N 2 (µ 2 − µ )
2 2
}
=
1
N1 + N 2
{ [ 2
] [
N 1 σ 12 + (µ1 − µ ) + N 2 σ 22 + (µ 2 − µ )
2
]}
=
1
N1 + N 2
[ ( ) (
N 1 σ 12 + µ12 + N 2 σ 22 + µ 22 − µ 2 )]

(五) 標準差(Standard deviation)

母體變異數的平方根稱為母體標準差,以符號 σ 表示:

母體標準差

σ = σ2 (4.18)

樣本變異數的平方根稱為樣本標準差,以符號S表示:

樣本標準差

S = S2 (4.19)

(六) 相對分散度

現若有二組資料,而欲比較其相對分散程度時,上述的變異數及標準差因會

受到平均數的大小以及不同衡量單位的影響,而不能逕行用來比較該二組資

料的分散程度。此時應以測量相對分散程度的測量數-變異係數(coefficient of

variation)來比較。

27
變異係數
標準差
變異係數(CV)= (4.20)
平均數
σ
母體資料:CV= (4.21)
µ
S
樣本資料:CV= (4.22)
X

當資料的單位不同如新台幣元與年齡,及資料的單位雖相同但平均數差異很

大時,如部長級官員的薪資與基層公務員的薪資,要對兩組資料進行比較其

相對分散度時應以變異係數來衡量。變異係數的目的在於獲得相對的變異情

形。

Example
1. A 基金最近五年的年報酬率分別為:30%,23%,12%,− 10%,− 15%。
(a) 求全距 R
(b) 求絕對均差 MAD
(c) 求樣本標準差 s
(d) 求樣本變異係數 CV
(e) 若另有一 B 基金最近五年的年平均報酬率 x B = 10%,標準差 s B =30%若
站在變異係數的觀點上,A 基金與 B 基金,何者風險較高?
Ans:

2. 某公司五名高階主管薪資 ∑X 2
= 32000 ,標準差為 10,請問這五名主管的

總薪資。
Ans:

28
三.未分組資料的相關程度

Covariance (共變數)

∑Ν
𝒾𝒾=1(𝒳𝒳𝒾𝒾 −μ𝒳𝒳 )�𝒴𝒴𝒾𝒾 −μ𝒴𝒴 �
Population covariance: σ𝒳𝒳𝒳𝒳 =
Ν
∑𝓃𝓃 � �
𝔦𝔦=1(𝒳𝒳𝔦𝔦 −𝒳𝒳 )(𝒴𝒴𝔦𝔦 −𝒴𝒴 )
Sample covariance: S𝒳𝒳𝒳𝒳 =
n−1

The denominator in the calculation of the sample covariance is 𝓃𝓃 − 1, not the more
logical 𝓃𝓃 for the same reason we divide by 𝓃𝓃 − 1 to calculate the sample variance
(see page 107). If you plan to compute the sample covariance manually, here is a short-
cut calculation.

Shortcut for Sample Covariance


∑𝓃𝓃 n
1 𝒾𝒾=1 𝒳𝒳𝒾𝒾 ∑i=1 𝒴𝒴𝒾𝒾
S𝒳𝒳𝒳𝒳 = �∑𝓃𝓃
𝒾𝒾=1 𝒳𝒳𝒾𝒾 𝒴𝒴𝒾𝒾 − �
𝓃𝓃−1 𝓃𝓃
To illustrate how covariance measures the linear relationship, examine the
following three sets of data.
Set 1
𝒳𝒳𝒾𝒾 𝒴𝒴𝒾𝒾 �)
(𝒳𝒳𝒾𝒾 − 𝒳𝒳 (𝒴𝒴𝒾𝒾 − 𝒴𝒴� ) � �(𝒴𝒴𝒾𝒾 − 𝒴𝒴� )
�𝒳𝒳𝒿𝒿 − 𝒳𝒳
2 13 -3 -7 21
6 20 1 0 0
7 27 2 7 14
�=5
𝒳𝒳 𝒴𝒴� = 20
S𝒳𝒳𝒳𝒳 = 35�2

= 17.5
Set 2
(𝒳𝒳𝒾𝒾 − x�)(𝒴𝒴𝒾𝒾
𝒳𝒳𝒾𝒾 𝒴𝒴𝒾𝒾 �)
(𝒳𝒳𝒾𝒾 − 𝒳𝒳 (𝒴𝒴𝒾𝒾 − 𝒴𝒴� )
− 𝒴𝒴� )
2 27 -3 7 -21
6 20 1 0 0
7 13 2 -7 -14

29
�=5
𝒳𝒳 𝒴𝒴� = 20
S𝒳𝒳𝒳𝒳 = −35�2

= −17.5
Set 3
� )(𝒴𝒴𝒾𝒾
(𝒳𝒳𝒾𝒾 − 𝒳𝒳
𝒳𝒳𝒾𝒾 𝒴𝒴𝒾𝒾 �)
(𝒳𝒳𝒾𝒾 − 𝒳𝒳 (𝒴𝒴𝒾𝒾 − 𝒴𝒴� )
− 𝒴𝒴� )
2 20 -3 0 0
6 27 1 7 7
7 13 2 -7 -14

S𝒳𝒳𝒳𝒳 = −7�2
�=5
𝒳𝒳 𝒴𝒴� = 20
= −3.5

Coefficient of Correlation (相關係數)

The coefficient of correlation is defined as the covariance divided by the standard


deviations of the variables.

σ𝒳𝒳𝒳𝒳
Population coefficient of correlation: ρ =
σ𝒳𝒳 σ𝒴𝒴

S𝒳𝒳𝒳𝒳
Sample coefficient of correlation: 𝓇𝓇 =
S𝒳𝒳 S𝒴𝒴

Example Calculating the coefficient of correlation


Calculate the coefficient of correlation for the three sets of data on pages 124-125.

Solution
Because we’ve already calculated the covariances, we need to compute only the
standard deviations of X and Y.
2+6+7
𝓍𝓍̅ = = 5.0
3

13+20+27
𝒴𝒴� = = 20.0
3

2 (2−5)2 +(6−5)2 +(7−5)2 9+1+4


S𝒳𝒳 = = = 7.0
3−1 2

30
(13−20)2 +(20−20)2 +(27−20)2 49+0+49
S𝒴𝒴2 = = = 49.0
3−1 2
The standard deviations are

S𝒳𝒳 = √7.0 = 2.65

S𝒴𝒴 = √49.0 = 7.00


The coefficient of correlation are
S𝒳𝒳𝒳𝒳 17.5
Set 1: 𝓇𝓇 = = (2.65)(7.0) = .943
S𝓍𝓍S𝒴𝒴

S𝒳𝒳𝒳𝒳 −17.5
Set 2: 𝓇𝓇 = = (2.65)(7.0) = −.943
S𝒳𝒳 S𝒴𝒴
S𝒳𝒳𝒳𝒳 −3.5
Set 3: 𝓇𝓇 = = (2.65)(7.0) = −.189
S𝒳𝒳 S𝒴𝒴

It is now easier to see the strength of the linear relationship between X andY.

31
四.Chebyshev’s Theorem and Empirical Rule

(一)

柴比氏定理

不論資料為何種分配,至少有(1- 1 k 2 )的資料落在距離平均數 k 個標準

差的範圍內。k為大於 1 的任意數,即k>1。

由柴比氏定理知,若k=2,則至少有 75%(1- 1 k 2 =1- 1 2 2 = 3 4 )的觀察值落

在距離平均數兩個標準差之內,即 Χ ± 2 S 內,或表為 Χ − 2 S, Χ + 2 S 內。若( )


k = 3 ,則至少有 89% (1 − 1 / k 2 = 1 − 1 / 3 2 = 8 / 9 ) 的觀察值落在 Χ ± 3S 內。若

k = 4 ,則至少有 94%的觀察值落在 Χ ± 4 S 內。

柴比氏定理可應用在任何型態資料上,只要知道資料的平均數與標準差,則

可推測資料在某一範圍的比率(大約)。

(二)

經驗法則

若資料為鐘形分配,則有 68%的觀察值落在 X ± S 內,有 95%的觀察值

落在 X ± 2 S 內,有 99%的觀察值落在 X ± 3S 內(S 為標準差)。

32
圖 經驗法則
Example
1. 利用下列樣本觀察值完成下表。
11.8 3.6 16.6 13.5 4.8 8.3 8.9 9.1 7.7 2.3
12.1 6.1 10.2 8.0 11.4 6.8 9.6 19.5 15.3 12.3
8.5 15.9 18.7 11.7 6.2 11.2 10.4 7.2 5.5 14.5

Chebyshev’s
區間 Empirical rule 實際值
Theorem
( X − s, X + s) = (5.97, 14.55) 至少0% 約有68% 70%
( X − 2s, X + 2s) = (1.68, 18.84) 至少75% 約有95% 96.7%
( X − 3s, X +3s) = (−2.61, 23.13) 至少8/9≈89% 約有99.7% 100%

2. 某校企研所考試共有 1200 位投考人,要錄取其中分數較高的前 80 位。已知


投考人之平均分數為 165 分,而投考人分數之標準差為 10 分。請依據
Chebyshev's inequality 回答下列問題:
(1) 成績在 145 至 185 分者,至少有若干人?
(2) 若有一考生之分數為 205 分,問其是否會被錄取?
Ans:

33
五.未分組資料的偏度和峰度

資料除了中心位置、分散程度不同外,資料的分佈可能為不對稱,稱為偏態

資料,偏態資料可以偏態係數度來衡量。當次數分配有集中的趨勢時,就會

有峰的出現,而峰度則以峰度係數來衡量。

(一) 偏度 (Skewness;S,SK)

單峰對稱分配 左偏分配(負偏) 右偏分配(正偏)

 皮氏經驗法則 µ − M d = 3( µ − M e )

 Pearson 偏態係數

皮爾生偏態係數 眾數

µ − M0
母體 SK P = (4.23)
σ
Χ − m0
樣本 SK P = (4.24)
S
當 SK P = 0 時,資料為對稱分配; SK P > 0 為右偏分配; SK P < 0 為左偏分配。

反之若對稱,則 X = M 0 , SK P = 0 ;若右偏,則 Χ > M 0 , SK P > 0 ;若左偏,

則 Χ < M 0 , SK P < 0 。此外, SK P 愈大表示資料分布愈偏態。

34
Example
1. (皮爾生偏態係數)南山人壽大安區營業處的銷售額平均數是90(萬元),
眾數為64(萬元),標準差78(萬元),請計算其皮爾生偏態係數。
Ans:

 動差法

動差法的母體偏態係數

M3 M3
α3 = =
( )
(4.25)
σ 3
M2
3

∑ (x − µ )
2

式中: Μ 2 = 為以平均數為中心之二級動差。
N

∑ (x − µ )
3

Μ3 = 為以平均數為中心之三級動差。
N

動差法的樣本偏態係數

m3
α3 =
( ) 3
(4.26)
m2

▲偏態係數的性質

(a) α 3 = 0 為對稱分配,α 3 > 0 為右偏分配,α 3 < 0 為左偏分配。。和皮爾生偏態

係數一樣。

(b) α 3 愈大表示愈偏態。

若 0 ≤ α 3 ≤ 0.5,則為趨於對稱的分配:若 0.5 < α 3 < 1,則為稍微偏態的分配;

35
若 α 3 > 1 ,則為極為偏態的分配。

▲補充

何謂動差 (Moment)?

所謂的 r 級動差是一群資料的各個觀察值,與某特定值為中心的差距的 r 次方

的平均數。此特定值可以是平均數、中位數及眾數。例如以平均數為中心之 r

級動差,公式如下:

母體平均數的動差
N

∑ (x − µ)
1
Μr =
r
i (4.27)
N i =1

∑ (x − µ ) = 0 ,此為母體平均離差和。
1
(a) 若是一級動差 r = 1 ,則 Μ 1 =
N

∑ (x − µ )
1
= σ 2 ,此為母體變異數。
2
(b) 若是二級動差 r = 2 ,則 Μ 2 =
N

∑ (x − µ )
1
(c) 若是三級動差 r = 3 ,則 Μ 3 =
3
,它可用來衡量偏態。
N

∑ (x − µ ) ,它可用以衡量峰度。
1 4
(d) 若是四級動差 r = 4 ,則 Μ 4 =
N
樣本平均數的動差

mr =
1 n
∑ xi − Χ
n i =1
( )
r
(4.28)

Example
1. (動差法)金管會想瞭解銀行針對一般交易所要求的手續費的離散程度,抽
取十家銀行對於跨行提款和電匯的手續費,資料如下:

跨行提款 10 5 6 12 18 8 10 15 5 15
電匯 25 35 50 20 15 18 30 40 35 10
請以動差法分別計算其偏態係數,請問哪一個離散程度較大?
Ans:

36
(二) 峰態 (kurtosis), K

以單峰分配而言,依其平坦陡峭的程度可分為為高狹峰、低闊峰或常態

峰。以圖 4.12 表示如下。圖中的常態峰 (meso kurtosis)表示資料的分布呈現,

所謂的一般正常(通常)形態;高狹峰 (lepto kurtosis)表示資料的分布集中於

平均數或眾數附近;平闊峰 (platy kurtosis)表示資料的分佈較平均分散於兩

端。

圖 4.12 三種峰態的圖形

峰度係數
Μ4 Μ4
母體: α 4 = = (4.29)
Μ 22 σ 4
式中: Μ 4 :母體四級動差。
m4
樣本: α 4 = (4.30)
m22
式中: m4 :樣本四級動差。

▲峰度係數的性質

(a) 峰度一定為正數。

(b) 根據峰度係數的值可區分為:α 4 = 3 為常態峰。α 4 > 3 為高狹峰。α 4 < 3

37
為平闊峰。

Example

1. 承上題,請計算其峰態係數。
Ans:

▲ 盒鬚圖(Box-and-Whisker Plot)

我們可以利用 5 個重要的測量數 Q1、M e、Q3、最小值 (min)及最大值 (max),

並以盒鬚圖 (Box-and-whisker plot)來完整的描述資料的時性。

由盒子的寬窄可知居中 50%資料的分散或集中情形,若盒子很寬表示 50%資

料分散度大,反之,則小。由圖知,盒子不是很寬,因此資料分散度不大。

另外,若盒子的位置居中則表示對稱,居左表示右偏,居右表示左偏。再者

可比較左右邊鬍鬚的長短,若右邊的鬍鬚較長則為右偏分配,若左邊的鬍鬚

較長,則為左偏分配。觀察上圖可知,盒子居於左邊,右邊的鬍鬚比左邊的

長很多,因此是一個右偏的分配,亦即板橋營業處的業績是一個右偏的分配。

38
Chapter 4 Basic Probability

統計學探討如何由母體抽取樣本,並從樣本表現出來的特性去推論母體的特
質。而在抽樣時,樣本的出現具有不確性,到底會出現哪一個樣本,必須利用機
率才能得知。

觀念與思考 機率是統計推論的橋樑

假設味全公司某新的飲料有A、B兩種包裝方式。公司企劃部門認為「A種
包裝方式可能較被顧客喜愛」 ,但並不確知。為此,隨機抽取了 10 個顧客為樣本,
結果發現 10 個顧客通通喜歡 B 種包裝方式。根據此一抽樣結果,企劃部門可能
下結論說:「原來的猜測 (顧客喜歡 A 種包裝方式)是不對的」,因為若如公司所
預期的,在顧客較喜歡A包裝的情況下,出現 10 個顧客均喜歡B包裝的情形幾
乎是不可能,因為出現此一結果的機率非常小。因此,可根據此一抽樣結果,判
定原來的假設是錯誤的。然而,上述「10 個顧客均喜歡B包裝」是一個極端樣本
的結果,因此較容易做判斷。反之,如果抽取的 10 個樣本中,有 4 個顧客喜歡
A 包裝,6 個顧客喜歡B包裝,那企劃部門應如何做結論下決策呢?對於此一情
況,則須先利用機率去計算抽到的樣本出現的機率,或計算極端樣本出現的機率,
然後再根據此一機率來判定原來的猜測是否合理。

一.隨機實驗 (random experiment)

隨機實驗是一種過程 (process),是一種不能確定預知會發生何種結果的
實驗方式。在實驗前已知所有可能出現的結果,而實驗後的結果為所有可
能的結果之一,但實驗前並未能正確的、肯定的預知會出現何種結果。隨
機實驗可重複進行,而經過長期重複實驗,出現的結果會遵循某些規則
(呈現有規則的分布)。ex:丟骰子或銅板。

(一)出象(elementary Outcome)
基本出象
隨機實驗的每個可能的結果稱為基本出象,又稱為樣本點。

(二)樣本空間
樣本空間
一個隨機實驗中,所有可能出象的集合稱為樣本空間,通常以英文大
寫字母 S 表示之。

39
(三)事件(Event)
事件
樣本空間的部份集合稱為事件。

二.機率理論
用來解釋機率的理論主要有三種:一是古典的機率理論(classical probability),
另一個是客觀的機率理論 (objective probability),第三個是主觀的機率理論
(subjective probability)。

(一)古典的機率理論
古典的機率理論又稱為先驗的機率理論 (prior probability),它是指若在某一
隨機實驗中,有 N 種互相排斥且同等可能出現的出象,則任一出象 E 發生的
機率,以 P(E ) 表示為:
古典的機率理論
1
P( E ) =
N

(二)客觀的機率理論
客觀的機率理論又稱為相對次數的機率理論 (relative frequency probability),
它係指在長期重複的隨機實驗中,事件 E 發生的機率為出現該事件之次數與
隨機實驗的總次數之比。即:
客觀的機率理論
n( E )
P( E ) = lim
n →∞ n
式中: n(E ) 表示事件 E 出現的次數, n 表隨機實驗的總次數。

圖 投擲銅板出現正面的機率

40
(三) 主觀的機率理論
主觀的機率理論是指事件發生的機率,決定於人們對發生此事件的相信程度。
主觀的機率理論
P(E ) = [對事件 E 發生的信心]
比較上面這三個機率理論可知,就先驗的機率而言,若事件的出象不是同等
可能時,則不能求得機率。在相對次數的機率方面,若事件不能實驗,則亦
不能求得機率。主觀的機率因無客觀的標準,因此,經常因主觀認知的差異
而發生爭議。

三.機率三公理

在一個隨機實驗中,設其樣本空間為 S ,對應於 S 中任一事件 Ei 給予一


實數值,表為 P( Ei ) ,該 P( Ei ) 若滿足下列三條件,則稱 P( Ei ) 為機率。
機率的三個公理
公理 1 0 ≤ P( Ei ) ≤ 1 ,表示任一事件 Ei 若可能發生,則其機率大於 0
小於 1。若事件不發生,則其機率等於 0,若事件一定發生,
則其機率等於 1。
公理 2 P(E1 ∪ E 2 ∪  ∪ E n ) = P(E1 ) + P( E 2 ) +  + P( E n ) , E1 , E 2 ,  , E n

互斥,表示若有 n 個互斥事件 E1 , E 2 ,  , E n ,則 E1 發生或 E 2 發生

或 E n 發生的機率為其個別機率的和。
公理 3 P(S ) = 1 ,表示樣本空間中所有事件均發生的機率總合等於 1。

四.事件機率

(一)事件機率的定義
事件機率
設事件A定義於隨機實驗的樣本空間,其發生之機率 P( A) 為事件A之
基本出象的機率總和,即

P( A) = ∑ P( Ei ) , Ei ∈ A

Example (打香腸的勝利事件之機率)
假設你現在正在打香腸 (以點數大的為贏,稱為勝利事件),而老闆已擲出 16
點,你想贏他,只有擲出 17 點或 18 點。要如何才能擲到 17 點呢?此時必須擲
出{ (5,6,6),(6,5,6),(6,6,5) }才辦得到,而要得到 18 點的話,唯有擲出{ (6,6,6)} }
才行。一個骰子有 6 面,3 個骰子的樣本空間共有 6 × 6 × 6 = 216 個樣本點。如果
骰子沒問題,出現任何一面的機率均相等,每一樣本點出現的機率均為 1/216。

41
由上可知,要得到 17 點或 18 點的情形共 4 種,所以出現 17 點或 18 點的機
率為 4 × (1 / 216 ) = 1 / 54 ,這就是勝利事件實現的機率,也就是說想賭贏老闆機率
是 1 / 54 。

(二)聯合機率 (Joint Probability)

聯合機率
二個或二個以上事件同時發生的機率稱為聯合機率。
例如事件 A、B 同時發生的機率可表示為 P( A ∩ B ) 或 P( A, B ),A、B 均為定
義於樣本空間 S 的事件。P( A ∩ B ) 的機率是指 A 集合與 B 集合的交集 ( A ∩ B )。
設有樣本空間 S,依 A 類別分割為 A1 , A2 ,  , Ar 的互斥空間;依 B 類別分

割為 B1 , B2 ,  Bc 的互斥空間,則 S 可分割為 r × c 個互斥空間, Ai 與 B j 的

交集為:
i = 1,2, , r
j = 1,2, , c

事件的聯合(聯合次數分配)

A\B B1 B2  Bc

A1 A1 ∩ B1 A1 ∩ B2  A1 ∩ Bc

    
    
Ar Ar ∩ B1 Ar ∩ B2  Ar ∩ Bc

上表稱為聯合次數分配表。根據上述樣本空間可得聯合機率分配表如下表:

表 5.3 聯合機率分配表
A\B B1 B  Bc
2

A1 P( A1 ∩ B1 ) P( A1 ∩ B2 )  . P( A1 ∩ Bc )

    
    
Ar P( Ar ∩ B1 ) P( Ar ∩ B2 )  P( Ar ∩ Bc )

42
Example

表 5.4 汽車墊片的品質與模具狀況分析表
產 品 (B)
良品( Β1 ) 瑕疵品( B2 ) 合 計

模 具 狀況佳( A1 ) 320 80 400


( A) 狀況差( A2 ) 14 36 50
合 計 334 116 450

可以得到下面的 probability table

(三)邊際機率 (Marginal Probability)


邊際機率的定義
在二個或二個以上類別的樣本空間中,若僅考慮某一類別個別發生的
機率者稱為邊際機率。
在聯合機率表中,垂直相加或平行相加所得的機率稱為邊際機率。

下表是一般化的聯合機率分配表。 P( Ai ) , P(Bi ) 為邊際機率,可由垂


直或平行加總得到。

43
表 一般化的聯合機率分配表
A\B B1  Bc P( Ai )

∑ P (A , B ) = P ( A )
c
A1
P( A1 ∩ B1 ) P( A1 ∩ Bc )
1 j 1
j =1

    
    

∑ P (A , B ) = P( A )
c
Ar
P( Ar ∩ B1 ) P( Ar ∩ Bc )
r j r
j =1


P (B j )
r r

∑ P( Ai , B1 ) = P(B1 )
i =1
∑ P ( A , B ) = P (B )
i =1
i c c
1

垂直加總:

P( Ai ) = ∑ P (Ai ∩ B j ) = P( Ai ∩ B1 ) + P( Ai ∩ B2 ) +  + P( Ai ∩ Bc ) i = 1,  , r
c

j =1

平行加總:

P(Bi ) = ∑ P (Ai ∩ B j ) = P (A1 ∩ B j ) + P (A2 ∩ B j ) +  + P (Ar ∩ B j ) j = 1,  , c


r

i =1

Example
在上例中,良品與瑕疵品機率為何?
Ans:

44
(四) 條件機率(Conditional Probability)

條件機率的定義
令A、B為定義於樣本空間的事件,已知發生事件B之後再發生事件
A的機率,稱為事件A的條件機率,可表示為:
P( A ∩ B )
P(A B ) = P (B ) ≠ 0
P (B )

同理,若已知發生 A 再發生 B 的條件機率為:


P( A ∩ B )
P(B A) = P ( A) ≠ 0
P ( A)

圖 5.5 事件 A 的條件機率 圖 5.6 事件 B 的條件機率

Example (模具狀況與產品品質)
問已知在模具狀況佳或狀況差的條件下,良品與瑕疵品的機率各為何?
Ans:

45
五.事件的性質和事件機率的運算

(一) 事件的性質
一個事件依其與其他事件的關係可區分為獨立事件 (independent event),相
依事件 (dependent event)及互斥事件 (mutually exclusive event)三種。

 獨立事件
獨立事件
獨立事件係指一事件的發生不影響其他事件發生的機率。

獨立為統計上的概念,無法畫圖。數學上的定義如下:
兩事件獨立
若A、B兩事件合乎於下列任一條件,則A、B互為獨立。

(a) P( A B) = P( A)

(b) P( B A) = P( B)

(c) P( A ∩ B) = P( A) ⋅ P( B)
條件(a)是表示 A 的條件機率等於其邊際機率。條件(b)表示 B 的條件機率等
於其邊際機率;條件(c)是表示 A 與 B 同時發生的機率,等於 A 發生機率與 B 發
生機率的乘積。三條件中若任一條件成立,則其他二條件必定成立,因此,三條
件中任一條件成立,則 A、B 事件互為獨立。
三事件獨立
若A、B、C三事件合乎下列四條件,則A、B、C互為獨立。
(a) P( A ∩ B) = P( A) ⋅ P( B)
(b) P( A ∩ C ) = P( A) ⋅ P(C )
(c) P( B ∩ C ) = P( B) ⋅ P(C )
(d) P( A ∩ B ∩ C ) = P( A) ⋅ P( B) ⋅ P(C )
上述條件說明 A、B、C 三事件除須滿足兩事件獨立之條件外,仍須滿足第
四條件,此即表示事件 A、B、C 互為獨立的條件是:這三個事件的交集的機率
等於這三個事件的機率的乘積。應該注意的是,事件若不獨立,表示各事件互有
關係,但並不一定指各事件具有因果關係。

46
Example
自 52 張撲克牌中抽取 2 張牌。抽出不放回,設事件 A 為抽取的第 1 張牌為老 K,
事件 B 為抽取的第 2 張牌為老 K。問 A,B 二事件的相互關係為何?又若自撲克
牌中以抽出放回的方式抽取2張,則 A,B 事件關係又為何?
Ans:

 相依事件(dependent event) → 不獨立


上述二事件獨立的 3 條件中,若有一不成立或皆不成立,則事件 A 與事件
B
為相依事件,或稱為從屬事件。

 互斥事件(Mutually exclusive)
事件不會同時發生的稱為互斥事件。亦即若事件之交集為空集合者,則事件
為互斥事件。
互斥事件
如果事件沒有共同的元素(樣本點),則稱為互斥事件。
i.e P ( A ∩ B ) = 0

▲互斥事件與獨立事件之關係
互斥事件與獨立事件間的相互關係可分為三種,說明如下:
(a) 若 A,B 獨立,則 A,B 不互斥。
若 A,B 獨立,則 P( A ∩ B) = P( A) ⋅ P( B) ,但因 P( A) ≠ 0 , P( B) ≠ 0 ,則
P( A ∩ B) ≠ 0 ,所以 A、B 不互斥。但若 A、B 不互斥,A、B 不一定獨立。
(b) 若 A,B 互斥,則 A,B 不獨立。
若 A 、 B 互 斥 , 則 P( A ∩ B) = 0 , 只 要 P( A) ≠ 0 , P( B) ≠ 0 則
P( A ∩ B ) ≠ P( A) ⋅ P ( B ) ,因此不獨立,反之,則不成立。
(c) 若 A,B 獨立,則 A 與 B , A 與 B,A 與 B 均獨立(證明請參見課本練習題)
( A, 與 B, ) ( A, 與 B) ( A 與B, )
P( A, ) = 1 − ( A)

47
▲互斥會獨立嗎?
P( A ∩ B) = P( A) ⋅ P( B) → 獨立
P ( A ∩ B ) = Ø → 互斥
P ( A) 、 P(B) 任一個為零 → 互斥又獨立
∴ 非零的兩個事件 → 互斥不會獨立或獨立不會互斥

(二) 事件機率的運算

 互補事件(complementary event)/餘集合
設 A 為某一事件,則其餘集合 A 發生的機率為:

()
P A = 1 − P ( A)

 加法定理 → A、B 兩事件的聯集


(1) 兩事件的聯集:
P( A ∪ B) = P( A) + P( B) − P( A ∩ B)
該定理指出,A、B兩事件聯集( A ∪ B ) 的機率(A 或 B 發生的機率)等於
A 發生的機率加上 B 發生的機率,再減去A與B同時發生的機率。如果事
件A與事件B互斥,則 P( A ∪ B) = P( A) + P ( B ) 。

(2) 三事件聯集:
P( A ∪ B ∪ C ) = P[A ∪ (B ∪ C )]
= P( A) + P( B ∪ C ) − P[A ∩ (B ∪ C )]
= P( A) + P( B) + P(C ) − P( B ∩ C ) − P[( A ∩ B ) ∪ ( A ∩ C )]
= P( A) + P( B) + P(C ) − P( A ∩ B ) − P(B ∩ C ) − P( A ∩ C ) + P( A ∩ B ∩ C )
如果 A、B、C、互斥,則 P( A ∪ B ∪ C ) = P( A) + P( B) + P(C )

Example
澤利公司欲徵聘經理人員,應徵人員須具備三種條件:大專學歷(A),領導能力
(B),溝通能力(C)。根據應徵人員的資料,具 A,B,C 三種特質的比例各為 0.38,
0.2,0.3;至少有兩項特質的比例為 0.15;至少一項特質的比例 0.7。試求同時具
備三種特質的機率。
Ans:

48
 乘法定理
乘法定理亦可分為兩事件及三事件。
(1) 二事件的交集

P ( A ∩ B ) = P (B ) ⋅ P ( A B )

如果 A、B 獨立 (P( A B ) = P( A)) ,則

P ( A ∩ B ) = P ( A) ⋅ P (B )

該定理指出 A、B 兩事件交集 ( A ∩ B ) 的機率(A 與 B 同時發生的機率)等


於 B 發生的機率再乘上 A 的條件機率(B 發生後再發生 A 的機率)

(2) 三事件的交集

P( A ∩ B ∩ C ) = P( A) ⋅ P(B A) ⋅ P(C A ∩ B )

如果 A、B、C 獨立,則
P( A ∩ B ∩ C ) = P( A) ⋅ P(B ) ⋅ P(C )

49
Example
請根據下表,計算 P (男性 ∩ 大專以上 ∩ 經理人員)。

台灣地區就業者之職業及教育程度
教 育 程 度
職 業 別 高中職以下 大專以上 合 計
男性: 3,891 1,709 5,600
經理人員 162 189 351
非經理人員 3,729 1,520 5,249
女性: 2,654 1,358 4,012
經理人員 34 42 76
非經理人員 2,620 1,316 3,936
Ans:

 分割定理 → 貝氏定理的基礎(也可稱總合機率定理)
r
若 A1 ,  , AR 為分割集合,B 為一事件,則 P( B) = ∑ P(B ∩ Ai ) ,且由
i =1

P( B ∩ Ai ) = P( Ai ) ⋅ P(B Ai ) ,故

P( B) = ∑ P( B ∩ Ai ) = ∑ P( Ai ) ⋅ P(B Ai )
r r

i =1 i =1

Example

1. 證明:若A與B為獨立事件,則
(1) A 與B’為獨立事件,
(2) A’與B為獨立事件,
(3) A’與B’為獨立事件。

50
Ans:

2. 已知 A、B 兩事件的機率如下:
1 1 1
P( A ∩ B) = P( A ∩ B' ) = P( A'∩ B) =
6 12 2
A’ 和 B’ 為 A、B 的互補事件 (complementary event),請問:
(1) P( A ∪ B)
(2) P ( A'∪ B ' )
(3) P ( A'∩ B ' )
(4) 事件 A 對事件 B 的條件機率 P(A|B)
(5) Are A, B mutually exclusive events? Are A, B independent events?

Ans:

3. 設A、B與C為樣本空間Ω中的事件 P(A) = 0.5,P(B) = 0.4,P(C) = 0.3,A與B


為獨立事件,A 與C 為互斥事件,P(B ∩ C) = 0.05。試求:
(1) P(A’ ∪ C) (2) P(B’ ∪ C) (3) P(B’| A) (4)P(C’| B) (5) P(A |C’)
Ans:

51
4. 設 X、Y 為隨機變數且聯合機率分配表如下,請問 X、Y 是否獨立?並編制
條件機率表。
p( X ∩ Y ) Y
1 2 3
X 1 0.2 0.2 0.1
2 0.1 0.3 0.1

Ans:

52
六.貝氏定理 (Bayes’ Theorem)

貝氏定理 (Bayes’ theorem)即是說明如何由新資訊修正事前機率而得到事後


機率的方法。為了說明貝氏定理,先舉例說明如下:
設海山唱片公司現在正要推出一張新唱片,行銷經理李小姐正在做企劃案。
她希望知道此新唱片成功與失敗的機率。根據過去的經驗,推出的新唱片有 60%
是成功的,40%是失敗的。
我們設假:
事件 A1 :上市成功
事件 A2 :上市失敗
依據以上之資料可得:
P( A1 ) = 0.6 , P( A2 ) = 0.4

P( A1 ) 與 P( A2 ) 稱為事前機率。如下表所示。
新唱片上市成功的機率
上市情況 機率
成功 0.6
失敗 0.4
合計 1.00

該公司在推出新唱片之前,都會進行市場調查。市場調查並非百分之百正確,根
據過去經驗,若推出成功,調查結果客戶(歌迷)喜歡的機率為 90%,而客戶不喜
歡的機率為 10%,反之,若推出失敗,客戶不喜歡的機率為 70%,客戶喜歡的機
率 30%。假設:
事件 B :調查報告為客戶喜歡
事件 B :調查報告為客戶不喜歡
上述調查報告的機率可以條件機率表示,如下表所示。
表 新唱片上市成功與調查報告
上市成功( A1 ) 上市失敗( A2 )

0.90 = P(B A1 )
客戶喜歡( B )
0.30 = P( B A2 )

客戶不喜歡( B )
(
0.10 = P B A1 ) 0.70 = P( B A2 )

合計 1.00 � 1.00

海山唱片公司關心的是,調查報告是客戶喜歡而上市會成功的機率為何?以及調

53
查報告是客戶喜歡而上市會失敗的機率又為何?換句話說,即是求 P( A1 B) 、

P( A2 B)。此乃是求調查報告為客戶喜歡(事件 B)之後再發生上市成功( A1 )或上市

失敗( A2 )之機率,此機率為經過 B 事件(市場調查報告為客戶喜歡)後修正 A1 與


A2
事件發生之機率,故稱為事後機率。

上市成功與失敗的聯合機率分配表
上市成功( A1 ) 上市失敗( A2 )

客戶喜歡( B ) P( B ∩ A1 ) = 0.54 P( B ∩ A2 ) = 0.12 P( B ) = 0.66

客戶不喜歡( B )
P( B ∩ A1 ) = 0.06 P( B ∩A 2 ) = 0.28 P( B) = 0.34

P( A1 ) = 0.60 P( A2 ) = 0.40 1.00

P ( B ∩ A1 ) 0.54
P ( A1 B ) = = = 0.82
P( B) 0.66
同理可得,調查報告為客戶喜歡而上市失敗的機率為:
P( B ∩ A2 ) 0.12
P( A2 B) = = = 0.18
P( B) 0.66

54
貝氏定理的樹枝圖
事前機率 新的訊息 聯合機率 事後機率

P( B A1 ) = 0.9 P( A1 ∩ B)

= P ( A1 ) ⋅ P( B A1 ) P( A1 B) = 0.82

P( A1 ) = 0.6 = 0.6 × 0.9 = 0.54

P ( A1 ∩ B )

P( B A1 ) = 0.1 = P ( A1 ) ⋅ P( B A1 ) P( A1 B) = 0.18

= 0.6 × 0.1 = 0.06

P( B A2 ) = 0.3 P( A2 ∩ B)

= P( A2 ) ⋅ P( B A2 ) P( A2 B) = 0.18

P( A2 ) = 0.4 = 0.4 × 0.3 = 0.12

P( A2 ∩ B)

P( B A2 ) = 0.7 P( A2 ) ⋅ P( B A2 ) P( A2 B) = 0.82

= 0.4 × 0.7 = 0.28

現在我們將貝氏定理一般化至 r 個互斥事件, A1 ,  , Ar 的實驗上,可得貝氏定理


如下:

55
貝氏定理

若已知 A1 ,  , Ar 為本空間的分割集合,B為某事件,且已知 P( Ai ) 及

P( B Ai ) ,則B條件下發生事件 Ai 之機率表為 P( Ai B ):

P( B ∩ Ai ) P( B ∩ Ai )
P( Ai B ) = =
P( B) P( B ∩ A1 ) + P( B ∩ A2 ) +  P( B ∩ Ar )

P( Ai ) P( B Ai )
=
P( A1 ) P( B A1 ) + P( A2 ) P( B A2 ) +  + P( Ar ) P( B Ar )

式中: P( Ai ) :事前機率, P( B Ai ) :條件機率, P ( Ai B ) :事後機率。

Example
1. 有甲、乙、丙三個箱子,甲箱中有兩個黑球、乙箱中有兩個白球、丙箱中有
一個黑球一個白球,今天隨機選出一箱用布蓋住,隨機抽出一球,是黑球,
該黑球來自甲箱的機率為何?

Ans:

2. 康康公司委託三個工廠代工生產同一產品,第一家工廠的委託量佔 40%,不
良率為 1%;第二家工廠的委託量佔 35%,不良率為 2%;第三家工廠的委
託量佔 25%,不良率為 3%。月底時,三個工廠依照委託量如期交貨。康康
公司的品檢員,從交貨產品中隨機抽出一個檢驗。
(1) 試問此一產品為不良品之機率為多少?
(2) 如果已知此一產品為不良品,試問它是由第一家工廠生產出來之機率為
多少?

56
Ans:

3. .(政大財管)現有一種 AIDS 試劑,對患者測試有 99%呈陽性反應,而對非


患者測試有 98%呈陰性反應。若已知某地 AIDS 患者佔 4%,今在該地隨機抽
取一人,經測試呈陽性反應,請問此人未患 AIDS 的機率為何?
Ans:

4.(台大商研)狗園有兩種狗,黑色跟白色。其中有六成公狗為黑色,七成母
狗為白色。已知兩隻白狗生出的小狗必為白色,兩隻黑狗所生的小狗有五成是
黑色,兩隻狗顏色不同的話,有四成會生出黑色。今天隨機抓一隻小白狗,請
問其父母顏色不同的機率。

Ans:

57
Chapter 5 Some Important Discrete Probability Distribution

一. 隨機變數的意義和種類。
二. 間斷隨機變數的機率分配。
三. 常用的間斷機率分配 二項
超幾何
Poisson

一. 隨機變數的意義和種類

(一) 意義
隨機變數 (Random variable;R.V.)
隨機變數是隨機實驗中對應樣本點的實數值函數。

表 5.1 投擲銅板的隨機實驗
樣本點 正面的個數( x ) 相對次數(機率)

(反,反) 0 1 / 4 = 0.25
(正,反)(反,正) 1 2 / 4 = 0.50
(正,正) 2 1 / 4 = 0.25
N =4 1.00

隨機變數一般以大寫英文字母 X 表示。隨機變數之所有可能的數值稱為隨
變量,以小寫英文字母x表示。例如擲 1 枚銅板 2 次,其結果有 4 個樣本點
(正,正)、(正,反)、(反,正)、(反,反)。令 X 為出現「正面」的個數,則x=0,1,2。
X 就是隨機變數,0,1,2 即為隨機變量。

58
圖 隨機變數

隨機變數是指其變量 x 的發生是「隨機」的。而所謂隨機是指各變量的發生
是「隨」著 (根據、依循或服從 (follow)) 某一「機率」而發生。統計學上經常會
利用隨機變數的概念。如自大學教授中抽出 1 人,觀察其特質 (即為隨機實驗),
這些特質就是隨機變數,其中有些是質的變數,如性別、學歷;有些是量的變數,
如薪資、年資。

Example
表 自用小客車違規被舉發情形
被舉發次數 相對次數(%)

0 42.2
1 26.0
2 15.4
3 8.5
4 及以上 6.9

若自母體中隨機抽取一輛車,此一行為即為一隨機實驗。令 X 表示此一車輛
違規被舉發的次數,如表 6.2 所示。而 X 的值為 (0,1,2,3,4 ) 中的任一個。此一
數值到底為何,則視哪一輛車被抽出而定,亦即須視隨機實驗的結果而定,所以
X稱為隨機變數, ( 0,1,2,3,4 ) 為隨機變量。

(二) 種類

59
間斷隨機變數
隨機變數的變量其個數是有限的,或個數是無限但可數的,稱為間斷
隨機變數或不連續隨機變數。

舉例說明:
隨機實驗 隨機變數 隨機變數X可能的值
1 枚銅板擲 2 次 出現正面的次數 0,1,2
抽取 10 台印表機檢查品質 不良品的個數 0,1,2,  ,10
購買手機的顧客的性別 性別 0 為男性,1 為女性
咖啡廰 1 天的顧客 顧客人數 0,1,2, 

②連續隨機變數
隨機變數的變量其個數為無限且不可數的,稱為連續隨機變數。通常以
一個區間來表示。

舉例說明:
隨機實驗 隨機變數 隨機變數 X 可能的值
觀察病人侯診時間 等侯時間 x≥0
抽取 1 個廠商的年營業收入 營業收入 x≥0
抽取 1,250ml 瓶裝汽水 汽水容量 ml 0 ≤ x ≤ 1,250

若依隨機變數的個數來分:
在討論隨機變數時可依變數的個數分為單一隨機變數,二元隨機變數及多元
隨機變數等 3 種。當變數的個數只有 1 個時稱為單一隨機變數,如投擲銅板,令
X為出現正面的個數,此時變數只有 1 個。當變數的數目為 2 個時稱為二元隨機
變數,如抽取一個就業者,令X為其薪資收入,Y為其工作年資。本課程只會講
授單一,二元隨機變數

二. 單一間斷隨機變數的機率分配

接著我們要探討間斷隨機變數在各個變量發生的機率,即所謂的機率分配
(probability distribution),即預期各變量發生的機率,以及隨機變數在某一值域
內發生的機率。
間斷隨機變數的機率分配
單一間斷隨機變數的機率分配是表示,間斷隨機變數的各個變量的發生
機率(或相對次數)的分布情形。

60
Example

現令隨機變數 X 為林先生每月的銷售量,X 可能的值為 0,1,2,3,4,5, 6,  , ∞。


若林先生知道 X 各變量發生的機率(X 的機率分配),則可根據此一資料做出更有
效的行銷計劃。
首先,他將過去 5 年的銷貨報表找出來,依據第 3 章次數分配表的建立方
法依銷售量分別統計,結果如下表。
表 林先生的汽車銷售量
A B
1 每月銷售量 相對次數
2 0 0.11
3 1 0.42
4 2 0.30
5 3 0.08
6 4 0.04
7 5 0.03
8 6 0.02
9 合計
1.00
其次,由於母體資料的相對次數為理論或實際機率,因此上表的相對次數表
可以寫成如下表的一個機率分配表。表中的 f (x) 表示隨機變數 X 為某特定值的
機率,稱為間斷機率函數。例如 X=0 的機率為 0.11,以 f (0) = 0.11 表示之。
表 汽車銷售量的機率分配
A B C
1 隨機變量 x 相對次數 機率 f (x)
2 0 0.11 0.11
3 1 0.42 0.42
4 2 0.30 0.30
5 3 0.08 0.08
6 4 0.04 0.04
7 5 0.03 0.03
8 6 0.02 0.02
9 合計
∑ = 1.00 ∑ f (x) = 1.00
X=1,其機率為 0.42,即 f (1) = 0.42 。由該表可知,林先生每月各個可能銷售量
的機率。其機率分配亦可以圖來表現,如下圖所示。

61
圖 汽車銷售量的機率分配

(一) 間斷隨機變數的機率密度函數 (probability density function;p.d.f.)

以下我們根據規範機率函數的公理來定義間斷隨機變數的機率函數。

間斷隨機變數的機率函數
設間斷隨機變數X,隨機變量為 x1 ,  , x n ,對應 xi 的每一數值有唯一
的機率與之對應,該機率值表為 f ( X = xi ) 或 f ( xi ) ,並滿足下列三
個條件:
(a)① 0 ≤ f ( xi ) ≤ 1 ③(c) P( X = x0 ) = f ( x0 )
注意等號
n
(b)② ∑ f ( xi ) = 1
i =1

則 f (x) 為 X 之機率函數或稱機率分配。
(a)式說明各變量的機率值介於 0 與 1 之間。(b)式表示各變量的機率總和
等於 1。

Example 由剛剛林先生賣車的例子,可知
n

∑ f (x ) =
i =1
i f (0) + f (1) + f (2) + f (3) + f (4) + f (5) + f (6)

= 0.11 + 0.42 + 0.30 + 0.08 + 0.04 + 0.03 + 0.02


=1
故它亦滿足條件,因此知其為一機率函數。
根據機率函數可求某一值域之機率,亦即: 注意等號

62
P ( a ≤ X ≤ b) = ∑ f (x )
xi ∈( a ,b )
i

若林先生認為正常銷售量為 1 輛至 3 輛,則正常銷售量的機率為:
P (1 ≤ X ≤ 3) = 0.42 + 0.30 + 0.08 = 0.8

(二) 間斷隨機變數的累加機率函數 (Cumulative distribution Function;CDF)

現在如果林先生關心的不僅是每月的銷售量,而且也關心每月銷售量少於等
於 3 輛的機率,那麼,我們除了求取各個銷售量的機率分配外,並且必須求各銷
售量的累加機率函數(cumulative probability function)。
間斷隨機變數的機率函數表為 f (x) ,其累加機率函數表為 F (x) :
間斷隨機變數的累加機率函數
F ( X = xi ) = F ( xi ) = P ( X ≤ xi ) = f ( x1 ) + f ( x 2 ) +  + f ( xi )

累加機率函數 F (x) 的特性:

①(a) F ( x0 ) = 0 x0 < x1

②(b) F ( x n ) = 1

③(c) 如果 x j ≥ xi ,則 F ( x j ) ≥ F ( xi ) 。

④(d) f ( xi ) = F ( xi ) − F ( xi −1 ) , xi −1 為 xi 的前一個變量, xi −1 < xi 。


上面 (a) 式表示小於起始點的累加機率等於 0, (b)式表示累加到最大值 x n
時的機率等於 1,(c)式表示如果第 j 個隨機變量大於等於第 i 個隨機變量,則
第 j 個的累加機率大於等於第 i 個的累加機率,換言之,累加機率函數為一非
遞減函數 (nondecreasing function),(d) 式則表示某變量的機率可以該變量的
累加機率減掉前一個變量的累加機率而求得。

Example (每月汽車銷售量的累加機率分配)
在上例中,每月汽車銷售量等於 3 輛或少於 3 輛的機率為何?

Ans:

(三)間斷隨機變數的期望值 E(x) 和變異數 V(x)

隨機變數的平均數又稱期望值,是該隨機變數的各個隨機變量以其發生之

63
機率為權數的加權平均數。

期望值
期望值是指,如果我們不斷的進行多次的實驗,預期會發生或觀察得
到的數值或結果。

間斷隨機變數的期望值
n
E ( X ) = ∑ xi f ( xi ) = µ
i =1

式中: X 為間斷隨機變數, f ( xi ) 為機率函數。

Example 已知各個汽車銷售量的機率分配,請問「預期銷售量」為多少?

表 林先生每月汽車銷售量的機率分配
A B C
1 隨機變量 x 機率函數 f (x) x f (x)
2 0 0.11 0.00
3 1 0.42 0.42
4 2 0.30 0.60
5 3 0.08 0.24
6 4 0.04 0.16
7 5 0.03 0.15
8 6 0.02 0.12

9 合計
∑ f (x) = 1.00 ∑ xf (x) = 1.69

Example

擲 2 個銅板一次,令 X 為出現正面個數,即令 X = 0,1,2 ,若銅板無偏,則 X 之

64
機率函數如表 6.9 所示。問其出現正面的期望值為何?
表 6.9 銅板的機率分配
x f (x)
0 1/4
1 2/4
2 1/4
Ans:

Example
X
1. 假設離散型隨機變數 X 之機率密度函數為 f ( X ) = , X=1, 2, 3, 4。
10
(1) 請繪製f (X)的長條圖。
(2) P(0≤ X <2.5)
Ans:

2. 假設離散型隨機變數X 之機率質量函數為 f ( X ) = cX 2 , X= 2, 3, 4。求c值。


Ans:

1
3. 假設離散型隨機變數 X 之機率質量函數為 f ( X ) = , X = -1, 0,1。試求
3
E( X 2 ) 。
Ans:

65
4. 黃小姐在一家保險公司任職,她的工作是計算被保險人的費用,假設王先生
要投保汽車意外險 300 萬元,且黃小姐由過去資料得知,每 5000 位駕駛人會發
生 3 次意外,請問保險公司每年要跟王先生收取多少保費才不虧本?

Ans:

 變異數和標準差
隨機變數的變異數是衡量機率分配的統計測量數,一般表為 V ( X ) ,或 σ 2 ,其
公式如下:
間斷隨機變數的變異數
n 2

V ( X ) = ∑ ( xi − µ ) f ( xi )
i =1

[ ]
V ( X ) = E ( X − µ ) = E ( X 2 ) − [E ( X )]
2 2

簡單計算公式為:
n 2

V ( X ) = ∑ ( xi − µ ) f ( xi )
i =1
n
= ∑ xi2 f ( xi ) − µ 2 = E ( X 2 ) − [E ( X )]
2

i =1

66
間斷隨機變數的標準差

n
σ = σ2 = ∑ (x
i =1
i − µ ) 2 f ( xi )

Example 承剛剛的汽車銷售問題,已知林先生每月預期可賣汽車 1.69 輛,現進


一步要問該銷售量穩定嗎?

Ans: 以林先生的銷售資料而言,依上式可求得變異數與標準差如下:

表 6.13 每月汽車銷售量的變異數
A B C D E
1 X x−µ ( x − µ) 2
f (x) ( x − µ ) 2 f ( x)
2
3
4
5
6
7
8
9

Example (兩個銅板出現正面的變異數) 求兩個銅板出現正面的變異數。

Ans: 可得其變異數如下:

V ( X ) = ∑ xi2 f ( xi ) − µ 2

1 2 1
= 0× + 1 × + 4 × − 1 = 0.5
4 4 4

(四) 若 R.V.為-函數,如何計算 E(X),V(X)?

有時侯統計分析人員或決策者對某些隨機變數的函數形式,可能比對隨機變
數本身更有興趣。例如設 X 為銷售量,則銷售收益為銷售量函數表 h( X ) ,因 X
為一隨機變數,故 h( X ) 亦為一隨機變數。公司老闆對銷售收益 h( X ) 可能比對銷
售量 X 更有興趣。

67
隨機變數函數的期望值
設 X 為間斷隨機變數,其機率函數為 f (x)。令 h( X ) 為 X 的函數,則 h( X )

的期望值表為 E [h( X )] 或 µ h ( x ) :

n
E [h( X )] = ∑ h( xi ) f ( xi )
i =1

Example (銅板出現正面的期望值)
擲一枚銅板兩次。令 X 為出現正面的次數,其機率函數如下表。又令 Y = ( X − 1) 2 ,
問 E (Y ) 為何?
表 銅板出現正面的機率函數
X f (x)
0 1/4
1 2/4
2 1/4
Ans:

隨機變數函數期望值的定理
設 C 為常數, h( X ) 為 X 的函數,則
(1) E (C ) = C
(2) E [C ⋅ h( X )] = C ⋅ E [h( X )]
(3) E [h1 ( X ) + h2 ( X ) +  + hk ( X )] = E [h1 ( X )] +  + E [hk ( X )]
式中: h1 ( X ), h2 ( X ), , hk ( X ) 均為 X 的函數。

68
Example

1. 設 X 為間斷隨機變數,其期望值為 5,變異數為 2,試求 E(5), E(5X),


E(X2+2X+1)。

Ans:

[
2. 設 X 為間斷隨機變數請證明 V ( X ) = E ( X − µ )2 = E (X 2 ) − µ 2 。 ]
Ans:

隨機變數函數的變異數
設 X 為間斷隨機變數,其機率函數為 f (x) ,令 h( X ) 為 X 的函數,則
h( X ) 的變異數為:

σ h2( X ) = V [h( X )] = E [h( X ) − E [h( X )]]2

隨機變數的函數形式雖然有很多,但人們最常用的是線性函數,即:
h( X ) = a + bX
線性函數的期望值與變異數為:
線性函數的期望值
E [h( X )] = E (a + bX ) = a + bE ( X )
線性函數的變異數
V [h( X )] = V (a + bX ) = V (bX ) = b 2V ( X )

證明如下:
E (a + bX ) = E (a ) + E (bX ) = a + bE ( X )

69
V (a + bX ) = E [(a + bX )] − E [(a + bX )]
2

= E [(a + bX ) − (a + bE ( X ))]
2

= E [a + bX − a − bE ( X )]
2

= E [b( X − E ( X ))]
2

[
= E b 2 ( X − E ( X )) 2 ]
= b 2 E ( X − E ( X )) 2
= b 2V ( X )

Example

1. 某一賭局,投擲一個公正的六面體骰子一次,若出現的點數為 x,則可得 x
元。試求:
(1) E(X)
(2) V(X)
(3) 若每賭一次需 4 元,則損益金額 Y=X – 4。求 E(Y)
(4) V(Y)
(5) V(2X − 4)
Ans:

X2
2. (補充應用題) f ( X ) = , X=1, 2, 3,求中位數、眾數與 P (1 < X ≤ 3) 。
K
Ans:

70
3.(補充應用題,期望值與貝式定理混和題)有一個猜瓶子的遊戲,A 瓶中有 8
個紅球,2 個白球。B 瓶中有 4 個紅球,6 白球,如果將一個瓶子拿出來用布蓋
住,你來猜是 A 瓶還是 B 瓶,猜中與否賞罰金額如下:
出現 A 出現 B
猜A 30 -18
猜B -6 24

(1) 請問該猜 A 還是猜 B?期望賞金為多少?


(2) 如果從該瓶中拿出一顆球,發現是紅球,那該瓶是 A 瓶的機率為何?是 B 瓶
的機率為何?
(3) 如果拿出的球是紅球,那你應該猜這個被布蓋住的瓶子是 A 瓶還是 B 瓶?
(4) 如果拿出的是紅球,這個資訊對你而言值多少錢? (思考方向:你最多願意
花多少錢去買這個資訊,讓你的猜中的期望值大於零?)

Ans:

三. 常見的間斷機率分配

是不是每個隨機實驗或每個事件都必須依照前述的方法,去求取隨機變數
的機率分配及其測量數呢?是否有已經建立了的機率模式可供套用呢?人們在
面對實際的問題時,經常會發現許多問題表面上看起來似乎不大相同,然而,
實質上卻具有許多相同的特徵。同樣的,在我們隨機實驗中,有些隨機實驗的
過程往往具有相同的特性,其隨機變數有類似的機率分配,它們廣泛的被使用
於各種不同的決策。可以說是機率分配的套裝。

(一) 二項分配 (Binomial Distribution)


先舉例說明:(1) 從產品中抽 10 個,檢查不良品的個數。
(2) 隨機抽 500 個學生,調查參加研究所考試的人數。
(3) 這些實驗都是只有 2 種結果,不是成功就是失敗。

71
 二項分配的特性:

二項隨機實驗具有如下 5 個特性:
(a) 實驗中包含 n 次相同的試行。
(b) 每一次試行只有二種互斥的可能結果,不是成功(表示為 S),就是失敗(表
示為 F)。
(c) 成功的機率為 P( S ) = p ,失敗的機率為 P ( F ) = 1 − p (或表為 q ),且每次試
行的機率均相同。
(d) 每一次試行是獨立的。
(e) 隨機變數定義為 n 次試行中成功的次數。
實驗只做一次,又叫點二項分配

合乎上面二項實驗中的 (b) 項者稱為白努里試行 (Bernoulli trial)。而二項實



則是做 n 次白努里試行後成功的次數。令隨機變數 X 為 n 次試行中成功的次
數,則 X 為二項隨機變數,其機率函數稱為二項機率分配。

Example (保險業)

根據最近的經驗,林小姐成功的機率為 0.2。現她準備拜訪 3 位潛在客戶。問林


小姐這 3 次拜訪全部成功機率為何?全部失敗的機率又是怎樣?

 由以上的例子,可以導出二項分配的通式。

二項機率分配
設 X 為一間斷隨機變數,若 f (x) 為:

f ( x) = C xn p x q n − x x = 0,1,2,  , n (6.15)

n!
則 f (x) 為一二項機率分配。式中: C xn = , n :試行次數,
x!(n − x)!
x :成功的次數, p :成功的機率, q :失敗的機率 = 1 − p 。
(n − x) :失敗的次數。

該二項機率分配為一機率函數滿足機率的二個條件:
(a) 0 ≤ f ( x) ≤ 1

72
n n
(b) ∑ f ( x) = ∑ C
x =0 x =0
n
x p x q n− x = ( p + q) n = 1

二項機率分配可簡單表示為 B( X ; n, p ) ,其中 X 為隨機變數。

Example

1. (Binomial Dist.) 根據消費者調查顯示,在購買送禮用水果禮盒時,只有 22%


的消費者會購買已經包裝好的禮盒,其餘的會自行挑選再裝盒。若 QQ 水果
行每天會準備 20 盒已經包裝好的水果禮盒,且每天約有 32 人來購買水果禮
盒,且一人只買一盒,則 10 個顧客會買已經包裝好的禮盒的機率是多少?

Ans:

 二項分配的累加機率函數

F ( x) = p( X ≤ x) = ∑ f (x )
xI ≤ x
i

Example

1. (Binomial Dist.) 使用剛剛的例子,請問至少有兩個以上的顧客願意投保的機


率有多少?

Ans:
 二項分配的 E ( X ) 和 V ( X )

設 X 為一二項機率函數即 X ~ B(n, p ) ,其平均數與變異數為:


平均數
E ( X ) = np
變異數
V ( X ) = npq

【Proof】
(a) 期望值
n n n
n!
E ( X ) = ∑ xf ( x) = ∑ xC xn p x q n − x = ∑ x p x q n− x
x =0 x =0 x =0 (n − x)! x!
n
n(n − 1)! n −1
(n − 1)!
=∑ p x q n − x = np ∑ p y q n −1− y
x =1 ( n − x )!( x − 1)! y = 0 ( n − 1 − y )! y!

73
(令 y = x − 1)
= np ( p + q ) n −1 (利用 (n − 1) 次方的二項展開式)
= np
(b) 變異數
n n
V ( X ) = ∑ ( x − µ ) 2 f ( x) = ∑ x 2 f ( x) − µ 2 (1)
x =0 x =0
n n
= ∑ x( x − 1) f ( x) + ∑ xf ( x) − µ 2
x =0 X =0

其中
n n n
n!
∑ x( x − 1) f ( x) = ∑ x( x − 1)C xn p x q n− x = ∑ x( x − 1)
x =0 x =0 x =0 (n − x)! x!
p x q n− x

n−2
(n − 2)!
= n(n − 1) p 2 ∑ p x−2 q n− x
x = 2 ( n − x )!( x − 2)!

= n(n − 1) p 2 ( p + q ) n − 2
(利用 (n − 2 ) 次方的二次展開式)
= n(n − 1) p 2 (2)
將 (2) 代入 (1) 可得:
V ( X ) = n(n − 1) p 2 + np − (np ) 2 = −np 2 + np = np (1 − p ) = npq

Example

1. (Binomial Dist.) 使用課堂的例子,若拉保險的小姐拜訪了 3 個客戶,則預期


會有幾個潛在客戶會買她的保險?潛在客戶的變異數和標準差又是多少?

Ans:

 二項分配的加法性 (Reproductive Property)


設 X 與 Y 均為二項隨機變數且獨立,其成功的機率均為 p ,即
X ~ B(n1 , p ) , Y ~ B(n2 , p )

74

X + Y ~ B(n1 + n2 , p )
Example

1. (Binomial Dist.的加法性)設甲工廠自 A、B 兩個供應商購買零件,而兩供


應商的不良率均為 0.1,現若該工廠自 A、B 供應商分別購買 5 件和 10 件,
那麼 15 件零件中,不良品的平均、變異數各為何?又,15 件中不良品超過
一件的機率為何?

Ans:

 白努里分配和二項分配的比較

白努里分配 二項分配
p.d.f
f ( x) = C 1x p x q 1− x = p x q 1− x x = 0,1 f ( X ) = C xn p X q n − X ,X=0, 1 ,

, n
E(X) p np
V(X) pq npq

證明白努里分配的 E(X),V(X)

E(X)= ∑ X ⋅ f (x) = 0 ⋅ p 0 q 1 + 1 ⋅ p 1 q 0 = p

E( X 2 ) = ∑ X 2 ⋅ f ( x) = 0 2 p 0 q 1 + 12 p 1 q 0 = p

∴V ( X ) = p − p 2 = p (1 − p ) = pq

(二) 超幾何分配 (Hypergeometric Distribution)

 意義
超幾何分配
C xK C nN−−xK
f ( x) = x = 0,1,  , n x≤K x≥ K +n−N (6.22)
C nN

75
圖 超幾何實驗

N=母體元素總數 隨機抽取 n=樣本數


K=成功的次數 x=成功的次數
N-K=失敗的次數 抽出不放回 n-x=失敗的次數

由上圖知, n 個樣本中, x 個 (具有某特質如瑕疵品)乃是來自母體的 K 個


(瑕疵品), n − x (無瑕疵品)則得自母體中的 N − K 個 (無瑕疵品)。

 條件

超幾何分配滿足機率的四個條件
(a) 0 ≤ f ( x) ≤ 1
n
C xK c nN−−xK C xK++nN− x− K C nN
n n
(b) ∑
x =0
f ( x) = ∑
x =0 C nN
=
C nN
= N =1
Cn
(因為 ∑ C ia C nb−i = C na +b )
i =0

(c) 母體元素個數有限。
(d) 抽出不放回

 二項分配和超幾何分配的比較

當母體為有限個數時(finite population),二項分配採“放回”的方式抽樣,
而超幾何分配採“不放回”的方式抽樣。

Example

1. Swarovski 公司進口 20 台切割機器,現為了檢查機器的品質,該公司的品管


人員自該批貨品中隨機抽取三台機器進行檢驗, 根據製造商的報告,20 台
產品的不良率為 0.1,請問檢驗三台機器不良品數(X)的機率分配為何?

Ans:

76
2. 設 10 種新上櫃交易的股票中 3 種會上漲獲利、7 種會下跌虧損 (Of course,
you don’t know which one will gain you money.) 假設計畫從 10 種中挑選 4 檔
買進,請問:(1) 此隨機實驗是 Binomial Dist.還是 Hypergeometric Dist.?(2)
3 種會上漲的股票全被選中的機率為何? (3) 3 種會上漲股票至少被選中 2 種
的機率為何?

Ans:

 超幾何分配的平均數 E(X)和變異數 V(X)

超幾何分配的平均數
K
E( X ) = n ⋅ (6.23)
N
超幾何分配的變異數
K N −K N −n
V (X ) = n ⋅ ⋅ ⋅ (6.24)
N N N −1

有限母體調整因子
(finite population correction factor;FPC)

【Proof】
(1) 期望值
−1
n
C K C N −K n
 N!  K!
E ( X ) = ∑ x x Nn − x = ∑ x  C nN−−xK
x =0 Cn x =1  n!( N − n)!  x!( K − x)!

−1
n
 N ( N − 1)!  K ( K − 1)!
= ∑   ⋅ ⋅ C nN−−xK
x =1  n( n − 1)!( N − n)!  ( x − 1)!( K − x)!

77
( K − 1)!
C nN−−xK
K ( x − 1)!( K − x)!
n
=n ∑
N x =1 ( N − 1)!
(n − 1)!( N − n)!

K n
C xK−−11C nN−−xK K n −1 C yK −1C nN−−1−Ky
=n
N

x =1
N −1
C n −1
=n
N

y =0 C nN−−11

(令 y = x − 1 )
K C nN−−11  n
 a  b   a +b  
=n 
N C nN−−11 
因為 ∑    =   
i = 0  i  n −i   n 
K
=n
N

(2)變異數
V ( X ) 可表為:
[
V ( X ) = E [X ( X − 1)] + E ( X ) − E ( X ) 2 ] (1)
其中
n
C xK C nN−−xK
E [X ( X − 1)] = ∑ x( x − 1)
x =0 C nN
K ( K − 1) n C xK−−22 C nN−−xK
= n(n − 1) ∑
N ( N − 1) x = 2 C nN−−22
K −2 N − K
K ( K − 1) n − 2 C y C n − 2− y
= n(n − 1) ∑
N ( N − 1) y =0 C nN−−22

(令 y = x − 2)
K ( K − 1)
= n(n − 1) (2)
N ( N − 1)
將(2)代入(1)可得:

V ( X ) = E [X ( X − 1)] + E ( X ) − [E ( X )]
2

K (k − 1) K N −K N −n
2
K  K
= n(n − 1) + n − n  = n
N ( N − 1) N  N N N N −1

Example

1. 承上,若買四種新上櫃股票,請問平均可買到幾張可獲利的股票?

Ans:

78
 二項分配和超幾何分配的再比較

前面說過“放回”和“不放回”是主要差別。若令
K N−K
=p = 1− p = q
N N
則超幾何的平均數為:
E ( X ) = np (1)
變異數為:
N −n
V ( X ) = npq ⋅
≤ npq (2)
N −1
相比可知,超幾何分配的平均數與二項分配的平均數相同,即為(1)式。
N −n
但因 < 1 ,所以超幾何分配的變異數小於二項分配的變異數,即(2)式。
N −1
N −n
試想若母體元素個數 N → ∞ 時,則 → 1 ,超幾何分配的變異數即等於二
N −1

分配的變異數。
由上式可知,當 N 很大時,二項分配可代替超幾何分配求得其機率值。在
實際應用時, N 應多大呢?這並沒有明確的答案,一般以樣本個數 n 相對於母體
個數 N 很小,如 n N ≤ 0.05 ,則可以二項分配代替超幾何分配而求其機率值。反
之,若 n N > 0.05 ,則為超幾何分配。

Example

1. 50 個 SIM 卡合格的只有 20 個,若任意抽取 20 個來檢驗,令 X 表示抽


到的 20 個中,合格的個數。
(1) 若今天一把抽出 20 個來檢驗,請寫出 X 的機率函數 f(X)(並說明為何
種分配)、E(X)、V(X)。
(2) 若看完一個記錄結果後放回,再抽出一個檢查,共 20 次,請寫出 f(X)
(並說明為何種分配)、E(X)、V(X)。

79
(三) 波松分配 (Poisson Distribution)

在我們的日常生活中,經常會碰到在一定時間或空間內,發生某些事件的可
能性的問題。例如 1 小時內打進來的電話次數,1 天內通過泰山收費站的汽車數,
又如 1 小時內到銀行提款的人數,1 天內來店喝咖啡的人數,上午 (4 小時內)到
醫院求診的病人數,1 年內飛機失事的次數,1 頁文件錯字的字數,30 年內地震
的次數等。這些事件都是在一定的連續區間內發生的,且事件的發生彼此互相獨
立,被稱為波松實驗。

 意義

若我們令 X 代表一段期間或空間內事件發生的次數,則 X 是一個波松隨機


變數,波松隨機變數的機率函數稱為波松分配。

 Poisson 隨機實驗的特性

波松隨機實驗具有下面 3 個特性:
(a) 在一連續區間發生事件的個數,與另一區間發生的個數是獨立的。
例如要研究 2:30~5:00 來店喝下午茶的人數,此時這段時間中的任一時
段裡,2:30~3:00 或 4:30~5:00 來店喝下午茶的人數,彼此是獨立的。
(b) 在一個連續續區間發生事件的期望值(平均數)與區間大小成比例。如 1
小時內來店喝下午茶的人數為 20 人,那麼 2 小時內來喝下午茶的人數
為 40 人。
(c) 在很短的區間內事件發生 1 個或不發生。例如在 0.1 秒非常微小的區間,
每一微小區間內喝茶的人數可能只有一人或一個也沒有。

 柏松機率分配

波松分配
設已知在一定的區間發生事件 A 的期望值為 λ ,令 X 為該區間發生事

的次數,則:
λx e −λ
f ( x) = x = 0,1,2,  , ∞ 。 (6.27)
x!
f (x) 為波松分配,其參數為 λ 。

柏松機率分配滿足下列兩個條件:
(a) 0 ≤ f ( x) ≤ 1

80
∞ ∞
λx e −λ ∞
λx ∞
λx
(b) ∑
x =0
f ( x) = ∑
x =0 x!
= e −λ ∑
x =0 x!
= e −λ e λ = 1 (因 ∑
x =0 x!
= eλ )

Example

研究發現台大醫院醫師的腫瘤化學治療藥品電腦處方中,藥師偵測到的處方
失誤平均一星期有 2.4 筆。試問一星期內發生有 5 筆電腦處方失誤的機率為何?
連續兩星期都沒有發電腦處方失誤的機率又為何?
Ans:

Example

1. 總機小姐在下午兩點到三點間平均會接到 90 通電話,因任何時間都可能有電
話進來,故假設其服從 Poisson 分配,請問:三分鐘內恰巧有兩通電話的機率

Ans:

 Poisson Distribution 的 E(X)、V(X)


波松分配的平均數
E( X ) = λ
波松分配的變異數
V (X ) = λ

【Proof】
(1)期望值

e −λ λx ∞
e − λ λ x −1
E( X ) = ∑x
X =0 x!
= λ∑
x =1 ( x − 1 )!
= λe −λ eλ = λ

λ x −1
(因 ∑ = eλ )
x =1 ( x − 1)!

(2)變異數

V ( X ) = E [X ( X − 1)] + E ( X ) − [E ( X )]
2


e −λ λx ∞
e −λ λ x−2
= ∑ x( x − 1) +λ −λ = λ ∑
2 2
+ λ − λ2
X =0 x! x = 2 ( x − 2 )!

81

λ x−2
(因 ∑ = eλ )
x = 2 ( x − 2)!

λ2 + λ − λ2 = λ

 加法性

設隨機變數X與Y均為波松隨機變數,其平均數分別為 λ1 , λ 2 ,且X與
Y相互獨立,則X+Y仍為一波松隨機變數,其平均數為 λ1 + λ 2 。
若X ⊥Y
X ~ Po(λ X ) (X 服從 Poisson Distribution)
Y ~ Po(λY ) (Y 服從 Poisson Distribution)
X + Y ~ Po(λ X + λY )

Example

1. (Poisson Dist.) Men (X1) arrive at a service centre according to a Poisson at an


average of 6 per hour, women (X2) arrive at a service centre according to a Poisson
at an average of 12 per hour, and children (X3) arrive at a service centre according
to a Poisson at an average of 12 per hour.
(1) Determine the probability that at least 2 customers arrive in a 5-minute period.
(2) If the centre opens at 9.00 a.m., determine the probability that Andy is the first
customer arriving at the centre after 9.10 a.m.

Ans:

2. 假設每天早上 6.30~8.30 與下午 17.30~19.30 尖峰時間的車禍,平均每小時兩


件,請問這兩段尖峰時間發生車禍的件數分配為何?其平均數、變異數為何?
又,一天兩段尖峰時間共發生兩件以上車禍的機率為何?

Ans:

82
 Poisson 分配和二項分配的比較

波松隨機變數為事件在連續區間內發生的次數,一個連續間是密接不分的,
事件可在區間任何一點發生,二個事件的發生可能密接在一起,然而若將該連續
空間細分為 n 個非常微小區間,且 n 很大 (n → ∞) ,使得事件的發生在微小區間
內只有兩種可能,發生或不發生。因此波松隨機變數可以看成是做 n 次( n 很大)
伯努力試行的二項隨機變數,換言之,波松分配可由 n 很大的二項分配導出,以
數學式表示為:
λ λ λx e −λ
lim C xn ( ) x (1 − ) n − x =
n →∞ n n x!
二項分配當 n 很大, p 很小時,會趨近於波松分配。換言之,當二項分配試行
次數 n 很大,成功機率 p 很小時,波松分配可以當作二項分配的近似分配。此
時可以 λ = np 的波松分配來計算二項分配的機率值。應用時, n 該多大? p 該
多微小呢?一般當 n ≥ 20 , np ≤ 1 ; n ≥ 50 , np ≤ 5 或 n ≥ 100 , np ≤ 10 時,即
可以波松分配代替二項分配。例如二項分配 n = 20 , p = 0.05 時,
λ = np = 20 × 0.05 = 1 ,此時可以 λ = 1 的波松分配來代替二項分配。
Example

1. 學生 5000 人,只有 100 人視力正常,今天隨機抽取 20 人,請問:


(1) 若此 20 人為一次抽取(不放回),其中 X 人視力正常之機率為何?
(2) 試用 Binomial Dist. 和 Poisson Dist. 估計。

Ans:

83
Chapter 6 Normal Distribution and Other Continuous

Distributions

一. 連續隨機變數的機率分配

連續隨機變數的機率密度函數與間斷機率函數不同。若 X 為間斷的隨機變
數,則 f ( X = x) = P( X = x),即 x 發生的機率為 f (x)。但若 X 為連續的隨機變數,
則 f (x) 並不代表 X = x 的機率,亦即 f ( X = x) ≠ P( X = x) ,此因 f (x) 代表 x 值的
機率度而非機率。只有在 x 的某一區間時,才可得出機率值。此可由上面的機率
曲線得知,曲線的高度為機率密度,曲線下的某一區間的面積為機率。

(一) 連續隨機變數的 p.d.f

連續隨機變數的機率密度函數
設 X 為連續隨機變數,其值為 a ≤ X ≤ b ,若 f (x) 滿足下列二條件:
(a) f (x) ≥ 0

∫ f (x )dx = 1
b
(b)
a

則 f (x) 為 X 的機率密度函數 (probability density function; p.d.f)。

Example
1. ASUS電腦調查Eee-PC電腦電池的使用壽命,今以隨機變數X表示其壽命。
其機率分配如下表,請問該機率分配f(x)是否為一機率密度函數?並請繪圖。
x f(x)
一年以下 0.40
1~3年 0.15
3~5年 0.10
5~7年 0.05

84
Ans:

(二) 連續隨機變數的 C.D.F.

設 X 為 連 續 隨 機 變 數 , X 之 機 率 密 度 函 數 表 為 f (x) , X 的 累 加 機 函 數
(cumulative probability function) 表為 F (x) :
連續隨機變數的累加機率函數
設 X 為連續隨機變數,其值為 a ≤ X ≤ b ,
x
F ( x) = P( X ≤ x) = ∫ f (t )dt
a

 累加機率函數的特性
(1) F(a)=0 表示起始點 a 點的累加機率為 0。
(2) F(b)=1 表示累加到最高值 b 點時的機率等於 1。
(3) 如果 c<d,則 f (c ≤ X ≤ d ) = F (d ) − F (c) 。
表示兩數值(兩點)c 與 d 間的機率,可以用 F(d)之累加機率函數值減去 F(c)之
累加機率函數值而求得。
dF ( x)
(4) f ( x) = 表示對 F (x) 微分可得 X 之機率密度函數。
dx

85
Example
1. 承上題,試求電池壽命的累加機率函數(CDF),又,試求使用壽命超過3年
的機率為何?

Ans:

(三) 連續隨機變數的 E(X)、V(X)

間斷隨機變數用一般代數處理,而連續隨機變數則用微積分處理。 設X為
連續隨機變數,其機率密度函數為 f (x) ,則X的期望值表為 E(X)。
連續隨機變數的期望值

(a ≤ X ≤ b)
b
E ( X ) = ∫ xf ( x)dx = µ
a

連續隨機變數機率分配的分散程度仍然是以變異數及標準差做為衡量的工具。
連續隨機變數的變異數
b
V ( X ) = σ 2 = ∫ ( x − µ ) 2 ⋅ f ( x)dx
a

連續隨機變數的標準差

σ = V (X)

變異數的簡單計算公式為:
b
V ( X ) = ∫ ( x − µ ) 2 ⋅ f ( x)dx
a

b
= ∫ x 2 ⋅ f ( x)dx − µ 2
a

= E ( X 2 ) − [E ( X )]
2

86
Example

1. 假設連續型隨機變數X 之機率密度函數為f (X) = kX(1−X),0 < X < 1。


(1) 求k 值。
1
(2) 求 p ( X > ) 。
4
(3) 求E(X)、V (X)。

Ans:

0.3 X =1

2. (混和型p.d.f,期望值問題)f(X)= 0.5 1 < X < 2 ,試求 E(X)。
0.2 X =2

Ans:

3. (困難題,求CDF) 設X為一連續隨機變數,其P.D.F如下。
X
 3 + 0.5 0 ≤ X ≤1
 1
 1≤ X < 2
f (X ) =  12
 X 2
 − 6 +3 2≤ X ≤3

 0 other
求其 (1) CDF;(2) P ( X ≤ 1.8 | 1.5 ≤ X ≤ 2.5) 。

Ans:

87
4. (補充應用題)f(X)= KX2, 0 ≤ X ≤ 1 ,求K值、中位數、眾數、
P ( X ≤ 0.5) 。

Ans:

88
5. (Chebyshev Inequality) X為一R.V., E(X)=3, E(X2)=13,請問 P(-2<X<8)之機
率。

Ans:

二. 常用的連續機率分配 常態分配 (Normal Distribution)


標準常態分配 (Standard Normal Distribution)
均等分配 (Uniform Distribution)
指數分配 (Exponential Distribution)

(一) 常態分配 (Normal Distribution) 又稱高斯分配 (Gaussian Distribution)

常態的意思是指一般的、通常的狀態。譬如說,國小四年級學生的身高「一
般」「通常」是 135 公分。常態分配滿足機率的二個條件:
① f ( x) ≥ 0

② ∫ f ( x)dx = 1
−∞

常態分配
設X為連續隨機變數,若其機率密度函數為:
1  x−µ 
2

1 −  
f ( x) = e 2 σ 
−∞ < x < ∞
σ 2π
式中: − ∞ < µ < ∞ , σ > 0 , π = 3.1416 , e = 2.7183 。
則稱 f (x) 為常態分配或常態機率密度函數。
常態分配一般習慣以 X ~ N ( µ , σ 2 ) 來表示,其中 X 為隨機變數, N 表示常態分
配, µ 為平均數,它決定常態分配的位置, σ 2 為變異數,它決定常態分配的分
散程度。平均數 µ 與變異數 σ 2 為常態分配的參數。常態曲線是一個對稱,單峰
及鐘形的曲線,它的平均數和中位數都位於曲線的中心位置。

Example

1. 如已知學生身高為常態分配,且已知其平均數為 135 公分,標準差為 8 公分,


表為 X ~ N (135,8 2 ) ,我們可得到常態分配的機率密度函數如下:


( x −135 )2
1
f ( x) = e 2×8 2

8 2π

89
假設我們想知道某一區間的機率如 P (135 < X < 145) ,則可得:


( x −135 )2
145 1
f ( x) = ∫ e 2×8 2
dx
135
8 2π

 常態分配的 C.D.F.
常態分配的累加機率函數表為:
F ( x) = P( X ≤ x)
x
= ∫ f (t )dt
−∞

圖 常態分配的累加機率圖

 常態分配的 E(X)、V(X)

常態分配的平均數
( x−µ ) 2
∞ 1 −
E( X ) = ∫ x e 2σ 2
dx = µ
−∞
σ 2π
變異數


( x − µ )2
∞ 1 2σ 2
V ( X ) = ∫ (x − µ)2 e dx = σ 2
−∞
σ 2π
【Proof】
(略)

 常態分配的性質
(a) 常態分配 f (x) 為以 µ 為中心的對稱分配。即 f ( µ + a ) = f (µ − a ),表示距 µ 等

90
距之機率密度相等,且平均數、中位數、眾數均相等,即 µ = me = mo 。
(b) 常態分配曲線的兩尾無限延伸。

(c) 常態分配的偏態係數等於 0( α 3 = 0 ),峰度係數等於 3 (α 4 = 3),為一常態峰。

圖 常態分配的對稱性

 常態分配的機率範圍
①常態隨機變數的值落在離平均數 1 個標準差等距的範圍(即 µ ± σ )之機率為
0.6826,以式子表示為:
P ( µ − σ < X < µ + σ ) = 0.6826
②常態隨機變數的值落在離平均數 2 個標準差等距的範圍(即 µ ± 2σ )之機率
為 0.9544 ,以式子表示為:
P ( µ − 2σ < X < µ + 2σ ) = 0.9544
③常態隨機變數的值落在離平均數 3 個標準差等距的範圍(即 µ ± 3σ ) 之機率
為 0.9974,以式子表示為:
P ( µ − 3σ < X < µ + 3σ ) = 0.9974
圖 常態分配的機率範圍

91
 常態分配的加法性

定理 1 設 X ~ N ( µ , σ 2 ) ,若 W = a + bX 則
W ~ N (a + bµ , b 2σ 2 )

定理 2 設 X ~ N ( µ x , σ X2 ) , Y ~ N ( µ Y , σ Y2 ) 且 X、Y 獨立,若

W = aX + bY

W ~ N (aµ X + bµ Y , a 2σ X2 + b 2σ Y2 )

注意:若 X、Y 均為常態分配,但 X 與 Y 不獨立,則 X 與 Y 的線性函數不


一定為常態分配。

Example

1. (Normal Dist.) 雀巢三合一咖啡包裝上標示每包淨重 12g,若標準差為


0.5g。試問:(1) 現任取一包咖啡秤重,請問重量在 11~13g 之間的機率為
何?
(2) ( Normal Dist.加法性)若每包成本 Y 和每包重 量 X 的函數為
Y=0.5+0.45X,且已知 X 服從常態分配,請求出每包成本的平均數和
變異數。又,每包成本為何種機率分配?
(3) (Normal Dist.加法性)若每包售價也為一 Normal Dist.,平均售價 10
元,標準差 1 元,批發給中盤商的價格為 75 折,試問雀巢公司每包
利潤的平均數和變異數為何?

92
Ans:

(二) 標準常態分配 (Standard Normal Distribution)

不同的常態分配因其平均與標準差互不相同,因此有不同的常態曲線。若要
計算某一常態分配其在某一區間的機率,必須利用積分的方法求算該區間常態曲
線以下的面積。這種計算方法相當麻煩且費時,實在是件很痛苦的事。有沒有比
較容易省事的方法呢?
分配 X ~ N ( µ , σ 2 ) ,令 Z = ( X − µ ) / σ ,則 Z 為一標準常態變數,因 Z 為 X
的次式函數。根據常態分配加法定理 1,Z 為一常態分配,且 E ( Z ) = 0,V ( Z ) = 1。
我們將 Z = ( X − µ ) / σ , E ( Z ) = 0 ,V ( Z ) = 1,代入常態分配的機率函數(7.6)式,
可得標準常態分配 (standard normal distribution)的機率密度函數,表為 f (Z ) :
標準常態分配
𝑍𝑍2
1 −
f(Z) = 𝑒𝑒 2
√2𝜋𝜋

由上知,標準常態分配其平均數為 0,變異數為 1。一般以 Z ~ N (0,1) 來表


示。
 標準常態分配的性質

標準常態分配具有常態分配的特質,唯其平均數 µ Z = 0 ,變異數 σ Z2 = 1,標


準差 σ Z = 1,它是常態分配的特殊例子。標準常態分配的任何值域的機率可查標
準常態機率值表而獲得。

93
 如何查表?

由標準常態分配圖可知,標準常態分配的機率和等於 1,它以平均數 Z = 0
為中心點分為相等的兩邊, Z = 0 右邊的機率等於 0.5,以 P ( Z > 0) = 0.5 表示之;
Z = 0 左邊的機率亦等於 0.5,以 P( Z < 0) = 0.5 表示之。附表中的標準常態機率
表僅表示以 Z = 0 右邊任一點與中心點間區間的機率 (面積)。標準常態分配是一
個對稱分配,所以在左邊任一點與中心點間的機率,與右邊距離中心點等距區間
的機率值相同,只是 Z 值的正負符號不同而已,即 P(− z 0 < Z < 0) = P(0 < Z < z 0 )。
例如 P (−0.54 < Z < 0) = P (0 < Z < 0.54) = 0.2054

Example

1. (Standard Normal Dist.) 試求:(1) P(0<Z<0.54) (2) P(Z>0.54) (3) P(-0.5<Z<1)


(4) P(Z>-0.35) (5) P(Z>z)=0.05 之 z 值 (6) P(-z<Z<z)=0.95 之 z 值

 利用標準常態分配求得常態分配的機率

現 將 利 用 標 準 常 態 分 配 求 算 一 般 常 態 分 配 X ~ N (µ ,σ 2 ) 任 一 區 間 的 機 率
P (a < X < b) 的方法說明如下:
①首先,我們應將隨機變數 X 化為標準隨機變數Z,並同時將 a 值與
b 值標準化:
X −µ a−µ b−µ
Z= , a' = , b' =
σ σ σ
②其次,將Z, a ' , b' 代入 P (a < X < b) ,即
a−µ X −µ b−µ
P (a < X < b) = P( < < )
σ σ σ
P ( a ' < Z < b' )
Example

1. (Standard Normal Dist.) 已知常態分配平均值為 500,標準差為 80,試求


P(X>600)。
Ans:

94
2. 研究所甄試成績分配為 N(65, 100),現取全班前 20%保送研究所,請問最低
保送分數為何?

Ans:

(三) 均等分配 (Uniform Distribution)

均等分配是指隨機變數在某一連續的區間,有同等的機率密度。例如等車時
間、飛機飛行時間、顧客排隊買票時間、公文處理時間、裝配作業完成時間等都
屬於均等分配。
均等分配的機率密度函數
設X為連續隨機變數,其機率函數為:
1
f ( x) = a≤ x≤b
b−a
=0
則 f (x) 為均等分配。

圖 均等分配

上圖中矩形面積為:
矩形面積=寬度 × 高度
因矩形寬度為(b-a),矩形面積等於 1,故

95
矩形面積 1
高度= =
寬度 b−a
因此,均等分配的機率密度等於:
1
高度 =
寬度

均等機率分配滿足機率密度函數的二條件:
①(a) f ( x) ≥ 0

b−a
b
b b 1 x 
②(b) ∫
a
f ( x)dx = ∫
a b−a
dx =  =
b − aa b − a
=1

 均等分配的累加機率函數

x−a
x
1 
F ( x) = P( X ≤ x ) = ∫
x 1
dt = t =
a b−a b − a a b − a

 期望值與變異數
均等分配的期望值
b+a
E( X ) =
2
均等分配的變異數
(b − a ) 2
V (X ) =
12

Example

1. (Uniform Dist.) 假設 7-11 的顧客在下午 18.00-18.30 的 30 分鐘間到達櫃臺結


帳的時間為一均等分配,請問顧客在最後 5 分鐘到達櫃臺結帳的機率為何?
Ans:

(四) 指數分配 (Exponential Distribution)

指數分配是另一個常用的連續機率分配。它應用於任意兩個連續發生的事
件之間隔或等待的時間。如兩個顧客提款間隔時間、一個機器發生故障的相隔時

96
間、排隊等侯看病的時間等。指數分配的隨機變數為非負之值,且通常該隨機變
數超過其平均數的機率較小。如服務時間、飛機失事間隔時間等通常具有這樣的
性質。

 指數分配的機率密度函數
指數分配
若 X 為連續的隨機變數,其機率密度函數為:
f ( x) = λe − λx x ≥ 0, λ > 0
則 f (x) 為指數分配。式中: λ 為單位時間事件發生的平均數。

 指數分配的累加機率
F ( x ) = P ( X ≤ x ) = 1 − e − λx
證明如下:
F ( x) = P( X ≤ x)

0
x
= ∫ λe −λt dt = − e −λx ]
0
x

= 1 − e − λx
由上式可求 P( X ≥ x) 的機率為:
P( X ≥ x) = 1 − P( X ≤ x) = 1 − (1 − e − λx ) = e − λx
根據上式可求 X 介於 a 與 b 間的機率為:
P ( a ≤ X ≤ b ) = P ( X ≥ a ) − P ( X ≥ b ) = e − λa − e − λb

Example

1. 假設台大醫院門診醫生張大夫看病時間為一指數分配且每分鐘平均看 0.2 個
病人,那麼問該醫生看一個病人的時間超過 5 分鐘的機率有多高?

Ans:

2. 承上題,請問張大夫看一個病人等於或少於兩分鐘的機率為何?

97
 期望值和變異數
期望值
1
E( X ) =
λ
變異數
1
V (X ) =
λ2

Example

1. 承上題,張大夫看一個病人的平均時間為何?
Ans:

(五) 用常態分配去近似二項分配

①當 n 很大時二項分配的計算相當費事,因此最好有其他容易計算的分配可用
來代替二項分配以減少計算的麻煩。在第 5 章時,我們曾說可以泊松分配代
替二項分配。然而若 n 很大,p 不是很微小時,二項分配並不會趨近泊松分
配,而會趨近於常態分配。換句話說當n很大,p不是很微小時,常態分配
是二項分配的近似分配。

②實際應用時,當 p ≤ 0.5 與 np ≥ 5 或 p > 0.5 與 nq > 5,即可以常態分配代替二


項分配求其機率值。但由於二項分配為一間斷分配,而常態分配為一連續分
配,因此若以常態分配來代替二項分配求其機率值時,必須做連續性的調整。
此 時必須將二項隨機變數之值加減 1/2。此 1/2 稱為連續性調整因子
(continuity correction factor),亦即求算二項分配 P (a < X < b) ,是以求算常態
分配 P(a − (1 / 2) ≤ X ≤ b + (1 / 2)) 來取代。

Example

1. 已知圓山飯店有高級客房 80 間,平日住房率是 75%,請問平日一天有 60 間


房間入住的機率有多少?至少 64 間入住的機率是多少?至多入住 50 間房的
機率又是多少?

Ans:

98
(六) 綜合整理

當母體數 N → ∞ 時,超幾何分配趨近於二項分配,但實際應用時,只要當
樣本數相對母體個數小於 0.05( n / N < 0.05) ,則可利用二項分配代替超幾何
分配求機率值,且其誤差很小。當 p 不微小, n 夠大時,可以常態分配代替
二項分配。常 p 微小, n 很大時,則可以泊松分配或常態分配來代替二項分
配。

圖 各分配間的關係
超幾何分配(有限母體)
n
n =1 N →∞ < 0.05
N
點二項分配 二項分配(無限母體)
n→∞ n→∞

p(或 q)微小 p 及 q 不微小


n ≥ 20 , np ≤ 1 p ≤ 0.5 , np ≥ 5
n ≥ 50 , np ≤ 5 p > 0.5 , nq > 5
n ≥ 100 , np < 10

P 微小 n → ∞ 2
波松分配 常態分配
p < 0.1, n > 500

99
補充資料:聯合機率密度函數
 定義聯合間斷隨機變數與連續隨機變數的意義及其機率。
 了解邊際機率分配與條件機率分配。
 了解兩變數間的關係。

一、 聯合機率函數介紹

在真實世界中,可能必須面對兩個甚至更多個隨機變數,而這些變數之間可能互
相影響。因此,不能只針對個別變數加以分析,而必須適當地刻劃變數間的聯合
行為,再據此探討變數的個別行為及變數之間的關係。

二、 間斷聯合機率密度函數
設 X , Y 為二元間斷隨機變數, X 之值為 x1 , x 2 ,, x n , Y 之值為 y1 , y 2 , y m ,若

f ( X = xi , Y = y j ) 滿足機率的二條件:

 0 ≤ f ( xi , y j ) ≤ 1
n m
 ∑ ∑ f ( xi , y j ) = 1
i =1 j =1

則 f ( xi , y j ) (簡單表示為 f ( x, y ) )為聯合機率函數。

利用聯合機率函數可求 X、Y 某一範圍的機率,例如求 a ≤ x ≤ b , c ≤ y ≤ d 的


機率:

P ( a ≤ x ≤ b, c ≤ y ≤ d ) = ∑ ∑ f ( x, y )
a ≤ x ≤b c ≤ y ≤ d

亦可求算聯合累加機率函數:
F ( x, y ) = P ( X ≤ x, Y ≤ y ) ∑∑ f ( x, y )
X ≤xY ≤ y

例:X = 1,2,3 分別代表所得高低的顧客,Y =1,2,3,4 分別代表想投資的標的。


則兩者的聯合隨機行為可用下表的聯合機率加以描述。

Y =1 Y =2 Y =3 Y =4
Y =1 Y =2 Y =3 Y =4
X =1 0.1 0 0 0
X =1 0.1 0 0 0
X =2 0.2 0.1 0.2 0
X =2 0.2 0.1 0.2 0
X =3 0.1 0 0.1 0.2
X =3 0.1 0 0.1 0.2
表A

100
1. 設 X、Y 為王先生和李先生一週內售出的房屋數量。
Y
0 1 2
X 0 0.12 0.20 0.08
1 0.32 0.07 0.01
2 0.06 0.03 0.01
試求:(1) 王先生和李先生各賣一間房屋的機率。
(2) 王先生和李先生各至少賣一間房屋的機率。
(3) 王先生和李先生合起來賣兩間房屋的機率。

Ans:

P ( X + Y = 2) = f (2,0) + f (1,1) + f (0,2) = 0.06 + 0.07 + 0.08 = 0.21

三、 間斷邊際機率密度函數

 X的邊際機率函數
f x ( X = x) = ∑ f ( X = x, y ) = f ( x, y1 ) + f ( x, y2 ) +  + f ( x, yn )
y

上式必須滿足下列兩條件:

0 ≤ f ( x ) ≤ 1
x i

n
 ∑ f x ( xi ) = 1
i =1

 Y的邊際機率函數
f y (Y = y ) = ∑ f ( x, Y = y ) = f ( x1 , y ) + f ( x2 , y ) +  + f ( xn , y )
x

上式必須滿足下列兩條件:

0 ≤ fy(yj ) ≤ 1

101
m
∑ f y (y j ) =1
j =1

 X 與 Y 的聯合機率分配與邊際機率分配表
X \Y y1 y2 … yj … ym f x ( xi )
x1 f ( x1 , y1 ) f ( x1 , y 2 ) … f ( x1 , y j ) … f ( x1 , ym ) f x ( x1 )
x2 f ( x 2 , y1 ) f ( x2 , y2 ) … f ( x2 , y j ) … f ( x2 , ym ) f x ( x2 )
   …  …  
xi f ( x i , y1 ) f ( xi , y 2 ) … f ( xi , y j ) … f ( xi , y m ) f x ( xi )
   …  …  
xn f ( xn , y1 ) f ( xn , y2 ) … f ( xn , y j ) … f ( xn , ym ) f x ( xn )
fy(yj) f y ( y1 ) f y ( y2 ) … fy(yj) … f y ( ym ) 1

2. 請根據上面的表A,做出邊際機率和累積機率分配表。

 條件機率函數

設 f ( x, y ) 為二元機率函數,則在 Y = y j 條件下,發生 xi 的條件機率表為:

f ( xi , y j )
f ( xi | Y = y j ) =
fy(yj)

在 X = xi 條件下,發生 y j 的條件機率表為:

f ( xi , y j )
f ( y j | X = xi ) =
f x ( xi )

X + kY
3. 聯合機率密度函數 (Joint p.d.f) 如下: f ( x, y ) = ; X=1, 2; Y=1, 2,試
18
求 f(X), f(Y), f(X|Y)。

Ans:

102
 期望值與變異數
X 的期望值

E ( X ) = ∑∑ xf ( x, y )
x y

= ∑ x ∑ f ( x, y ) = ∑ xf x ( x)
x y x

Y 的期望值

E (Y ) = ∑∑ yf ( x, y )
x y

= ∑ y ∑ f ( x, y ) = ∑ yf y ( y )
y x y

X 的變異數

V ( X ) = ∑∑ ( x − µ X ) 2 f ( x, y )
x y

= ∑ ( x − µ X ) 2 f x ( x)
x

= ∑ x 2 f x ( x) − µ X
2

Y 的變異數
V (Y ) = ∑∑ ( y − µY ) 2 f ( x, y )
x y

= ∑ ( y − µY ) 2 f y ( y )
y

= ∑ y 2 f y ( y ) − µY
2

103
4. 全紅通訊為了促銷最新型手機,發送型錄給 1,200 個老客戶,發送後 20 天,
依買或不買和是否看過型錄做出下表統計。請問:(1) 郵寄型錄的促銷方法是否
有效? (2) 是否看過型錄(Y)和是否購買手機的期望值和變異數為多少?
Y (是否看過型錄)
合計
0(未看過) 1(看過)
X 0(不買) 600 240 840
(有否購買手機) 1(購買) 120 240 360
合計 720 480 1,200

Ans:

四、 連續聯合機率密度函數

設 X ,Y 為二元連續隨機變數, a ≤ X ≤ b , c ≤ Y ≤ d ,若 f ( X = xi , Y = y j ) 滿足下

列二條件:
 f ( x, y ) ≥ 0
b d
∫ ∫ f ( x, y )dydx = 1
a c

則 f ( x, y ) 為一個連續聯合機率密度函數。

若要求某一範圍的機率,則必須利用積分的方法。如 a ≤ X ≤ b , c ≤ Y ≤ d 範圍
b d
的機率: P (a ≤ x ≤ b, c ≤ y ≤ d ) =
∫ ∫ f ( X = x,Y = y)dydx
a c

x y
亦可求累加機率函數: F ( x, y ) = P( X ≤ x, Y ≤ y ) =
∫ ∫ f (s, t )dtds
a c

104
5. 設 一 聯 合 機 率 密 度 函 數 f ( x, y ) = 1 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 , 試 求 (1)

P(0 ≤ x ≤ 0.5, 0 ≤ y ≤ 0.5) (2) F ( x, y )

Ans:

五、 連續邊際機率密度函數

 X的邊際機率函數

X邊際機率密度函數 f x ( X = x) 為:

f x ( X = x) = ∫ f ( X = x, y )dy
y

它必須滿足機率的二條件 f x ( x) ≥ 0  ∫
x
f x ( x)dx = 1
 Y的邊際機率函數

Y邊際機率密度函數 f y ( y ) 為:

f y (Y = y ) = ∫ f ( x, Y = y )dx
x

它必須滿足機率的二條件 f y ( y ) ≥ 0  ∫ y
f y ( y )dy = 1 。

 條件機率函數

Y = y 條件下, X 的條件機率密度函數 f ( x | y ) 為:

f ( x, y )
f ( x | y) =
f y ( y)

它必須滿足機率的二條件  f ( x | y ) ≥ 0  ∫ f ( x | y )dx = 1 。
x

105
X = x 條件下, Y 的條件機率密度函數 f ( y | x) 為:

f ( x, y )
f ( y | x) =
f x ( x)

它必須滿足機率的二條件  f ( y | x) ≥ 0  ∫y
f ( y | x)dy = 1 。

6. 假設花旗銀行想了解台北分行和高雄分行利用 ATM 的情形,現在隨機抽取


一天,令 X 和 Y 分別代表台北分行和高雄分行使用 ATM 的比率,X 與 Y 的二
元機率密度函數:
2
f ( x, y ) = ( x + 2 y) 0 ≤ x ≤1 0 ≤ y ≤1
3
=0 otherwise

請問:
(1) X 的邊際機率密度函數
(2) Y 的邊際機率密度函數
(3)台北分行利用 ATM 的比率大於 0.5 的機率

 期望值與變異數
X 的期望值:

E( X ) = ∫ ∫ xf ( x, y)dydx = ∫ xf x ( x)dx
x y x

Y 的期望值:
E (Y ) = ∫ ∫ yf ( x, y)dxdy = ∫ yf y ( y )dy
y x y

X 的變異數:

V ( X ) = ∫ ∫ ( X − µ X ) 2 f ( x, y )dydx = E ( X 2 ) − ( E ( X )) 2
x y

106
Y 的變異數:

V (Y ) = ∫ ∫ (y − µ y ) 2 f ( x, y )dydx = E (Y 2 ) − ( E (Y )) 2
x y

7. 設 X 與 Y 分別為男性與女性運動時間佔休閒時間的比例,其機率密度函數
如下: f ( x, y ) = 8 xy 0 ≤ X ≤1 0 ≤ Y ≤ X
=0 others
試求 E(X), E(Y), V(X), V(Y)。

Ans:

六、 兩變數的關係

 共變異數 (Covariance)
對於離散隨機變數 X 和 Y,E(XY) 稱為 X 和 Y 的交叉動差(cross moment):
E( XY ) = ∑∑ ai b j f X ,Y (ai , b j )
i j

共變異數一般以 cov(X,Y ) 表示,其公式如下:


Cov( X , Y ) = E[( X − µ X )(Y − µ Y )] = E ( XY ) − µ X µ Y

共變異數描述的是兩隨機變數和其均數之差距的共同變動。當共變異數為正
值,這些差距平均而言呈同方向變動。當共變異數為負值,這些差距平均而言
呈反方向變動。

107
Y Ⅱ Ⅰ

(x − µ X ) < 0 (x − µ X ) > 0
(y − µY ) > 0 (y − µY ) > 0

µY

Ⅲ Ⅳ
(x − µ X ) < 0 (x − µ X ) > 0
(y − µY ) < 0 (y − µY ) < 0

µX X

 共變異數 (Covariance) 的性質


cov(X,Y) = cov(Y,X)
cov(X,X) = var(X)
cov(X,c) = 0
cov(aX+c, bY+d) = (ab) cov(X,Y))
cov(aX,bY) = ab*cov(X,Y)
var(aX±bY) = a2 var(X ) + b2 var(Y ) ± 2ab cov(X,Y )

 相關係數 (Correlation Coefficient)

相關係數就是兩個標準化後的隨機變數之間的共變異數。共變異數固然可以表
現隨機變數共同變動的方向與強弱程度,但是其本身會受到比例變動 (如衡量
單位變動) 的影響,所以不適合作為比較的基礎。另一種衡量兩個變數之間共
同變動的指標稱作相關係數 (Correlation Coefficient)。一般以 ρ XY 表示。

令 X 和 Y 為兩個隨機變數,其變異數分別為 σ x2 和 σ y2 來表示。則:

cov( X,Y ) Ε[( X − Ε( X ) )(Y − Ε(Y ) )]


ρ XY = =
[Ε( X − Ε( X )) ] [Ε(Y − Ε(Y )) ]
.
σ Xσ Y 2 2

8. (多重應用題) 兩隨機變數 X, Y, 其 joint p.d.f 為 f(X,Y)=X+Y, 0<X<1,


0<Y<1, 求 COV(X,Y)和 ρ ( X , Y ) 。

108
Chapter 7 Sampling and Sampling Distribution

一. 何謂抽樣?
前面幾章介紹是敍述統計學,包括常用的幾個機率分配。下面我們要介紹
推論統計學。正如前面所說的,推論統計學是現代統計學的核心。它是從已知
的、部份的樣本特性去推論未知的、整個的母體特質。

(1) 抽樣的定義
人們在研究某些問題或現象時,有時並不直接探討母體而係經由對樣本的
探討,以獲致某些樣本統計量,然後再利用這些樣本統計量去推測母體的參數。

(2) 抽樣誤差與排抽樣誤差
當我們利用樣本統計量去推論母體參數時,由於母體中的各個元素 (個體)
本身即有所不同,因此不論抽樣方法如何科學,如何客觀公正無偏,樣本統計
量與母體參數之間總是會有一些差異,這就是估計誤差 (error of estimation)。
這些估計誤差來自兩方面,一是抽樣誤差 (sampling error),另一個是非抽樣誤
差 (nonsampling error)。
抽樣誤差
抽樣誤差是樣本統計量與相對應的母體參數間的差異。此種差異來自抽樣
過程的機遇(chance),抽樣方法及推論方法的不同。
非抽樣誤差
非抽樣誤差為在記錄、整理資料時所發生的錯誤。

(3) 抽樣誤差與抽樣成本
要降低抽樣誤差,最好的方法就是對母體進行普查,然而,普查的成本相
對於抽樣而言是很高的,特別是當母體很大的時侯,普查的費用更是驚人。如
果資源是無限的,那麼普查是獲取母體資料的最好方法。然而,資源畢竟是有
限的,因此,普查不是經常可以進行的。

109
圖 資料蒐集成本與抽樣誤差的關係

一般而言,抽取的樣本數越多,抽樣誤差越小,如圖中的抽樣誤差成本曲線所
示。但是抽取的樣本數越多,成本就越高,如圖中的蒐集樣本成本曲線所示。
由該圖可知,在考慮這兩種成本後的最適點為圖中的 E 點。

二. 抽樣方法

(一) 普查 (Census):對所有母體裡面的個體做調查
→ 好處:精準
→ 壞處:很久、很貴、很累 ex:戶口普查

(二) 隨機抽樣 (Random Sampling)

A. 單純(簡單)隨機抽樣
母體中所有個體被抽中的機率皆相等(抽中機率= 1 N )
→放回= 1 N
1
→不放回= N
Cn

110
B. 分層抽樣

各層差異大,層中差異小
ex :能力分班

n1 n2 n3

N = n1 + n2 + n3
C. 部落抽樣 (Cluster Sampling):別名區塊抽樣或叢式抽樣,將母體分為許多群,
然後從每一群中抽出樣本。
分層隨機抽樣:各層差異大,層中差異小。
集團抽樣:集團間差異小,集團中差異大

D. 系統抽樣 (Systematic Sampling):以一個固定的間隔向後延伸抽取樣本 (ex:


每 5 號抽出 1 人),即先排列母體,等距離的抽出樣本。
★限制:不能採用放回式抽樣,母體有循環性時不可採用 (ex:星期、 月份)

(三) 非隨機抽樣 (Non-random Sampling)

A.便利抽樣
→ 樣本選擇主要考量是「便利與否」,但缺點為容易有誤差。ex:在高級
住宅區調查與在貧困區調查其生活品質,一定會相差甚遠。

B.判斷抽樣
→ 由研究者判斷要抽哪些個體。Ex:物價指數的編製→由主計處挑選大宗
物品做評斷

C.雪球抽樣
→為了克服母體稀少性所發展出的抽取方法。Ex:想知道患香港腳者,用

111
什麼藥,首先知道 A 有,則尋問 A 有沒有認識同樣患者香港腳者,則 A
說出 B,C 則 B 又說 D,E,C 又說 F,G。
D
B
A E
F
C
G

三. 母體參數與樣本統計量

母體參數 (Parameters)
母體參數是描述母體資料或分配特性的統計測量數,一般簡稱為參數或母
數。參數是我們想要得知的,是統計的核心。
假如母體平均數、變異數、標準差及母體比例等都是母體參數。這些參數是常
數,但大部份都是未知的。

樣本統計量 (Sample Statistics)


樣本統計量為樣本的實數函數。通常用來描述樣本資料特性,或用來推論母
體參數。

(例如自台灣全體小學生中抽取 100 個學生的身高,表為 ( X 1 , X 2 ,  , X 100 ) 定義


100
Xi
X =∑ ,則 X 為 樣 本 統 計 量)。
i =1 100

若 設( X 1 , X 2 ,  , X N ) 為 自 母 體 X 中 抽 出 的 隨 機 樣 本,定 義 實
數函數 T ( X 1 , X 2 ,  , X N ) ,則 T 為一樣本統計量,簡稱統計量。它是一個隨機
變數,其機率分配即為抽樣分配 (Sampling Distribution)。
抽樣分配
樣本統計量為隨機樣本的函數,而隨機樣本是由 n 個隨機變數 ( X 1 , X 2 ,  X N )
所組成的,故樣本統計量亦為一隨機變數,其機率分配稱為抽樣分配。意即
樣本統計量的機率分配稱為抽樣分配。
一般而言,統計量的抽樣分配決定於所採取的抽樣方法、樣本數大小、母體分
配等。常見的抽樣分配包括:常態分配、二項分配、卡方分配 ( χ 2 distribution)、
t 分配 (student’s t distribution)及 F 分配 (Fisher’s distribution)。

112
四. 樣本平均數的抽樣分配

當我們要利用樣本統計量去推論母體參數值時,我們會遭遇到所使用的樣
本統計量是否能夠正確的估計母體參數的問題。由於樣本統計量隨樣本的變動
而不同,根據樣本統計量所做的推論便含有某一程度的不確定性。為了暸解此
種不確定性的程度,就必須先了解統計量的值可能出現的情況,亦即了解統計
量的機率分配,統計量的機率分配我們稱它為抽樣分配。
另外,抽樣分配之所以重要的另一理由是,在統計推論中我們經常根據樣
本統計量去判斷母體參數是否等於某一特定值,此時我們必項利用樣本統計量
的抽樣分配去得到所抽得的樣本統計量值出現的機率。倘若母體參數等於假設
的某特定值的情況下,抽得的樣本統計量出現的機率很小,我們就可根據此一
樣本訊息推翻母體參數等於某一特定值的假設,而判定母體參數值不等於某特
定值;反之,若抽得的樣本統計量出現的機率很大,我們則可下結論;該樣本
訊息支持母體參數等於某特定值。

 母體分配:母體元素的機率分配

Example

現為方便說明,我們假設中泰汽車公司共有 5 個展示接待小姐,其月薪(新台幣
千元)分別為:
22 25 25 28 30
該公司 5 個小姐的月薪構成一個母體資料。設隨機變數 X 為月薪,其次數分配
如下表所示。
表 展示小姐的月薪的次數分配
x f
22 1
25 2
28 1
30 1
N =5

將上表的次數分配表的次數除以總次數 N = 5 ,可得各組的相對次數或機率
如下表所示。

113
表 展示小姐月薪的母體機率分配
x f (x)
22
25
28
30

∑ f (x) = 1

上面的機率分配即為母體的機率分配。可求得母體平均數為:
(22 + 25 + 25 + 28 + 30)
µ= = 26
5

變異數為: σ 2 = E ( X 2 ) − [E ( X )]2

= 683.6 − 26 2 = 7.6
標準差為: σ = 2.757

 樣本平均數的抽樣分配之原理
樣本平均數的抽樣分配
設母體為隨機變數 X ,其機率分配為 f (x) ,若自母體中簡單隨機抽取
n
n 個元素為一組樣本,表為 ( X 1 , X 2 ,  , X N ) ,若令 X = ∑
Xi
,則 X 為
i =1 n

樣本平均數,其機率分配表為 f (x) ,稱為樣本平均數的抽樣分配。

例如若母體有N個元素,抽取 n 個為一組樣本,則所有可能的樣本組有 C nN

個,可計算得 C nN 個 X 的值。

114
圖 樣本平均數的抽樣分配

所有可能樣本 所有樣本平均數

x1 S1

抽樣  x1 =
∑x
n
母體 xn

x1 S2

 x2 =
∑x
n
N xn

x1 Sk

 xk =
∑x
n
xn

k = C nN

若抽樣方法為簡單隨機抽樣,則每個樣本出現的機率均為 1 C nN ,因此對應

每一組樣本所求得的樣本均數出現的機率亦為 1 C nN

115
表 樣本平均數的機率分配
x
f (x)

x1 1/ C nN

x2 1/ C nN

 

x C nN 1/ C nN

X 的平均數與變異數 E( X ) 、V ( X )

此機率分配就是樣本平均數的抽樣分配。而由此機率分配可分別計算樣本平

均數的期望值 E ( X ) ,變異數 V ( X ) 及標準差。

Example ( X 的抽樣分配實例)
1. 假設高雄大學教務處有六名助理,其年資分別為 1, 2, 3, 4, 5, 6 年,我們想要
知道,若我們從這六位助理中隨機抽取兩位的年資,則此樣本所獲得的平均數來
推估母體平均數,其高估或低估的機率為何?
現設 X 為助理小姐的年資,則母體平均數為:
(1 + 2 + 3 +  + 6)
µ= = 3.5
6
變異數為:

σ 2 = E ( X 2 ) − [E ( X )]2

12 + 2 2 +  + 6 2
= − (3.5) 2 = 2.917
6
其機率分配 f (x) 為一均等分配,隨機變數 X 的機率相同。

116
圖 秘書小姐年資的母體機率分配圖

現自母體中簡單隨機抽取 2 個為樣本,則所有可能出現的樣本點及各個樣本點
的樣本平均數如下表,共有 15 個樣本點。

表 秘書小姐年資的樣本平均數
樣本 樣本平均數 樣本 樣本平均數
(1,2) 1.5 (2,6) 4.0
(1,3 2.0 (3,4) 3.5
(1,4) 2.5 (3,5) 4.0
(1,5) 3.0 (3,6) 4.5
(1,6) 3.5 (4,5) 4.5
(2,3) 2.5 (4,6) 5.0
(2,4) 3.0 (5,6) 5.5
(2,5) 3.5

依照機率分配的概念整理之後

117
表 秘書小姐的年資的抽樣分配

f (x)
x
1.5 1/15
2.0 1/15
2.5 2/15
3.0 2/15
3.5 3/15
4.0 2/15
4.5 2/15
5.0 1/15
5.5 1/15

樣本平均數的平均數如下:

()
E ( X ) = ∑ x f x = 1.5 ×
1
15
1 2 2 3 2
+ 2 × + 2.5 × + 3 × + 3.5 × + 4 × + 4.5 ×
15 15 15 15 15
2
15
1 1
+ 5× + 5.5 ×
15 15
= 3.5
樣本平均數的變異數為:

V ( X ) = ∑ x f ( x) − (3.5) 2
2

1 1 1
= (1.5) 2 × + (2.0) 2 × +  + (5.5) 2 × − (3.5) 2
15 15 15
= 13.416 − 12.25 = 1.166
而由上表可知,隨機抽取一個樣本點其平均數正好等於母體平均數的機率
僅為 3/15=0.2,亦即在所有 15 個可能樣本點中,3 個樣本點的平均數剛好等於
母體平均數,其他 12 個樣本點會產生抽樣誤差,6 個樣本平均數小於母體平
均數,即低估,其機率為 6/15=0.4,另外,6 個樣本平均數大於母體平均數,
即高估,其機率亦為 6/15=0.4。

 X 的平均數和變異數
A. X 抽樣分配的平均數

設 ( X 1 , X 2 ,  , X n ) 為自母體 X ~ ( µ X , σ X2 ) 中隨機抽取的樣本,則 X 抽樣分配

的平均數稱為 X 的平均數以符號 µ X 或 E ( X ) 表示。

X 的抽樣分配的平均數為:

118
∑X  1
E ( X ) = E  = E ( X 1 +  + X n ) = 1 [(E ( X 1 ) +  + E ( X n ))]
 n  n n
 

=
1
[µ +  + µ ] = 1 nµ = µ
n n
X 抽樣分配的平均數
X 抽樣分配的平均數等於母體平均數,即

E( X ) = µ X = µ

B. X 抽樣分配的變異數與標準差

X 的變異數以符號 σ X2 或 V ( X ) 表示,標準差以 σ X 表示。 X 的變異數及

標準差因母體為無限或有限而不同。無限母體(或有限母體抽出放回) X 的抽
樣分配的變異數與標準差為:

∑X  1
V (X ) = V   = V ( X 1 +  X n ) = 1 [V ( X 1 ) +  + V ( X n )]
 n  n2 n2
 

1 1 σ2
= = σ =
[ ]
2
n
n2 σ 2 +  + σ 2 n2 n

無限母體樣本平均數的變異數 (σ X2 ) 與標準差 (σ X )

σ2
σ X2 = V ( X ) =
n
σ
σX =
n
有限母體抽出不放回時, X 的抽樣分配的變異數與標準差必須乘上有限母
體的修正因子。

有限母體抽出不放回樣本平均數的變異數 (σ X2 ) 與標準差 (σ X )

σ2 N −n
σ X2 = V ( X ) = ⋅
n N −1
σ N −n
σ X = V (X ) = ⋅
n N −1
N −n
式中 稱為有限母體的修正因子 (finite population correction factor; FPC)。
N −1
由此 FPC 知,有限母體採抽出不放回的抽樣方式,樣本平均數的變異數較無限

119
母體為小。當 n N ≤ 5% 時,可將修正因子忽略不計。

 µ X 和 σ X2 的特性

① X 的抽樣分配以母體平均數 µ 為中心。無論樣本數大小,母體有限或無限,

抽出放回或不放回, X 的抽樣分配的平均數均為 µ 。 X 的抽樣分配的變異

( )
數受到母體變異數 σ 2 、樣本數 (n ) 以及母體為有限或無限的影響。
(a) 若母體變異數愈大, X 的抽樣分配的變異數亦大。

(b) 當樣本數 n 增加時, V ( X ) 愈小,抽樣分配愈集中於母體平均數 µ 。若

σ2
n → ∞ ,V ( X ) =
→ 0 ,亦即 X 的機率分配收斂到母體平均數 µ ,此即
n
為大數法則(law of large numbers)。
大數法則

lim P ( X − µ < ε ) = 1
n →∞

ε 為任意微小數值。

Example

1. 擲骰子兩次,請問骰子點數的平均數之期望值和變異數為何?

2. 某廠牌 CD 有一百個,其直徑為隨機變數 X,平均數為 10 公分,變異數為


0.25 個,請問這十片 CD 直徑平均數的平均數和變異數為何?

Ans:
根據題意知道是有限母體且抽出不放回

120
 常態母體樣本平均數的抽樣分配

若母體 X 為常態分配,平均數為 µ ,標準差為 σ ,我們可利用常態分配


的加法定理來求出 X 的抽樣分配為常態分配(不論是大樣本還是小樣本)。
常態母體 X 的抽樣分配
設母體 X 為一常態分配表為 X ~ N ( µ , σ 2 ) ,自母體中簡單隨機抽取 n

個為樣本,令 X = ∑ X n ,則不論樣本數為何 X 為一常態分配,且平

均數為 µ 、變異數為 σ 2 n 表為:


σ2
X ~ N (µ , )
n

五. 中央極限定理

中央極限定理
無論母體為何種分配,其平均數為 µ ,變異數為 σ 2 (σ 2 < ∞) ,自母體簡
單隨機抽取 n 個為一組樣本,若樣本數 n 夠大(一般認為 n ≥ 30) ,則樣本
平均數的抽樣分配會趨近於常態分配,即
σ2
X ~ N (µ ,
)
n
①若母體為無限母體,其樣本平均數的抽樣分配表為:
σ2
)X ~ N (µ ,
n
②若母體為有限母體,其樣本平均數的抽樣分配表為:
σ2 N −n
X ~ N (µ , ⋅ )
n N −1

121
 中央極限定理
母體分配 母體分配

µ x

抽樣分配 抽樣分配

n =5 n =5

µ x

n =10 n =10

µ x µ x

n =30 n =30

µ x µ x

n =50 n =50

u
µ x x

122
不論母體為何種分配,當樣本數增加時,各個抽樣分配的平均數都等於母體
平均數,但抽樣分配的分散度則隨樣本數增加而降低,即變異數越來越小。變異
數越小表示抽樣誤差越小,精確度越高。這樣表示大樣本的抽樣誤差比小樣本的
抽樣誤差小,精確度較高。

▲注意:
若母體為非常態分配,則雖是大樣本,其抽樣分配不是常態分配,而是近似
常態分配。中央極限定理僅適用於大樣本。
▲由上面的說明,我們可歸納 X 的抽樣分配為 4 種情況如下表
表 X 的抽樣分配
樣本 母體分配 抽樣分配
母體為常態分配 σ2
X ~ N (µ , )
大樣本 n
(n ≥ 30) 母體非常態分配 σ2
X ~ N (µ , )
n
母體為常態分配 σ2
X ~ N (µ , )
小樣本 n
(n < 30) 母體非常態分配 X 的抽樣分配決定於母體分配
n σ2 N −n
註:若母體為有限母體,且 > 0.05 ,則 V ( X ) = ⋅ 。
N n N −1

Example

1. (常態分配加法定理與中央極限定理的應用)根據資料,高雄市計程車每天
耗用的燃料費為一常態分配,平均數為 313 元,標準差為 101 元,請問:
(1) 自高雄市隨機抽取一輛計程車,其每天耗用的燃料費超過 400 元的機率為何?
(2) 某家計程車行有 8 輛計程車,則 8 輛計程車每天平均的燃料費為多少元? 其
平均值超過 400 元的機率為何?

Ans:
(1) 因已知,故可計算:

因此,在高雄市隨機選取一輛計程車,其每天耗用的燃料費超過 400 元的機率為


0.1949。

123
(2) 由常態分配的特性知,8 輛計程車每天耗用燃料費的平均數的分配亦為常態
分配,其平均數為 313 元,變異數為,即或

即 8 輛計程車每天耗用燃料費的平均值超過 400 元的機率為 0.0119。

2. 假設立頓紅茶每罐平均重量為 400 公克,標準差為 12 公克,呈現一常態分


配,現品管人員抽取 36 罐檢定其重量,試問:
(1) 抽取之 36 罐的樣本平均重量與母體平均數 (400 公克)之差在 3 公克之內的
機率為何?
(2) 以母體平均數 (400 公克)為中心,涵蓋 95%樣本平均數的區間為何?

Ans:
(1) 為一常態分配:,求
(2) :

因此茶葉平均重量與母體平均數之差在 3 公克之內的機率為 0.8664

(2) 根據,求之 a 值: ○
1
E

查表知:


2
A
E

比較 ○
1 ○
2 知:a/2=1.96,a=3.92,亦即

因此涵蓋 95%樣本平均數的區間為:396.08~403.93

3. (樣本大小影響抽樣分配)根據高雄大學學生校外租屋中心的資料得知,一
般 30 坪的房子月租為 NTD 30000,標準差 6000,請問抽樣樣本數 30 及 50 時,
其平均數和標準差為何?
Ans:

124
4. 根據台鐵資料,110 年每人平均乘車公里數為 55.1 公里,較 72 年最高峰的
65.5 公里減少 10.4 公里,若每人平均乘車公里數的標準差為 20 公里,請問:
(1) 隨機抽選 300 位乘客為一樣本,其平均乘車公里數介於 52 到 55 公里間
的機率為何?
(2) 續題(1),平均乘車公里數超過 60 公里的機率為何?

Ans:
(1) 令表示乘客平均乘車公里數,因樣本數夠大(n=300>30),所以根據中央極限定
理,平均年資的分配為常態分配,其平均數與標標準差為:

由此可得:

結果可得平均每人乘車公里數介於 52 及 55 公里間的機率為 0.4606。


(2)因
故知乘客平均乘車公里數超過 60 的機率趨近於 0,如圖

圖、台鐵乘客平均乘車公里數的機率

補充:樣本和的抽樣分配
令 S 為隨機樣本的和,即 S = X 1 + X 2 +  + X n ,則 S 為 ( X 1 , X 2 ,  , X n )的線
性函數。當 n 小 (n < 30) 而母體為常態分配時,則根據常態分配加法定理, S 為一
常態分配。當 n 夠大 (n ≥ 30) 時,根據中央極限定理,則 S 會趨近常態分配。
樣本和的平均數為:
E ( S ) = E ( X 1 + X 2 +  + X n ) = E ( X 1 ) + E ( X 2 ) +  + E ( X n ) = nµ
樣本和的變異數為:
①若為無限母體,或有限母體抽出放回, X 1 , X 2 , , X n 獨立,則

V ( S ) = V ( X 1 + X 2 +  + X n ) = V ( X 1 ) + V ( X 2 ) + V ( X x ) = nσ 2

②若為有限母體抽出不放回, X 1 , X 2 ,  , X n 不獨立,則
N −n
V ( S ) = nσ 2 ⋅
N −1

125
Example

1. 承上題,(1) 該車行每天燃料費少於 2000 元的機率為多少? (2) 假設高雄市計


程車每天的燃料費的分配為未知,現在隨機調查 60 輛計程車每天耗用的燃料
費,則其總合介於 1.7 萬元到 2 萬元間的機率為何?

(1) 8 輛計程車每天燃料費的總和可

六. 樣本比例的抽樣分配

 母體比例與樣本比例
若製造廠商的品管經理想要統計工廠的瑕疵品佔整個產量的比例 (母
體比例)。他可以從所有成品 (母體)中,抽取樣本數為 n 的樣本,然後求算
樣本不良率的抽樣分配,計算其期望值、變異數、此一樣本不良率即為樣
本比例,所得到的機率分配即為樣本比例的抽樣分配。
母體比例
p=K N
N :母體個數, K 母體中 A 類別的個數。
現自母體中隨機抽取 n 個元素為樣本,表為 ( X 1 , X 2 ,  , X n ),則 n 個中 A
類別所佔比例,稱為樣本比例,可表示為:
樣本比例
n

k
∑X i
pˆ = = i =1

n n
因此 p̂ 為自點二項母體 ( X ) 中抽取 n 個觀察值的樣本平均數。

 樣本比例的抽樣分配
樣本比例的抽樣分配
樣本比例為自點二項母體抽出的樣本平均數,該樣本比例的機率分配表
為 f ( pˆ ) ,即為樣本比例的抽樣分配。
樣本比例的抽樣分配的導出過程與樣本平均數相同。以下舉例說明。

126
Example

假設X公司展示小姐中有 3 個人讀過統計學,有 2 個人沒讀過。


表 母體比例
姓氏 A 小姐 B 小姐 C 小姐 D 小姐 E 小姐
修讀統計學 讀過 Y 沒讀過 N 讀過 Y 沒讀過 N 讀過 Y

設隨機變數 X=1 為讀過統計學,X=0 為沒有讀過統計學,則母體比例(讀過


統計學的展示小姐的比例)為:
p = (3 / 5) = 0.6
X 為一點二項母體, E ( X ) = p , V ( X ) = pq 。
現自母體中簡單隨機抽取 3 個小姐為一組樣本,則所有可能的樣本點共

有 C 35 = 10 。因此可得樣本比例的抽樣分配如下表。

表 樣本比例的抽樣分配
p̂ f ( pˆ )
0.33 3/10=0.3
0.67 6/10=0.6
1.00 1/10=0.1

∑ f ( pˆ ) = 1.00

 樣本比例的平均數和變異數

樣本比例 p̂ 抽樣分配的平均數表為 µ p̂ ,如同樣本平均數 X 的抽樣分配

等於母體平均數,它等於母體比例 p 。

樣本比例的平均數

E ( pˆ ) = µ pˆ = p

證明如下:

∑X  1
E ( pˆ ) = E   = E (∑ X )
 n  n
 

1
= E( X 1 + X 2 +  + X n )
n

=
1
[E ( X 1 ) + E ( X 2 ) +  + E ( X n )]
n

127
1
= ( p + p +  + p)
n
np
= =p
n

樣本比例 p̂ 抽樣分配的變異數,表為 σ p̂2

樣本比例的變異數與標準差
①無限母體
pq
V ( pˆ ) = σ p2ˆ = (1)
n
pq
σ pˆ = σ p2ˆ = (2)
n
②有限母體
pq N − n
V ( pˆ ) = σ p2ˆ = ⋅ (3)
n N −1
pq N − n
σ pˆ = σ p2ˆ = ⋅ (4)
n N −1
證明如下:

∑X  1
V ( pˆ ) = V   = V (∑ X )
 n  n2
 

=
1
n2
[
V ( X 1 ) +  + V ( X n) ]
=
1
[ pq +  + pq ]
n2
npq pq
= =
n2 n

 N −n
若為有限母體,則 p̂ 的變異數必須乘上有限母體的修正因子  。
 N −1 
如同樣本平均數 X ,如果有限母體母體元素 N 相對於樣本數 n 很大,則修正因子
可以忽略不計。亦即,如果母體有限且 n / N ≤ 0.05 ,則我們使用(1)、(2)式。如果
母體有限且 n / N > 0.05 ,則我們應使用含有修正因子的(3)、(4)式。

大樣本 ( np > 5 及 nq > 5 ) 樣本比例的抽樣分配


依據中央極限定理,當大樣本時, p̂ 的抽樣分配會趨近常態分配:

128
pq
pˆ ~ N ( p, )
n

所謂大樣本是指 np > 5 及 nq > 5 。此一條件與前面所說的以常態分配代替二


項分配的條件相同。此外,若母體為有限且 n / N > 0.05 的情況則 p̂ 的變異數
為:
pq N − n
V ( pˆ ) = ⋅
n N −1
Example
1. 根據民意調查,有 47%的高雄市民贊成蓋流行音樂中心,若現在再次抽樣調
查贊成與否,由市民中隨機抽取 400 人,則在此 400 人中贊成的比例在 50-
60%的機率為何?
Ans:

2. 一樣針對美國公民所做的調查,發現有六成民眾贊成阿富汗撤軍,今從美國
隨機抽取 30 位民眾,請問有 1/3~2/3 比例民眾贊成阿富汗撤軍的機率為何?
Ans:
n=30 為大樣本

129
補充:點估計
一. 點估計的意義

點估計是指由母體抽取一組樣本數為 n 的隨機樣本,並由此尋找樣本統計量
做為母體參數的估計值。具體而言,我們若想估計某一未知的母體參數 θ ,抽取

樣本數為 n 的隨機樣本 X 1 ,  , X n ,並尋找樣本統計量 θˆ,θˆ 為樣本 X 1 ,  , X n 的函

數,表為 θˆ = g ( X 1 ,  , X n ) ,而以此 θˆ 來估計母體參數 θ ,此即為點估計。例如以

X 估計 µ 就是點估計。

在進行點估計時,用來估計母體參數的統計量稱為估計式(estimator),將樣

本觀察值代入估計式中,求得的數值稱為估計值(estimate)。例如,以 X 來估計 µ ,

則 X 為一估計式;將樣本觀察值代入,可得出某一數值譬如 X 0 = 125,則此數值

125 即為估計值。

▲在進行點估計時,其步驟約可分為 4 個:

① 抽取具代表性的樣本

② 選擇一個較佳的樣本統計量做為估計式

③ 計算樣本統計量的值

④ 以樣本統計量的值推論母體參值並做決策

二. 估計式的評判標準

為什麼選擇 X 來估計 µ ,而不選擇其他的統計量如中位數或眾數呢?換句

話說,如何選擇較佳的估計式是點估計的重要工作。若能選擇一個良好的估計式,
則無論出現何種樣本,平均而言,良好的估計式可使估計結果較接近母體參數的
真值或使誤差較小。
什麼是良好的估計式呢?一個良好的估計式,應合乎下列性質:不偏性
(unbiasedness) 、 有 效 性 (efficiency) 、 最 小 變 異 不 偏 性 (minimum variance
unbiasedness)、漸近不偏性 (asymptotic unbiasedness)、一致性 (consistency)、及

130
充分性 (sufficiency)。

▲常用符號:

我們通常以 θ 代表隨機變數的母數參數, θˆ 代表 θ 的估計式。

當我們以估計式 θˆ 來估計 θ 時, θˆ - θ 稱為估計偏誤(或誤差)。一個良好的估

計式應使估計偏誤愈小愈好。為了去除正負誤差相抵的情形,我們可以平方誤差

(θˆ − θ ) 來衡量偏誤。平均平方誤差 (mean squares error MSE)


2
E (θˆ − θ ) 2 的大小為

另一個衡量估計式是否優良的標準。

 不偏性

不偏估計式

若估計式的平均數等於母體參數值 ( E (θˆ) = θ ) ,則該估計式為不偏估計式

,否則為偏誤估計式。即若 E (θˆ − θ ) = 0 ,則 θˆ 為 θ 的不偏估計式。

Example

1. 為何選擇 X 來估計 µ ?

Ans: X

2. 令 µˆ =
∑ X 為 µ 的一個估計式,問 µ̂ 為 µ 的不偏估計式嗎?
n +1
Ans:

131
3. 樣本變異數 S2 是母體變異數 σ X2 的不偏估計式嗎?
Ans:

▲利用不偏性來判斷估計式時,應注意下列幾點:
(1) 不偏性是指估計式所有可能值的平均數等於母體參數,但就單一數值而言,

仍可能有估計偏誤。例如 X 為母體平均數 µ 的不偏估計式,但若抽取一組樣

本代入 X 中得 X 0 ,不一定等於 µ 。

(2) 若一估計式的偏誤不大,而合乎 (其他的優良特性)時,則仍不失為一個好的


估計式。
(3) 不偏估計式可能找不到,也可能有很多個。

不偏性的定理

若 θˆ1 為 θ1 的不偏估計式,θˆ2 為 θ 2 的不偏估計式,則 aθˆ1 + bθˆ2 ( a 、 b 為常數)

必為 aθ1 + bθ 2 的不偏估計式。

此定理指出:不偏估計式的線性函數 aθˆ1 + bθˆ2 仍是參數線性函數 aθ1 + bθ 2 的不

偏估計式。

 有效性

估計式的有效性是以估計式的平均平方誤差來衡量。若其平均平方誤差
愈小,則代表估計式的有效性愈高(誤差愈小)。有效性有二個:一是絕對有效
性 (absolute efficiency),另一個是相對有效性 (relative efficiency)。
絕對有效性

( )
設 θˆ 為 θ 之估計式,若 θˆ 的平均平方誤差 MSE (θˆ) = E θˆ − θ ,為所有估計
2

132
式中最小者,則稱 θˆ 在估計 θ 時具絕對有效性。實際上必須窮舉才能找到。

相對有效性
ˆ ˆ
設 θˆ 、θˆ 均為 θ 的估計式,若 θˆ 的平均平方誤差相對 θˆ 的平均平方誤差較小

MSE (θˆ)
<1
ˆ
MSE (θˆ)

ˆ
則稱 θˆ 相對 θˆ 在估計 θ 時具相對有效性。

不偏估計式的相對有效性
ˆ ˆ ˆ
設 θˆ 、θˆ 均為 θ 的不偏誤估計式,若 V (θˆ) / V (θˆ) < 1,則 θˆ 相對 θˆ 為有效估計

式。
ˆ
換言之,若有二個不偏估計式 θˆ 、θˆ ,而欲比較其有效性,則可比較兩者的變

ˆ ˆ
異數,若 V (θˆ) / V (θˆ) < 1 , 則 θˆ 相對 θˆ 具相對有效性。

133
圖 估計式的相對有效性

如上圖,θˆ1 與 θˆ2 均為 θ 的不偏估計式,但由圖可知 θˆ1 的分散程度(變異數)較 θˆ2

的分散程度為小,因此 θˆ1 相對 θˆ2 估計 θ 時,具相對有效性。

 一致性:大樣本注重一致性,小樣本注重不偏性。
所謂一致性是指當樣本數增大時,估計值會趨近於母體參數真值的可能

性極高 (機率趨於 1)。比如:X n 為樣本數 n 的樣本平均數,當 n 愈來愈大時,

X n 的抽樣分配的分散度愈來愈小, X n 發生在 µ 附近的機率愈大。亦即當 n

為無窮大時,則 X n 非常接近真實的 µ 值的機率為 1。

134
圖 一致性估計式

判斷一個估計式是否具一致性的定理:

若 θˆn 為不偏誤估計式或漸近不偏估計式,且當 n 趨於無窮大時,其變

異數趨近於零,即 lim V (θˆn ) = 0 ,則 θˆn 為 θ 的一致性估計式。


n →∞

Example

1. 證明 X 與 S2 為 µ X 和 σ X2 的一致性估計式。
Ans:

▲ 那個性質最重要?不一定。
例如有一估計式合乎不偏性,但不是相對有效估計式,而另一估計式為相
對有效估計式,但不是不偏估計式,此兩估計式何者較優實不易比較,如下圖,
此時該如何選擇呢?

135
圖 三個估計式的比較

136
第1章 緒論 第1章 緒論

 學習目的 本章結構

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

第1章 緒論 第1章 緒論

統計學的意義 資料的意義

統計學是一種方法,一種工具。狹義的統計學是指以數字表示的事
實或資料 (data);廣義的統計學是指蒐集、整理、表現、分析及
解釋資料,並藉科學的方法,在不確定的情況下,由樣本資料所獲
得的結果,來推論母體的性質與事實,從而做出適切決策的一門學
科。

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

第1章 緒論 第1章 緒論

統計學的基本概念 統計學的基本概念

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

137
第1章 緒論 第1章 緒論

統計學的基本概念 統計學的基本概念

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

第1章 緒論 第1章 緒論

統計學的種類

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

第1章 緒論 第1章 緒論

統計學的方法 統計學的方法

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

138
第1章 緒論 第1章 緒論

統計學的方法 統計方法的實施步驟

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020 現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

第1章 緒論

統計方法的實施步驟

現代統計學 2版 林惠玲 陳正倉 合著 雙葉書廊 2020

139
第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量
 學習目的 本章結構

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的種類 資料的種類

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的種類 資料的種類

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

140
第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的種類 資料的種類

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的種類 資料的蒐集

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的蒐集 資料的蒐集

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

141
第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的蒐集 資料的蒐集

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的蒐集 資料的蒐集

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量

資料的蒐集 資料的蒐集

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

142
第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量
資料的型態與資料的衡量 資料的型態與資料的衡量

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量 第2章 資料的蒐集與衡量


資料的型態與資料的衡量 有效量度與無效量度

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第2章 資料的蒐集與衡量
數據合不合理

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

143
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

 學習目的 本章結構

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與呈現 類別資料的整理與呈現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與呈現 類別資料的整理與表現

一個完整的統計表至少應包括:
標題(title)。包括表號(表序)與標題。
標目(label)。標目是用來表示表身所要表示的項目或事實。
表身(body)。表身是資料的主體,是統計表的核心。
資料來源及附註。應標明資料來源出處,以方便讀者查閱。

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

144
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現


圖3.1 Excel 的繪圖功能
類別資料的整理與表現 類別資料的整理與表現

 統計圖
將資料以點、線、面、體等圖形為主,以文字數字為輔的表現方式
即為統計圖。意即利用點的多寡,線的長短粗細、起伏趨勢,面積
與體積的大小,顏色深淺來表示資料的特性者稱之為統計圖。

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

145
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

146
1-1
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

類別資料的整理與表現 類別資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

147
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

148
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

149
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

數量資料的整理與表現 數量資料的整理與表現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現


枝葉圖 枝葉圖

 枝葉圖
將觀察值分成二部份,一部份為枝,另一部份為葉。
枝的部份為高位數字,葉的部份為低位數字。

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

150
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現
枝葉圖 枝葉圖

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

時間數列資料的整理與呈現 時間數列資料的整理與呈現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

時間數列資料的整理與呈現 兩組數量資料的整理與呈現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

151
第3章 檢視資料的分布-以統計表統計圖呈現 第3章 檢視資料的分布-以統計表統計圖呈現

兩組數量資料的整理與呈現 兩組數量資料的整理與呈現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020 現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

第3章 檢視資料的分布-以統計表統計圖呈現

兩組數量資料的整理與呈現

現代統計學 林惠玲 陳正倉 合著 雙葉書廊發行 2020

152
從標準差除以 n 或除以 n − 1 談起

丁村成

1. 前言
根據民國八十四年教育部頒佈的高級中學數學課程標準, 所編寫出的教科書自八十八年九
月開始使用。 當初大家對統計教材中 「標準差是除以 n 或 n − 1」 的疑問, 在國立編譯館的主
導之下, 現行版本一律選取了除以 n − 1 的情形。 如今, 雖然教師與學生都己經默默的接受, 但
是否代表在教與學已經沒有任何爭議了呢? 值得我們進一步反思。 筆者也藉此機會, 探討這一
批新教材存活下來的六種教科書, 為什麼會找不到一本獨具創意的版本? 其問題的癥結也將在
文章最後做扼要說明。 在新課程標準修訂已接近完成之際, 即將有新教材要在九十五年開始實
施, 筆者願以參與教學的實際經驗, 提出最誠摯具體的建議, 給下一波要編寫高中數學教科書的
專家學者們參考。

2. 從高觀點看標準差之定義
統計學是關於數據資料之收集、 整理、 分析和推論的一門學科, 其內容可區分為敘述統計
學 (descriptive statistics) 和推論統計學 (inferential statistics) 兩大部分。 敘述統計學
在探討數據的收集、 資料的整理與描述等。 如果研究中可以得到整個母體 (population) 資料
X1 , X2 , . . . , XN , 那麼其分佈狀況即已完全獲得掌握。 我們特別有興趣的母體平均數
N
1 X
µ= Xi = X,
N i=1
母體變異數
N
1 X
σ2 = (Xi − µ)2 ,
N i=1
母體標準差 v
N
u1 X
u
σ=t (Xi − µ)2 .
N i=1

153
10 數學傳播 29 卷 1 期 民 94 年 3 月

亦因而可以得到。
一般若不作全面性的普查 (census), 母體之 µ 與 σ 的真正數值根本無法得到。 在研究上
為了節省時間與經費, 實際作法往往只抽取一部分代表性樣本 x1 , x2 , . . . , xn , 並以樣本平均數
n
1X
x= xi ,
n i=1

樣本變異數
n
1 X
s2 = (xi − x)2 ,
n − 1 i=1
樣本標準差 v
n
1 X
u
u
s=t (xi − x)2 .
n − 1 i=1
分別推估 µ, σ 2 和 σ。 至於式中之除數為 n 或 n − 1, 其背景就跟推論統計學所要研究的不偏
估計理論有關。
在統計上一個好的估計量 (estimator) 常被要求滿足不偏性 (unbiasedness)、 一致性
(consistency)、 充分性 (sufficiency) 等性質 (Mood, Graybill and Boes, 1974)。 母體參
數 θ 之不偏估計量的意義是: 將任意抽取之樣本視作母體計算參數, 若值 θ̂ 之數學期望值
(mathematical expectation 或 mean value) 等於母體真正值 θ, 那麼我們稱它為不偏估計
量 (unbiased estimator), 表示的方式為

E(θ̂) = θ.

不偏估計的條件 E(θ̂) = θ 等價於 E(θ̂ − θ) = 0, 其中 θ̂ − θ 是估計值 θ̂ 與其真正值 θ 之


偏差。 由於抽樣調查中抽取樣本的隨機性 (randomness), 導致偏差 θ̂ − θ 也是隨機的, 其值可
大可小亦可正可負。 所以, 不偏估計之具體意義是: 每次使用 θ̂ 來推估 θ 是會存在偏差的, 但
若能舉遍全部樣本, 則所有這類偏差的平均數 (或數學期望值) 為 0。 舉個例子, 我們每天喝標
示 200c.c 的瓶裝鮮奶時, 今天可能多喝了 2c.c, 明天可能少喝了 2c.c, 但長期喝此種鮮奶的偏
差之平均值是 0, 此乃不偏多也不偏少之意。
假設樣本資料 x1 , x2 , . . . , xn 是從一個平均數 µ 而變異數 σ 2 之母體中經由簡單隨機抽
樣 (simple random sampling) 而來, 若所選取之樣本可以再放回, 亦即 xi 的選取與 xj 之
選取彼此不相關 (i 6= j)。 我們可以證得樣本平均數 x 是母體平均數 µ 之不偏估計量, 因為
x1 + x2 + · · · + xn
 
E(x) = E
n
1
= E(x1 + x2 + · · · + xn )
n

154
從標準差除以 n 或除以 n − 1 談起 11

1
= [E(x1 ) + E(x2 ) + · · · + E(xn )]
n
1
= (µ + µ + · · · + µ)
n
1
= (nµ) = µ.
n
也可以證明樣本變異數 s2 是母體變異數 σ 2 的不偏估計量, 由於
n
!
2 1 X
E(s ) = E (xi − x)2 )
n − 1 i=1
n n
!
1
x2i − 2x · xi + nx2
X X
= E
n−1 i=1 i=1
n
!
1 X
= E x2i − 2nx2 + nx2
n i=1
n
!
1 X
= E x2i − nx2
n−1 i=1
n
" #
1 X
= E(x2i ) − nE(x2 )
n − 1 i=1
1
= {n[Var (xi ) + E 2 (xi )] = n[Var (x) + E 2 (x)]}
n−1" !#
1 2 2 σ2 2
= n(σ + µ ) − n +µ
n−1 n
1
= (nσ 2 − σ 2 )
n−1
= σ2 .

其中 Var (X) = E(X 2 ) − E 2 (X) 為 X 之變異數 (Variance)。


σ2
上述證明中所用到的 Var (x) = n
, 只有當各樣本為獨立時才成立。 但一般的簡單隨機抽
樣是不放回的, 此時任二樣本皆不彼此獨立, 若我們接受樣本變異數
n
1 X
s2 = (xi − x)2
n − 1 i=1
而母體變異數為
N
1 X
S2 = (Xi − X)2
N − 1 i=1
則 x 是 X 之不偏估計量而 s 是 S 之不偏估計量 (Cochran, 1977), 證明如下: 首先
1 X n!(N − n)! X
E(x) = N  x= (x1 + x2 + · · · + xn )
n · N!
n

155
12 數學傳播 29 卷 1 期 民 94 年 3 月
 
N
其中 表示對所有 種可能的組合求和。 由排列組合概念知
P
n
!
X N −1
(x1 + x2 + · · · + xn ) = · (X1 + X2 + · · · + XN )
n−1
(N − 1)!
= (X1 + X2 + · · · + XN )
(n − 1)!(N − n)!
故得到
n!(N − n)! (N − 1)!
E(x) = · · (X1 + X2 + · · · + XN )
n · N! (n − 1)!(N − n)!
X1 + X2 + · · · + XN
=
N
=X

另外由於
n
X n
X
(xi − x)2 = (xi − X + X − x)2
i=1 i=1
n
X n
X
= (xi − X)2 + 2(X − x) · (xi − X) + n(X − x)2
i=1 i=1
n
(xi − X)2 − n(x − X)2
X
=
i=1

又因為
n n
" # " #
1X 1 X
E (xi − X)2 = E (xi − X)2
n i=1 n i=1
N
1 n X
= · · (Xi − X)2
n N i=1
N
1 X
= (Xi − X)2
N i=1

以及
1
E(x − X)2 = E(x1 − X + x2 − X + · · · + xn − X)2
n2  
" n # n
1 X 1 X
= 2E (xi − X)2 + 2 E  (xi − X)(xj − X)
n i=1 n i6=j
   
N −1 N N −2 N
1 n−1 X 1 n−2 X
= 2 · N  (Xi − X)2 + 2 N  (Xi − X)(Xj − X)
n i=1 n i6=j
n n

156
從標準差除以 n 或除以 n − 1 談起 13

N N
1 X 1 n(n − 1) X
= (Xi − X)2 − 2 · · (Xi − X)2
nN i=1 n N(N − 1) i=1
N
N −n X
= (Xi − X)2
nN(N − 1) i=1
可知
n N
" # " #
1X 1 N −n X
E (xi − x)2 = − · (Xi − X)2
n i=1 N nN(N − 1) i=1
N
n−1 1 X
= · · (Xi − X)2
n N − 1 i=1
因此得到
n
" #
1 X
E(s2 ) = E · (xi − x)2
n − 1 i=1
N
n−1 1 X
= · · (Xi − X)2
n − 1 N − 1 i=1
N
1 X
= · (Xi − X)2
N − 1 i=1
= S2
1 Pn 1 Pn
所以 n−1 i=1 (xi − x)2 在不偏性的考慮下, 當然要比 n i=1 (xi − x)2 具有優勢。
至於樣本平均數是母體平均數之不偏估計量, 以及樣本變異數是母體變異數之不偏估計量,
此時是否就表示估計值與真正值恰好相等? 這是統計教學上一個容易受到誤解的概念。 統計上
我們說樣本平均數 (變異數) 是母體平均數 (變異數) 的估計量, 在以往所學的確定性數學中
「是」 就被理解成 「等於」, 但在隨機性數學中 「是」 卻包含有 「機率的含義」, 亦即上面的 「是」
並非樣本平均數恰好等於母體平均數。 它的實際意義應解釋為: 如果我們知道了樣本平均數的
時候, 那麼母體平均數有很大機會落在樣本平均數之附近。

3. 標準差是除以 n 或除以 n − 1
新教材經過了第一年的爭執與討論之後, 有些現行教科書為了說明標準差除以 n − 1 的理
由, 在第二年之教材內容中補上了下列的證明:
n n
1X 1X
(xi − µ)2 = [(xi − x) + (x − µ)]2
n i=1 n i=1
n
1X
= [(xi − x)2 + 2(xi − x)(x − µ) + (x − µ)2 ]
n i=1

157
14 數學傳播 29 卷 1 期 民 94 年 3 月

n n
1X 2 1X
= (xi − x) + (x − µ)2
n i=1 n i=1
n
1X
≥ (xi − x)2 .
n i=1
N
X
Pn
據此來解釋 1
n i=1 (xi
2
− x) 當作 σ = 2 1
N
(xi − µ)2 的估計會有低估的現象, 因而統計學
i=1
n
X N
X
家改以 1
n−1
(xi − x)2 作為 σ 2 = 1
N
(xi − µ)2 之估計。 試問: 僅憑上面一段證明就可以
i=1 i=1
n
X
確定 1
n
(xi − x)2 完全不合適嗎? 換成除以 n − 1 後難道不怕會高估 σ 2 嗎? 為何不除以
i=1
其他數而偏偏要找 n − 1 呢? 面對學生 (尤其是程度好的學生) 這一連串的疑惑, 不知道老師
們在教學時要如何解釋?
根據筆者之實際教學經驗, 要表達一群數據資料之間的離散程度, 很自然會想到利用資料
離開其中心值有多遠來表示。 假設我們要考慮樣本資料 x1 , x2 , . . . , xn 與其平均數 x 的差異
n
X n
X n
X n
X
1 1
xi − x, 由於 x = n
xi 恆可得到 (xi − x) = xi − nx = 0, 利用 n
(xi − x)
i=1 i=1 i=1 i=1
會因為正負抵消的緣故, 根本無法呈現資料間的分散程度。 若將 xi − x 改成 |xi − x| 而計算
n
X
1
n
|xi − x|, 就可以得知這群資料間的離散程度, 它代表所有樣本資料到其中心值的平均距
i=1
離。 但因數學上處理絕對值的運算較為麻煩, 促使統計上必須找一種新的差異量數, 使其既能代
n
X
表資料間之分散情形又能從事簡單的代數運算, 轉而採取了 1
n
(xi − x)2 的作法。 其次, 為
i=1
(xi − x)2 開平方根, 最後才定義了
X
1
了兼顧此差異量數與原來資料的單位一致, 我們還將 n
樣本標準差為 v
n
u1 X
u
t (xi − x)2 .
n i=1
從上面的討論可知, 在高中課程中採取除以 n 的定義, 不論在教與學都比較符合高中學生的思
維, 否則學習者很難將新的學習內容與其舊經驗取得關聯, 他們會轉而偏向機械式記憶。 美國當
代認知心理學家 Ausubel 主張要讓學生之學習成為有意義學習 (meaningful learning), 其先
決條件就是學習者能將所學內容與本身已有的先備知識 (preknowledge) 聯結起來, 整個學習
活動才容易被引導進入有意義學習活動 (余民寧, 2003)。 因此, 大多數學生在高中階段之認知
n
X
(cognition) 根本無法瞭解不偏估計的意義, 怎能盼望他們可以掌握 s2 = 1
n−1
(xi − x)2 中
i=1
要除以 n−1 之理由呢? 課程的設計與教材之編寫必須從學生認知結構 (cognitive structure)
的角度出發, 才能使學習者取得較佳的學習效果。 當然, 筆者也同意要儘量站在高觀點的立場來
編寫教材, 但是當此立場與學習者之認知有所衝突時, 便應該以學生的可接受性為主要考量。 否

158
從標準差除以 n 或除以 n − 1 談起 15

則, 獲得的知識若沒有完備結構作聯結, 那是一種多半會被遺忘的知識, 一串不連貫的論據在記


憶中僅有短促的可憐的壽命 (李士錡, 2001), 也難怪很多人學完統計就
v「統統忘記」 了。 如果真
u n
u 1 X
的需要再進一步說明, 也僅能輕描淡寫指出統計理論上也有採用 s = t n−1 (xi − x)2 來定
i=1
義樣本標準差, 其目的是為了消除它在估計理論上的偏差。 在高中階段對於樣本標準差的定義,
我們不可能去分成樣本獨立時 E(s2 ) = σ 2 , 樣本不獨立時 E(s2 ) = S 2 來討論, 畢竟這是一
段學生不可負荷的認知過程。
n
X
事實上, 在估計理論 s = 2 1
n−1
(xi − x)2 是 σ 2 或 S 2 的不偏估計, 但必須注意 s 並
i=1
非 σ 或 S 之不偏估計, 因此不論統計上使用哪種方法, 對標準差的估計都有其誤差存在。 正因
為其誤差的不可避免, 雖然有些電腦上之樣本標準差採用除以
v n − 1 來設計, 但在國外的中學
u n
u X
(grade 9∼12) 教材大都仍然以 t n1 (xi − x)2 進行教學。 高中統計教材所涉及的數學知識
i=1
不多也不難, 這一階段的統計須著重於概念的理解與掌握, 教學之目標應引導學生貼近生活。 要
成功地實施統計內容的教與學, 教材與老師不僅要重視隨機性數學的預備知識, 還必須讓學生
瞭解它與確定性數學之差異, 而不是把統計當成計算標準答案的工具。 因為在統計的教學中, 面
對一組數據可能會有不一樣的解釋, 同一個問題也有可能產生不同的答案, 所以在教材上根本
沒有必要規定統一的公式作為分析數據之絕對標準。

4. 一些想法與建議
看到擺在書房的高中數學教科書, 再仔細比較各版本的內容, 使我想起了數學傳播二十四
卷第三期 65 頁一段審稿人的話 「· · · 試問: 有多少教師瞭解或設法瞭解課程更改的用意? 有多
少教師肯以學生的學習立場來檢討自己的教學? 有多少編者肯為那些在學習上居於弱勢的學生
用心寫一份妥適的教材? 如今有了新課程與新教材, 但我一點都沒有高興, 心情只是更加的沉
悶」 (數學傳播, 2000)。 看了這位學者語重心長的言論, 讓身兼教師與編者雙重身份的我, 內心
感到無限慚愧而且百感交集。 在新課程標準及教材即將誕生的時刻, 任何耳目一新的改革都是
令人期待的。 面對整個數學教育的改革浪潮, 對學生之數學學習尋求更好的教學方法, 為學生的
學習內容設計適當之課程規劃, 應是數學界上下共同的責任和目標。
筆者認為每一次的課程改革, 除了要求負責課程標準制定與編寫課程內容的人員有所變革
之外, 也在暗示基層教師在教法上必須作些改變, 甚至對於教學內容要多付出一些心力。 舉一
個高中教師都感到困擾的例子: 當老師在教 「極限的應用」 這個單元時, 師生都會不耐煩於一
再重覆 「分割 → 求和 → 取極限」 的題目, 教學中往往有學生反應 「算式太麻煩了啦! 聯
考怎麼可能考?」, 「利用補習班的方法, 直接積分多快啊!」, 以致很多學校老師也直接教積分公

159
16 數學傳播 29 卷 1 期 民 94 年 3 月

式或乾脆簡單帶過, 這些都是不負責的教學方法。 筆者在教這一部分的時候, 課堂上我先介紹


y = f (x) = x2 在 0 ≤ x ≤ 1 與 x 軸所圍的面積, 並探討分割所得 「上和」 Un 與 「下和」
1
Ln 誤差 |Un − Ln | < 100
之最小自然數 n 應取多少? 為了不讓學生因冗長的計算感到不耐
煩, 緊接著我就舉了下列的問題:

設曲線 y = f (x) 與 y = 0 在 0 ≤ x ≤ 1, 1 ≤ x ≤ 2, 2 ≤ x ≤ 3, 3 ≤ x ≤ 4 所
圍的面積分別為 52 , 32 , 34 , 83 , 求下列各極限值為何?

n
!
1X k
lim f =?
n→∞ n n
k=1
n
!
2X 2k
lim f =?
n→∞ n n
k=1
n
!
1X k
lim
n→∞ n
f 2+ =?
k=1 n
n
!
3X 3k
lim f 1+ =?
n→∞ n n
k=1
n
!
4X 3k
lim f 1+ =?
n→∞ n n
k=1

當講解完前面3小題的時候, 大部分學生臉上開始露出愉快的表情, 甚至有學生已直觀的看出後


面兩小題之答案, 也排除了聯考不可能考或計算太麻煩的疑慮, 使學生在上課中仍然維持良好
的學習態度。 教學中教師應恰當地利用相對直觀的東西作為抽象概念規定的表徵 (representa-
tion), 讓學生能逐步地學會其核心概念的數學化 (mathematising)。 荷蘭數學教育學家 Freuden-
thal 認為數學化在現實世界裡是瞭解和深化理論的過程, 其目的是要把生活世界之概念引向符
號世界 (Freudenthal, 1991)。 因此, 教師若能充分了解課程安排的用意, 進而提出更符合學生
認知的學習內容和方法, 往往能透過課堂上之教學將教科書的缺點降到最低。
總之, 筆者要不厭其煩的再次強調, 教科書的編寫必須深入探討學生原有的認知結構, 如
此才能選擇更適合學生特點的知識, 並且也讓教師在課堂上順利的進行教學。 在這種兼顧教與
學之理念基礎上, 教師不應僅僅是教材的使用者, 更應該也是教材的開發與修正者。 畢竟一本完
善的教科書不管是由教師的教學適用性, 抑或從學生之學習需求性, 都必須透過實際的課堂教
學活動來檢驗。 最近在 Notices of the AMS 有一篇文章中作者提到: 「若數學家願意從事善意
和有建設性的評論, 而不是傲慢與反諷的批評, 那麼美國數學戰爭的結果才不會繼續造成數學
教育界的傷害」 (Ralston, 2004)。 不可否認, 數學家所擁有的數學知識, 使得他們對於高中數
學什麼概念是重要的, 具備有較寬廣的洞察能力, 但數學家並不完全了解有些想法在課堂上是

160
從標準差除以 n 或除以 n − 1 談起 17

不易實行的。 因此, 當高中教師與大學教授有機會一起編寫教材時, 必須避免教授的權威凌架在


教師之上的心態, 唯有透過理性的討論才能呈現更符合教學需求的內容。 另外, 也希望負責課程
標準制訂與審查的專家學者, 應該抱持較具彈性的眼光來審查課程內容。 只要合乎數學理論的
規範與系統, 應該留給編寫作者們更大的發揮空間, 如此才能期盼寫出更有特色的全新教材, 否
則所有版本之內容千篇一律, 感覺有點浪費資源。 如果當初編譯館不要硬性規定標準差的定義,
或許目前會出現其他各種更有創意的表達方式。 畢竟, 開放版本也正是發展多元教材的最佳時
機, 我們豈能錯過這一大好的改革機會。

參考文獻
1. 李士錡 (2001), PME: 數學教育心理, 上海華東師範大學出版社, p22∼p63。
2. 余民寧 (2003), 有意義的學習—概念構圖之研究, 台北商鼎文化出版社, p41∼p58。
3. A. M. Mood, F. A. Graybill and D. C. Boes (1974), Introduction to the Theory of
Statistics, McGraw-Hill Book Company, p315∼p321.
4. W. G. Cochran (1977), Sampling Techniques, Third Edition, John Wiley & Sons, Inc,
p.18∼p.27.
5. H. Freudenthal, Revisiting Mathematics Education, Kluwer Academic Publishers, Dor-
drecht/Boston/London, 1991, p30∼p42.
6. A. Ralston (2004), Research Mathematicians and Mathematics Education: A Critique,
Notices of The AMS, April 2004, p403∼p411.

—本文作者任教於建國中學, 目前積極從事數學教育理論與實踐之研究—

161
Table 1a: Standard Normal Probabilities
The values in the table below are cumulative probabilities for the standard normal distribution Z (that is, the normal
distribution with mean 0 and standard deviation 1). These probabilities are values of the following integral:
1 − x2 2
P(Z ≤ z) = ∫
z
e dx
−∞

Geometrically, the values represent the area to the left of z under the density curve of the standard normal
distribution:

-4 -3 -2 -1 0 1 2 3 4
z

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641

162
Table 1b: Standard Normal Probabilities
The values in the table below are cumulative probabilities for the standard normal distribution Z (that is, the normal
distribution with mean 0 and standard deviation 1). These probabilities are values of the following integral:
1 − x2 2
P(Z ≤ z) = ∫
z
e dx
−∞

Geometrically, the values represent the area to the left of z under the density curve of the standard normal
distribution:

-4 -3 -2 -1 0 1 2 3 4
z

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

163
Table 2: t-Distribution Critical Values
The entries in the table below are the critical values tn , p , where n represents the number of degrees of
freedom and p is the upper tail probability. That is, if T has the t-distribution with n degrees of freedom,
then the value in the table represents the number tn , p such that P (T > tn , p ) = p .

Upper Tail Probability p


d.f. 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768
24 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
35 0.852 1.052 1.306 1.690 2.030 2.438 2.724 2.996 3.340 3.591
40 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
45 0.850 1.049 1.301 1.679 2.014 2.412 2.690 2.952 3.281 3.520
50 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
55 0.848 1.046 1.297 1.673 2.004 2.396 2.668 2.925 3.245 3.476
60 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
65 0.847 1.045 1.295 1.669 1.997 2.385 2.654 2.906 3.220 3.447
70 0.847 1.044 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.435
75 0.846 1.044 1.293 1.665 1.992 2.377 2.643 2.892 3.202 3.425
80 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
85 0.846 1.043 1.292 1.663 1.988 2.371 2.635 2.882 3.189 3.409
90 0.846 1.042 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402
95 0.845 1.042 1.291 1.661 1.985 2.366 2.629 2.874 3.178 3.396
100 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
150 0.844 1.040 1.287 1.655 1.976 2.351 2.609 2.849 3.145 3.357
250 0.843 1.039 1.285 1.651 1.969 2.341 2.596 2.832 3.123 3.330
1000 0.842 1.037 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300

∞ 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291

164
Table 3: Chi-Square Distribution Critical Values
The entries in the table below are the critical values χ n2, p , where n represents the number of
degrees of freedom and p is the upper tail probability. That is, if X has the chi-square
distribution with n degrees of freedom, then the value in the table represents the number χ n2, p
such that P ( X > χ n2, p ) = p .
Upper Tail Probability p
d.f. 0.995 0.975 0.95 0.90 0.80 0.20 0.10 0.05 0.025 0.005
1 0.000 0.001 0.004 0.016 0.064 1.642 2.706 3.841 5.024 7.879
2 0.010 0.051 0.103 0.211 0.446 3.219 4.605 5.991 7.378 10.597
3 0.072 0.216 0.352 0.584 1.005 4.642 6.251 7.815 9.348 12.838
4 0.207 0.484 0.711 1.064 1.649 5.989 7.779 9.488 11.143 14.860
5 0.412 0.831 1.145 1.610 2.343 7.289 9.236 11.070 12.833 16.750
6 0.676 1.237 1.635 2.204 3.070 8.558 10.645 12.592 14.449 18.548
7 0.989 1.690 2.167 2.833 3.822 9.803 12.017 14.067 16.013 20.278
8 1.344 2.180 2.733 3.490 4.594 11.030 13.362 15.507 17.535 21.955
9 1.735 2.700 3.325 4.168 5.380 12.242 14.684 16.919 19.023 23.589
10 2.156 3.247 3.940 4.865 6.179 13.442 15.987 18.307 20.483 25.188
11 2.603 3.816 4.575 5.578 6.989 14.631 17.275 19.675 21.920 26.757
12 3.074 4.404 5.226 6.304 7.807 15.812 18.549 21.026 23.337 28.300
13 3.565 5.009 5.892 7.042 8.634 16.985 19.812 22.362 24.736 29.819
14 4.075 5.629 6.571 7.790 9.467 18.151 21.064 23.685 26.119 31.319
15 4.601 6.262 7.261 8.547 10.307 19.311 22.307 24.996 27.488 32.801
16 5.142 6.908 7.962 9.312 11.152 20.465 23.542 26.296 28.845 34.267
17 5.697 7.564 8.672 10.085 12.002 21.615 24.769 27.587 30.191 35.718
18 6.265 8.231 9.390 10.865 12.857 22.760 25.989 28.869 31.526 37.156
19 6.844 8.907 10.117 11.651 13.716 23.900 27.204 30.144 32.852 38.582
20 7.434 9.591 10.851 12.443 14.578 25.038 28.412 31.410 34.170 39.997
21 8.034 10.283 11.591 13.240 15.445 26.171 29.615 32.671 35.479 41.401
22 8.643 10.982 12.338 14.041 16.314 27.301 30.813 33.924 36.781 42.796
23 9.260 11.689 13.091 14.848 17.187 28.429 32.007 35.172 38.076 44.181
24 9.886 12.401 13.848 15.659 18.062 29.553 33.196 36.415 39.364 45.559
25 10.520 13.120 14.611 16.473 18.940 30.675 34.382 37.652 40.646 46.928
26 11.160 13.844 15.379 17.292 19.820 31.795 35.563 38.885 41.923 48.290
27 11.808 14.573 16.151 18.114 20.703 32.912 36.741 40.113 43.195 49.645
28 12.461 15.308 16.928 18.939 21.588 34.027 37.916 41.337 44.461 50.993
29 13.121 16.047 17.708 19.768 22.475 35.139 39.087 42.557 45.722 52.336
30 13.787 16.791 18.493 20.599 23.364 36.250 40.256 43.773 46.979 53.672
31 14.458 17.539 19.281 21.434 24.255 37.359 41.422 44.985 48.232 55.003
32 15.134 18.291 20.072 22.271 25.148 38.466 42.585 46.194 49.480 56.328
33 15.815 19.047 20.867 23.110 26.042 39.572 43.745 47.400 50.725 57.648
34 16.501 19.806 21.664 23.952 26.938 40.676 44.903 48.602 51.966 58.964
35 17.192 20.569 22.465 24.797 27.836 41.778 46.059 49.802 53.203 60.275
36 17.887 21.336 23.269 25.643 28.735 42.879 47.212 50.998 54.437 61.581
37 18.586 22.106 24.075 26.492 29.635 43.978 48.363 52.192 55.668 62.883
38 19.289 22.878 24.884 27.343 30.537 45.076 49.513 53.384 56.896 64.181
39 19.996 23.654 25.695 28.196 31.441 46.173 50.660 54.572 58.120 65.476
40 20.707 24.433 26.509 29.051 32.345 47.269 51.805 55.758 59.342 66.766
45 24.311 28.366 30.612 33.350 36.884 52.729 57.505 61.656 65.410 73.166
50 27.991 32.357 34.764 37.689 41.449 58.164 63.167 67.505 71.420 79.490
60 35.534 40.482 43.188 46.459 50.641 68.972 74.397 79.082 83.298 91.952
70 43.275 48.758 51.739 55.329 59.898 79.715 85.527 90.531 95.023 104.215
80 51.172 57.153 60.391 64.278 69.207 90.405 96.578 101.879 106.629 116.321
90 59.196 65.647 69.126 73.291 78.558 101.054 107.565 113.145 118.136 128.299
100 67.328 74.222 77.929 82.358 87.945 111.667 118.498 124.342 129.561 140.169

165
統計學 (一)

請收集過去 2019/01/01~2022/12/31 的台灣加權指數每日報酬率和每

日收盤價資料。並回答以下問題。

1. 請問過去 2019/01/01~2022/12/31 每日報酬率的算術平均數、中位

數、變異數各是多少?

2. 請問過去 2019/01/01~2022/12/31 每日收盤價的算術平均數、中位

數、變異數各是多少?

3. 若將 2019/01/01~2022/12/31 台灣加權指數每日報酬率視為母體,

請問在這段時間中隨機投資大盤 36 天,算術平均報酬率破 10%的

機率是多少?

4. 若將 2019/01/01~2022/12/31 台灣加權指數每日報酬率視為母體,

請問在這段時間中隨機投資大盤 36 天,算術平均報酬率低於 5%

的機率是多少?

5. 若將 2019/01/01~2022/12/31 台灣加權指數每日報酬率視為母體,

請問在這段時間中隨機投資大盤 36 天,算術平均報酬率不賠錢的

機率是多少?

You might also like