逢 甲 大 學 統 計 與 精 算 研 究 所 碩 士 論 文
評估美國職業籃球球隊戰績的預測策略 Assessment of forecasting strategy of the U.S. professional basketball team record
指導教授: 吳榮彬 研究生: 廖御佑
中 華 民 國 一 百 年 六 月
評估美國職業籃球球隊戰績的預測策略
摘要 數據分析 (data analysis) 可以說是由統計學與資料採礦 (Data Mining) 結合而成的一門科學, 並且於 90 年代迅速的發展, 隨著電腦的快速發
展, 加強了軟體的運算的能力, 現今幾乎每個領域都需要使用數據分析做 為分析的工具, 至此數據分析扮演了重要的角色。 於近幾年數據分析的技 術更是廣泛的運用在各項球類運動, 在北美四大職業運動當中美國職業籃 球聯盟 (National Basketball Association,NBA) 是最晚發展數據分析 的球類運動, 但藉由數據分析的技術, 明顯有助於球隊; 然而截至目前數 據分析的技術大多運用於球員的評價與交易、 球員之間的比較、 選秀會、 預測球隊賽季勝率與勝場數等等; 對於預測球隊比賽的勝負這部份則較少 發展, 因此本研究將球隊過往比賽過的資料經由數據分析的過程, 來判斷 球對於下一場比賽的勝負情況, 並且結合軟體的運用, 發展一套完整的預 測系統, 藉此快速獲得比賽的預測結果。
關鍵詞: 數據分析、 統計學、 資料採礦、 美國職業籃球聯盟、 預測、 預測系統
1
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
Abstract It could say that data analysis is a science which combined by statistics and Data Mining, it developed since 19900 s. According to the era of computer explosion, software’s evolution became more powerful. In addition, nowadays most of areas are using ”data analysis” as a main tool. As a result, data analysis plays a significant role. Data analysis has been used by every kind of ball games in recent years. There are four professional sports in the North American. National Basketball Association is the latest onewhich used the data analysis. According to the program of data analysis, it did bring advantage to teams. Although the data analysis developed rarely on forecasting victory and defeat, it could help every team on evaluating and trading players. In addition,it can be used on comparing players and draft. Moreover, it can also be used on forecasting the team wins and win-loss percentage. Therefore, this research would put past games0 record into the program, so that data analysis could be help on judging future games. Furthermore, the research would also combine the data analysis with running software. As a result, a faster forecasting system and a faster games’ result would be presented.
Keywords: data analysis、statistics、data mining、National Basketball Association、forecasting、forecasting system
2
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
目錄 1
緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.1
研究動機與目的 . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
文獻回顧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2.1
NBA 的起源與發展 . . . . . . . . . . . . . . . . . . .
2
1.2.2
NBA 數據的發展 . . . . . . . . . . . . . . . . . . . .
4
1.2.3
NBA 數據的應用 . . . . . . . . . . . . . . . . . . . .
6
2
系統架構 . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3
統計用途 . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4
5
6
3.1
自助法(Bootstrap Method) . . . . . . . . . . . . . . . . . . . 13
3.2
Adaboot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3
調和平均數(Harmonic mean) . . . . . . . . . . . . . . . . . . 16
3.4
球員貢獻率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.5
模擬賠率方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 19
預測策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4.1
選擇模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2
TWP策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.3
PCRS策略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
實例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.1
TWP策略結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2
PCRS策略結果 . . . . . . . . . . . . . . . . . . . . . . . . . 31
結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 附錄 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 A NBA球隊分佈表 . . . . . . . . . . . . . . . . . . . . . . . . 35 B NBA術語中英對照表 . . . . . . . . . . . . . . . . . . . . . . 37
3
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 1 章 緒論 第 1.1 節 研究動機與目的 隨著科技的進步, 數據分析已經是這時代所必備的技術, 數據分析的運用 已經不局限於任何領域, 目前幾乎在各個領域上都能見到運用數據分析所得到的 成果, 就連早期被認為是單純的球類競賽也加入數據分析的行列。 在北美四大職 業運動中棒球是最先使用此項技術的球類運動, 而後冰球、 美式足球、 籃球也開 始運用數據分析的技術。 Michael Lewis 撰寫的魔球-逆境中制勝的智慧(Money ball) 裡指出, Bill James 是最早運用數據分析來當作決策的第一人, 他設計了
一套適用於挑選棒球球員的公式: 得分=(安打 + 保送) × 壘打數/(打數 + 保送) 藉由這個公式所挑選出來的球員在美國職棒大聯盟 (Major League Baseball, MLB) 日後的發展遠遠超過專業球探當初所認定的結果, 由此可見數據分析的預
測結果相較於具有專業經驗的專家而言, 來的更成功。 傳統對於比賽的預測或是 選秀都是出至於這項領域具有豐富經驗的專家來做為評斷, 但是人為的判斷容易 做出偏頗的預測, 因為人為的判斷會由於自我的過度自信或是個人喜好而做出錯 誤的判決, 所以人們在 「預測」 這件事情上本身就有不利的條件存在, 但是數據分 析預測出來的結果不會因為這些因素而出現錯誤, 不過數據分析並非萬能, 還是 需要有專家的知識判斷才能有所貢獻。 在這樣的前提下, 本研究決定對北美四大職業運動中最晚接觸數據分析的 美國職業籃球聯賽 (NBA) 進行數據分析, 藉由籃球數據分析專家所提出的理論, 例如:Dean Oliver 在Basketball On Paper 裡所已提出的一些理論,Possession 理論, 並在 Possession 的定義下提出三項新的數據 (Scoring possession 、Field percentage、Play percentage), 藉此來判斷球員與球隊的狀況; 以及 Four Factors 理論, 提出四項影響比賽勝負的重要因素 (Shooting、Turnovers、 Rebounding、Free Throws), 藉此來判別球隊於賽事中的優劣。 上述所提到的數據都是經
由賽後記錄表 (Box Score) 中的數據經計算轉換而成, 並對這些數據資料進行數 據分析, 找出影響 NBA 球隊勝負的關鍵數據, 並對球隊下一場比賽的結果進行 預測。 除此之外, 利用 Microsoft Excel、R 軟體、RAnalyticFlow 這三種軟體建 立一套完整的預測系統。
1
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 1.2 節 文獻回顧 第 1.2.1 小節 NBA 的起源與發展 1940-1950 年: 起源 1. 1946 年 6 月 11 日, 正式組成美國籃球協會 (Basketball Association of America, BAA), 當時的球隊主要都是位於美國東北部以及中西部據有冰球球隊的老闆名下。 2. 1946 年 11 月 1 日,BAA 歷史上第一場正式比賽, 由 Toronto Huskies 主場迎戰 New York Knickerbockers, 地點位於多倫多 (Toronto)。 3. 1949 年 8 月 3 日,BAA 同意與 NBL(National Basketball League) 合併, 組成新
的聯盟, 也就是現在眾所皆知的 NBA(National Basketball Association), 新的 聯盟總共有 17 支球隊分佈於各個城市。 1950 年, 聯盟縮減到剩下 11 支球隊, 一直到 4. 1954 年, 更減少到剩下 8 支球隊在聯盟, 共有 Knicks、Celtics、Warriors、Lakers、 Royals/Kings、Pistons、Hawks 跟 Nationals/76ers。 之後為了球隊的發展, 有些
球隊遷移到大城市。 5. 1949-54 賽季,Minneapolis Lakers 在這期間獲得 5 次 NBA 總冠軍, 成為了 NBA
史上的第一個王朝。 6. 1954 年聯盟引進 24 秒的規則。 7. 1957 年, 從新秀中鋒 Bill Russell 加入 Boston Celtics 開始, 在傳奇教練 Red Auerbach 的帶領下, 先後獲得 13 個 NBA 總冠軍, 成就了當時的 Boston Celtics
王朝。 8. 1959 年,Wilt Chamberlain 加入聯盟, 創下單場得分 100 分並且抓下 55 個籃板的
歷史記錄。 1960 年: 波士頓賽爾提克 (Boston Celtics) 王朝 1. 在這段期間,NBA 球隊持續的變遷城市, 而在 1961 年,Chicago Packers(now Washington Wizards) 成為第 9 支 NBA 球隊。 2. 1996 年到 1968 年期間, 聯盟從原本的 9 支隊伍擴大增加到 14 支隊伍, 包括 Chicago Bulls、Seattle SuperSonics(now Oklahoma City Thunder)、San Diego Rockets(4 年後遷往 Houston)、Milwaukee Bucks 以及 Phoenix Suns。 3. 1967 年除了 NBA 聯盟外, 成立了一個新的聯盟 ABA(American Basketball Association)。
2
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
1970 年:The NBA vs. the ABA 1. 1970 年 NBA 當局又增加了 3 支球隊, 分別是 Portland Trail Blazers、Cleveland Cavaliers、Buffalo Braves(now the Los Angeles Clippers)。 2. 1974 年 New Orleans Jazz(現在位於 Utah) 加入 NBA。 3. 1976 年,NBA 接納了 4 支 ABA 球隊, 分別是 San Antonio Spurs、Denver Nuggets、Indiana Pacers 以及 New York Nets(now the New Jersey Nets),
當時球隊總數已達到 22 支隊伍。 1980 年:Magic vs. Bird 1. 1979-80 賽季,NBA 聯盟在比賽中採用了 ABA 聯盟的三分球規則。
傳奇球星 Larry Bird 與 Earvin”Magic”Johnson 分別加入 Boston Celtics 與 Los Angeles Lakers。
在 80 年代 Bird 帶領 Celtics,5 次進入總冠軍決賽, 奪得 3 次 NBA 總冠軍; Magic 則帶領 Lakers,8 次進入總冠軍決賽, 獲得 5 次 NBA 總冠軍,
為 80 年代創下輝煌的時刻, 同時也大大的增加了觀眾的人數。 此時 NBA 當局球隊增加來到 23 隊, 就是 Dallas Mavericks。 1990 年:The Jordan Era 1. 1984 年, 籃球大帝 Michael Jordan 加入 Chicago Bulls。 2. 1988-89 年, 聯盟陸續增加 4 支球隊, 分別是 Charlotte Hornets(now the New Orleans Hornets)、Miami Heat、Orlando Magic 以及 Minnesota Timberwolves, 球隊增加來到 27 隊。 3. 1990-99 年, 這期間 Jordan 與 Scottie Pippen 合作, 帶領 Bulls 進入 8 次總冠軍
賽, 並且贏得 6 座 NBA 總冠軍, 連續 2 次的 3 連霸, 造就了當時的公牛王朝, 也讓 NBA 的觀眾人數大幅度的增加。 4. 1992 年, 巴塞隆納奧運 (Barcelona Olympic),NBA 當局組成第一支美國夢幻隊,
並且於當屆以壓倒性的實力獲得籃球奧運金牌。 5. 1995 年,Vancouver Grizzlies(目前遷移到 Memphis)、Toronto Raptors 加入 NBA 聯盟,Raptors 也是為一支位於加拿大 (Canadian) 的球隊,
目前球隊總數達到 29 隊。 6. 1996 年,NBA 成立了 Women0 s National Basketball Association(WNBA)。 7. 1998 年,NBA 爆發第一次勞資糾紛, 由於談判失敗, 導致 1998-99 賽季從 82 場縮
減到 50 場的比賽,San Antonio 於當年拿到 NBA 總冠軍。
3
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
2000 年:Present 1. 2000 年,Shaquille O0 Neal 與 Kobe Bryant 的合作, 奪得 NBA 總冠軍 3 連霸,
再度為 Lakers 創造輝煌的時刻。 2. 2004 年,Charlotte Bobcats 成為 NBA 第 30 支球隊。 3. 2007-08 年,Kevin Garnett、Paul Pierce、Ray Allen 組成 Boston Celtics 三巨頭,
於當年重新為 Boston 取得第 17 座 NBA 總冠軍。 4. 2008-10 年,Kobe Bryant 與 Paul Gasol 聯手為 Lakers 連續 2 年獲得 NBA 總
冠軍。 5. 2011 年 2 月 10 日,Jerry Sloan 這位執教 Utah Jazz 長達 23 年, 全美四大職業運動
執教最長的教練, 於這日宣布辭職。
表 1-2.1 各年代重要紀事
第 1.2.2 小節 NBA 數據的發展 談論 NBA 數據的發展, 一開始要追溯到早年 Bill James 在棒球上的發 展, 於 1977 年他開始撰寫了一本The Bill James Baseball Abstracts, 書裡提 及一些有關於他對棒球的研究、 統計數據等一些內容, 而這本在出版後廣受大家 的喜愛,1982 年該本書銷售額增長 10 倍。 由於 Baseball Abstracts 的成功發展, 也讓籃球愛好者從中借取一些概念, 慢慢的發展數據分析的領域。 於發展初期, 數據分析人員注重的是 「linear weights」 的數據, 也就是把 每一個數據賦予一個加權值, 透過計算公式來計算球員的整體效率, 輔以每分鐘 為單位的換算。 在這時代的代表人物是 Dave Heeren 、Bob Bellotti 和 Martin Manley, 然後真正將 NBA 數據分析帶入新的時代的是 Dean Oliver 與 John Hollinger, 這兩人對 NBA 數據的發展上是即為重要的人物。
從 90 年代開始,Dean Oliver 使用了 Possession Statistics 的概念, 並將這 概念廣泛的使用, 他和 John Hollinger 因為各自在網站上寫文章讓更多球迷了 解籃球數據的用途。 2002 年, John Hollinger 開始撰寫Pro Basketball Forecast/Prospsectus的系列書籍, 而 Oliver 則在 2003 年出版了Basketball On Paper。
由於 Michael Lewis 撰寫的”Moneyball”這本書的熱賣, 以及隨著越來越多人投 入 NBA 數據分析的領域裡, 數據分析的方式開始吸引到媒體和 NBA 球隊的注 意。 他們的目標是希望能找尋一套更客觀的評價方式, 來分析個別球員的表現以 及任何對球隊有利的建議, 並且在薪資空間內找尋最適合的球員組合。
4
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
Dean Oliver 對於 NBA 數據分析領域的貢獻如下: 1. Possession-based analysis 2. Four Factor Analysis 3. Individual possession-based analysis 4. Bell Curve or Correlated Gaussian evaluation of teams 5. Offensive and defensive scoresheets 6. Individual win-loss records 7. Head coach evaluation 8. Referee evaluation 9. Risky strategies 10. Roboscout 11. Defense and winning championships 12. The Olympic Gap John Hollinger 對於 NBA 數據分析領域的貢獻除了一系列 4 本 Pro Basketball Forecast/Prospectus的書籍以外, 最為著名的就是發展出 Player Efficiency Rating(PER) 的公式, 來評斷一名球員的表現。
除了上述的專家
對於 NBA 數據分析文章的撰寫與發展之外, 還有重視數據分析的網站紛紛成 立, 以下介紹幾個廣為人知的網站: 1. 82games.com
由 Roland Beech 於 2003 所創立, 該網站可以說是籃球數據分析的網路重 鎮, 裡面提供了相當多不同的數據以及計算方式來評斷各個 球員與球隊的 狀況。 2. Basketball-reference.com
記錄著 NBA 數據的龐大資料庫網站, 該網站記載所有 NBA 球隊與球員 每年每場比賽的資料, 所以你能想到的數據絕大部分都能在這個網站找到。 3. APBRmetrics:http://sonicscentral.com/apbrmetrics/
由 Kevin Pelton 所創立的論壇, 提供所有人在論壇上討論任何有關數據 的議題, 而且在數據分析領域的專家或作者大多都有帳號在這個論壇。
5
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
4. Hoopdata.com
該網站提供更多樣化的數據, 使用介面也更為便利, 更重要的是該網站的作 者 Tom Haberstorh, 是首批使用 Google 的動態圖表功能的分析人員。 5. Hoopnumbers.com
提供了另一種分析 「+/-」 的方向, 網站的營運者 Joe Sill 利用脊迴歸 (Ridge regression) 來預測明星球員的影響。
根據 2010 年 3 月 12 日的華爾街日報 (The Wall Street Journal) 報導了 一篇有關於數據分析對於 NBA 球隊是否提供有效的作為? 根據調查目前 NBA 裡面至少有 15 支球隊都會有一位以上的統計人員幫助球隊在比賽中、 選秀會上、 交易球員上進行數據分析的資料。 在 2009-10 這個賽季, 當時 6 個分區的龍頭隊伍都有數據分析人員, 其中 Orlando Magic 與 Dallas Mavericks 的分析人員還隨隊移動。 根據統計球隊中
有數據分析人員的隊伍, 平均勝率是 59.3%; 而隊伍中沒有數據分析人員的隊伍, 平均勝率是 40.7%, 這當中只有 Phoenix Suns、Utah Jazz、Atlanta Hawks 這 三支隊伍有機會打進季後賽。
第 1.2.3 小節 NBA 數據的應用 1. Dean Oliver 在Basketball On Paper中提出下列方式: (a) Possessioni1
解釋為一隻球隊比賽的進攻次數, 即表示當進攻球隊的球員將球運過 半場, 準備進行攻擊的次數, 所以進攻節奏快的球隊, 就擁有較多 Possession, 反之進攻節奏較慢的球隊, 所獲得的 Possession 就比較少。
根 據 Possession 的定義, 當球隊在進攻時發生下列三種情況, 就表 示完成一次 Possession: I. 投籃得分。 II. 製造投籃犯規獲取罰球機會。 III. 球員失誤而造成失去球權, 導致攻守轉換。
1
最早使用Possession 概念, 大概可以追朔到北卡羅萊那大學 (University of North Carolina) 的 Frank
McGuire 教練
6
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
計算方式有兩種: P ossession = F GA − ORB + T OV + 0.4 × F T A · · · (1) P ossession = F GA −
ORB ORB+DDRB
× (F GA − F GM ) × 1.07 +
0.4 × F T A · · · (2) DDRB 表示對手的防守籃板。
兩個公式計算出來的結果差不多, 只是 (2) 的結果更為精確。 (b) Four Factors 理論 Four Factors 表示在籃球比賽中四項讓球隊贏得比賽的因素, 分別為: I. Shooting (40%) II. Turnovers (25%) III. Rebounding (20%) IV. Free Throws (15%)
括弧中的數字則是由 Mr. Oliver 設計對於每個因素影響球隊的近似 比重。 以下對 Four Factors 解釋其定義及公式: I. Shooting: 有效投籃命中率 (Effective Field Goal Percentage;EFG%) EF G% :
F G+0.5×3P F GA
II. Turnovers: 失誤比率 (Turnover Percentage;TOV%) T OV % :
T OV F GA+0.44×F T A+T OV
III. Rebounding: 進攻籃板比率 (Offensive Rebound Percentage;ORB%) 與防守籃板比率 (Defensive Rebound Percentage;DRB%) ORB% :
ORB ORB+OppDRB 、
DRB% :
DRB OppORB+DRB
IV. Free Throws: 球隊站上罰球線的頻率及製造罰球機會 (FTR) FTR :
FT F GA
對於 Four Factors 來說可以分為進攻 (offense) 及防守 (defense) 這兩部分, 進攻表示自己隊伍本身的數據, 防守則是對手的數據, 然後 在 Rebounding 這項進攻跟防守則是有不同的計算方式。 藉由 Four Factors 的計算可以更清楚的了解該球隊在每一場比賽的情況。 (c) Predicting winning percentage: W in% = N ORM [ √
P P G−DP P G ] var(P P G)+var(DP P G)−2cov(P P G,DP P G)
7
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
PPG 為球隊每場得分 (Team0 s point scored per game)、DPPG 為
球隊每場失分 (Team0 s point allowed per game), 利用 NORM 是 Excel 軟體內建的 NORMSDIST 語法, 來估計球隊於當賽季的勝率。
除了用 PPG 和 DPPG 所計算的 WIN%, 另外也可以轉換成用 ORtg (offensive ratings) 和 DRtg(defensive ratings) 表示: ORtg−DRtg W in% = N ORM [ √ ] var(ORtg)+var(DRtg)−2cov(ORtg,DRtg) p 如果 var(ORtg) + var(DRtg) − 2cov(ORtg, DRtg)上升, 就表示
這場比賽具有”高風險”或是”高變化”的可能性。 Bill Jame0 s 也有提出估計 winning percentage 的方法, 稱為 Pythagorean Formula, 該公式源自於棒球。 W in% =
P T Sz P T S z +DP T S z
對於 NBA 來說 z 值可能是 11∼17 中的一個數字,z 可為任何一個整 數, 是為了模擬公式, 讓 MAD(Mean Absolute Deviation; 絕對平 方差) 達到最小的情況。 (d) 利用 multivariate linear regression 的方式, 來估計球隊在當賽季團
隊失誤 (turnovers) 的次數 T OV = a0 +aseas Seas+aG +aF GA F GA+aF T A F T A+aREB REB+ aP F P F + aDQ DQ + aF GM F GM + aF T M F T M + aP T S P T S + aAST AST
估計球隊團隊進攻籃板 (offensive rebounds) 的次數 ORB = b0 +bseas Seas+bG +bF GA F GA+bF T A F T A+bREB REB+ bP F P F + bDQ DQ + bF GM F GM + bF T M F T M + bP T S P T S + bAST AST Turnovers 模型的 R Square 為 81%,OREB 模型的 R Square 為 81%, 兩模型都具有相當高的解釋能力。 2. Wayne Winston 利用 Dean Oliver 所提出的 Four Factors 理論, 並利
用迴歸分析發展出 Four Factor regression model 來判斷球隊於比賽的 勝負情況, 模型如下: game won1 = 41.06 + 651.88(EF G − Opp.EF G) + 333.06(T OV % − Opp.T OV %) + 130.61(ORB% − DRB%) + 44.43(F T R − Opp.F T R)
該模型的 R Square 高達 91%, 資料採用 2006-07 賽季。 1
Opp 為 Opponent 縮寫, 表示對戰球隊的意思
8
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
3. David Berri、Martin Schmidt 兩人於 Stumbling On Wins 書中提出下
列的模型 (a) 利用迴歸分析來預測球隊的勝場數 W ins = a1 + a2 × P oints Scored − a3 × Opp.P ointsScored + e · · · (1) a1 = 41.6、a2 = 0.032、a3 = −0.032, 資料範圍從 1987-88 到 200809 賽季。 (b) 利用 Possession 理論, 並且定義下列公式: P ossessionsEmployed(P E) = F GA − ORB + T OV + 0.4 × F T A P ossessionsAcquired(P A) = Opp.T OV +DRB +T RB + Opp.F GM + 0.45 × Opp.F T M
藉由上列公式的計算, 發展出計算球隊勝率的迴歸模型 TS W inning P ercentage = b1 + b2 × PPTES + b3 × Opp.P + e · · · (2) PA
b1 = 0.481、b2 = 3.15、b3 = −3.13, 資料範圍從 1987-88 到 2008-09
賽季。 4. David Berri、Martin Schmidt、Stacey Brook 三人所提出的 Win Scores
和 Wins Produced1 (a) Wins Produced 用來計算球員為球隊貢獻多少勝場數
步驟一: 計算球員的數值 P ROD = 0.033P T S − 0.033F GA − 0.015F T A + 0.033ORB + 0.033DRB−0.033T OV +0.033ST L−0.017Opp.F T M +0.019BLK+ 0.022AST
步驟二: 調整球隊的 BLK 與 AST 數值, 並且計算 P48 Per 48 minute value of blocked shots and assists=
0.019BLK+0.022AST 2 T eamM inutesP lay
MATE48 =Per 48 minute value of a team0 s blocked shots and assists-Average per 48 minutes value of blocked shot and assist P 48 =
P ROD 3 M inutesP layed
× 48 − M AT E48
步驟三: 計算球隊的防守數值與調整 P48 Team Defense Adjustment= −0.032Opp.F GM +0.033Opp.T OV −0.032T OV +0.033T RB T eamM inutesP layed
× 48
1
詳細的細節參考:stumblingonwins.com Team Minutes Play 指的是球隊的比賽時間 3 Minutes Played 指的是球員的比賽時間
2
9
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
DEFTM48=League Average Team Defensive Adjustment-Team defensive Adjustment AdjP48=PROD48- DEFTM48
步驟四: 由球員所打的位置不同, 進行數據調整 表 1-2.2 球員位置 AdjP48 Position
Average AdjP48
Centers and Power Forwards
0.432
Power Forwards
0.353
Small Forwards
0.276
Shooting Guards
0.228
Points Guards
0.226
Relative AdjP48=AdjP48-League Average AdjP48
步驟五: 計算 WP48 與 Wins Produced WP48= Relative AdjP48+0.0991 Wins Produecd=
W P 48 48
× M inutesP layed
最後將每位球員的 Win Produced 加總就是該球隊的勝場數。 (b) Win Score 用來計算球員的得分數值 Win Score=PTS+REB+STL+0.5BLK+0.5AST-FGA-0.5FTATOV-0.5PF
表 1-2.3 球員位置 WS48 Position
Average WS48
Centers
11.36
Power Forwards
10.47
Small Forwards
7.87
Shooting Guards
6.08
Points Guards
6.54
PAWS48=Win Score per 48 minutes-Average Win Score per 48 minutes at position played
計算出來的 PAWS48 可以用來比較球員對於球隊的貢獻。
1
0.099 為球隊平均 48 分鐘內獲得勝利的數值
10
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 2 章 系統架構 本研究系統架構圖如圖 2-1, 在進行研究前, 先行了解 NBA 官方所提供的 球隊/球員的基本數據以及相關的數據統計, 了解各項數據所帶來的統計意義與 統計方法, 進行預測方式的探討。 有了這些相關知識後, 變進行資料上的蒐集, 資 料主要分為球隊資料 (Team Data) 與球員資料 (Player Data) 兩大部分, 需進 行必要前處理, 再利用 Excel 軟體建置球隊與球員的資料庫, 作為往後分析的基 本資料。 相關的資料處理完畢後, 利用 R 軟體所提供的套件, 對資料進行處理與轉 換, 處理出需要的格式, 進行數據分析。 數據分析分為兩部份, 第一是球隊部份, 利用羅吉斯迴歸 (logistic regression) 與自助法 (bootstrap method) 的方式 對不同的模型參數進行分析, 並藉由自助法所提供的模型平均正確率來進行選模 (model selection) 的步驟, 進而預測球隊勝率, 並且再加上球隊於真實賽季中的
主/客場勝率以及與對手對戰勝率, 進行加權比重的方式, 取得最後的預測勝率; 第二是球員部分, 利用資料庫所整理出來的數據統計, 進行球員貢獻率 (player contribution ratio;PCR) 的運算, 並利用 PCRS 策略來評估球隊的勝負。
藉由 TWP 與 PCRS 的預測結果, 進行比較策略, 藉此預測球隊的勝負。 各主題參考章節: 1. 預測模型:第4.1 節 選擇模型 2. 主/客場勝率:第4.2 節 TWP 策略 3. 過往戰績:第4.2 節 TWP 策略 4. 休息天數差勝率:第4.2 節 TWP 策略 5. 加權平均:第3.3 節 調和平均數 6. TWP:第4.2 節 TWP 策略 7. 球員貢獻:第3.4 節 球員貢獻率 8. PCRS:第4.3 節 PCRS 策略 9. 預測球隊勝負:第5 章 實證分析
11
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
圖 2-1 系統架構圖
12
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 3 章 統計用途 第 3.1 節 自助法(Bootstrap Method) 自助法 (Bootstrap Method) 是使用均勻抽取放回 (uniformly with replacement) 的方式從原本的資料選取出訓練樣本, 每一次被挑選當作訓練資料
的值組都具有相同的機率, 也就是說當一筆資料被選為訓練樣本, 那下一次被選 為訓練樣本的機率與上一次相同。 透過均勻抽取放回的方式選取, 相同的值組在 訓練資料可能會出現一次以上。 目前最常採用的是.632 自助 (.632bootstrap)。 0.632 自助做法是假設資料 包含 D 個值組, 之後利用均勻抽取放回的方式從原始資料抽取出 d 個值組當作 訓練資料, 而不在訓練資料的值組就當作測試資料, 也就說當我們重複上敘步驟 許多次時, 63.2% 的原始資料就會在訓練資料, 而剩餘的 36.8% 的資料會在測試 資料中。 每組資料被選取到的與未被選取的機率分別為 d1 與1 − d1 , 當重複這樣的步 驟k次時, 有一組資料沒有被抽取到的機率為(1 − d1 )k , 當 k 在非常大的情況下, 這樣沒有被抽取到的機率就趨近為e( − 1) = 0.368, 所以 36.8% 的資料是沒有被 抽取到的資料, 則做為測試資料, 而剩下 63.2% 的資料則做為訓練資料。 模型的平均正確率為: P Acc(M ) = ki=1 (0.632 × Acc(Mi )trainset + 0.368 × Acc(Mi )testset ) Acc(Mi )trainset 為將第 i 次的訓練資料代入第 i 次訓練資料模型的正確率, Acc(Mi )testset 為將第 i 次的測試資料代入第 i 次訓練資料模型的正確率。
圖 3-1 估計測試方法的正確率 資料來源: 資料探勘概念與方法 (2008)
13
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 3.2 節 Adaboot boosting 是一種有效的提高判別正確率的方法。 boosting 的起源是由 Valiant(1994) 所提出的 PAC 學習理論, 而後 Valiant 與 kearns 提出了弱學習
算法 (weak learner) 與強學習算法 (strong learner) 的概念, 對於一組訓練樣 本做出假設, 並做出猜測, 其正確率也僅僅高於隨機猜測的學習方法稱為弱學習 算法; 而識別證確率提高, 且能在多項式算法內完成的算法的學習方法稱為強學 習算法。 在 Valiant 和 Kearns 首次提出 PAC 學習模型中弱學習與強學習的 等價問題, 即是定義一個比隨機猜測略好的弱學習算法, 是否能提升為強學習算 法? 如果可以經由弱學習算法將其提升為強學習算法, 這樣就不再尋找強學習算 法。 Robert Schapire(1990) 提出一種多項式的算法, 並針對問題做了證明, 這 就是最初的 boosting。 Freund 與 Schapire(1996) 提出 AdaBoost(Adaptive Boosting) 算法,
是改進最初的 boosting 算法,AdaBoost 是一種機器學習演算法。 在此之後許多 學者嘗試改進 AdaBoost 算法,Friedman 、 Hastie 與 Tibshirani(1998) 發現 AdaBoost 算法可以被視為階段 (stage-wise) 梯度降低 (gradient descent) 的
過程, 並能最大有限度的減少指數損失函數, 並提出了三個修改 AdaBoost 算 法的方式,Gentle- 、 Logit-和Real AdaBoost。 Friedman 、 Hastie 與 Tibshirani(2000) 並對較常使用的 AdaBoost 算法 (Freund 與 Schapire(1996)) 稱
為 Disctret AdaBoost, 其演算法如下: 1. 設定每個 w 中值組的起始權重 wi =
1 N,i
= 1, · · · , N
2. 重複執行 m 次 m = 1, 2, · · · , M : (a) 使用訓練樣本wi , 產生分類器fm (x) ∈ {−1, 1} (b) 計算錯誤率 em = Ew [1y6=fm (x) ], 並且調整正確值組的權重 m cm = log 1−e em (c) 更新權重, 並且對每個值組權重進行正規化 wi = wi ·exp[cm ·1yi 6=fm (xi ) ], P i = 1, 2, · · · , N, i wi = 1. P (d) 傳回分類器 sign[ M m=1 cm fm (x)]
多位學者探討使用 tree-based classifier fm (x)所得到較低的錯誤率, 明 顯的優於單一的決策樹 (single decision tree)。 Discrete AdaBoost 的基本判 別所產生的判別規則fm (x):X 7→ {−1, 1},X 為預測值 x 的範圍。 Freund 與
14
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略 Schapire(1996) 、 Breiman(1998) 和 Schapire 與 Singer(1998) 建議各種修
改方式, 藉此來改進 boosting 算法。 Freund 與 Schapire(1996) 提出一般化 (generalization) 的 Discrete AdaBoost, 而 Schapire 與 Singer(1998) 發展
出利用實際值得”confidence-rated” 所得到的預測值優於 Discrete AdaBoost, 因此將一般化的 AdaBoost 稱為 Real AdaBoost。 其演算法如下: 1. 設定每個 w 中值組的起始權重 wi =
1 N,i
= 1, · · · , N
2. 重複執行 m 次 m = 1, 2, · · · , M : (a) 使用訓練樣本wi , 產生分類器, 並且估計類別機率(class probability) pm (x) = Pbw (y = 1|x) ∈ [0, 1] pm (x) (b) 給定分類器fm (x) ← 21 log 1−p ∈ R. m x)
(c) 更新權重, 並且對每個值組權重進行正規化wi = wi exp[−yi fm (xi )], P i = 1, 2, · · · , N, i wi = 1. P (d) 傳回分類器 sign[ M m=1 fm (x)] Friedman 、 Hastie 與 Tibshirani(2000) 用向前階段方式 (forward stagP ewis manner) 配適 additive model m fm (x), 此種方式遠遠勝過單一的基本
學習法 (single base learner)。 另外以向前階段方式最小平方誤差 (minimize P squared-error) 損失配適 additive modelE(y − fm (x)), 並且顯示出使用配 適 additive model 的 AdaBoost 優於採用損失模型的分類器。 Additive Models(AM) 是一種非參數迴歸方法 (nonparametric regression method), 其模型如下: 一組資料yi , xi1 , · · · , xip , i = 1, · · · , N E[yi |xi1 , · · · , xip ] =
Y = β0 +
or Pp j
Pp
j=1 fj (xij)
fj (Xj ) + ε
E[ε] = 0, V ar(ε) = σ 2 , E[fj (Xj )] = 0, 由資料配適的函數fj (xij )是 unknown smooth functions。 Andreas Buja, Trevor Hastie 與 Robert Tibshirani (1989) 提出利用 backfiiting 演算法的方式來配適 additive models。
15
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 3.3 節 調和平均數(Harmonic mean) 調和平均數 (Harmonic mean) 有時稱為 subcontrary mean, 是計算一 組數值的平均數的方法之一。 Harmonic mean 較常處理的是比率 (rate) 平均 的問題。 Harmonic mean 是將數值個數除以數值倒數的總和, 其數值必須為一 組正數,x1 , x2 , · · · , xn > 0。 Harmonic mean(H) 公式定義為: H = = =
1 x1
+ n
1 x2
n + · · · x1n
(3-1) (3-2)
Pn
1 i=1 xi Q n · nj=1 xj Pn Qnj=1 xi i=1 xi
(3-3)
由 1-3 就可以很清楚的瞭解,Harmonic mean 與算術平均數跟幾何平均數是有關 連的。
第 3.4 節 球員貢獻率 球員貢獻率 (Player Contribution Ratios;PCRS), 是用來衡量球員對於 球隊的貢獻率, 該指標是由作者所定義的, 球員貢獻率公式: P CRS =
Pn M inutesP layedp p=1 Pn p=1 Gp ×48×60
Pw
×
GameW inp p=1 Pn p=1 Gp
, p=1,2,· · · ,n
1. p 為該球隊的球員個數 2. M inutes P layerp 為第p位球員累積出場時間 (單位: 秒)。 3. Gp 為第p位球員出場比賽次數。 4. Game W inp 為第p位球員在出場比賽中, 該場比賽球隊獲得勝利的次數。
探討目前對於評斷球員對於球隊的貢獻率大多都是以分析球員數據為主軸, 在 Score Box 上我們常看見的 FGM-A、FTM-A、+/-、ORB、DRB、 AST、STL、PTS、EFF· · · 等等, 都是於賽後會被人廣泛討論的, 但有時候會發現
球隊球星的數據表現優秀, 可是球隊卻是輸球收場, 或者球隊球星的數據表現沒 有特別突出, 可是球隊反而獲得勝利。 由於會有上述的情況發生, 如果不看整場比賽的內容, 只將數據拿來做討 論往往會陷入數據上的迷思, 因為在整場比賽中, 團隊合作、 防守、 隊友間的信
16
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
任、 球員的體力、 裁判的尺度· · · 等等因素, 都是無法從數據上所看到的, 而且當 場上的一位球員完成一個動作, 就等同於另外四位隊友失去了一次的動作, 所以 說影響數據的好壞其中一項因素就是上場的時間, 正常來說上場的時間越多, 在 場上就越有機會做越多事情, 但有些球員在場上時所貢獻的數據並不突出, 但卻 有可能當這位球員在場上時球隊勝率就大大提升的可能性, 所以如何評斷一名球 員在有限的上場時間裡, 對於球隊的勝負有實質的貢獻率, 這就是 PCRS 所追求 的。 以 PCRS 的定義來評斷球員: 1. 球員上場時間多, 球隊勝率高−→ PCRS 相對越高 2. 球員上場時間多, 球隊勝率低−→ PCRS 相對降低 3. 球員上場時間少, 球隊勝率高−→ PCRS 相對升高 4. 球員上場時間少, 球隊勝率低−→ PCRS 相對越低
以下舉例 BOS 與 LAL 兩隊的數據來做說明, 資料採用 2010-20111 賽季:
BOS
主場
客場
Name
G
MIN
PCRS
G
MIN
PCRS
All PCRS
Paul Pierce
40
34.9
0.578
40
34.5
0.4154
0.9934
Ray Allen
40
36.0
0.6016
40
36.2
0.4328
1.0344
Kevin Garnett
33
31.4
0.532
38
31.2
0.3771
0.9091
Glen Davis
39
28.2
0.5039
39
30.7
0.3465
0.8504
Rajon Rondo
35
37.4
0.6195
33
36.9
0.4459
1.0654
Jeff Green†
11
23.5
0.3567
15
23.6
0.2249
0.5816
Shaquille O’Neal
22
19.1
0.3656
15
18.2
0.2591
0.6247
Nenad Krstic†
10
25.6
0.336
11
21.2
0.2393
0.5753
Kendrick Perkins
6
28.5
0.3797
6
23.7
0.3624
0.7421
Nate Robinson
30
17.0
0.3103
25
19.0
0.2383
0.5486
Delonte West
9
17.7
0.2599
15
19.6
0.1837
0.4436
Marquis Daniels
26
18.8
0.3375
23
19.5
0.2663
0.6038
Jermaine O’Neal
10
19.1
0.2888
14
17.2
0.1336
0.4224
17
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
BOS
主場
客場
Name
G
MIN
PCRS
G
MIN
PCRS
All PCRS
Semih Erden
20
13.4
0.2676
17
15.5
0.211
0.4786
Von Wafer
31
9.5
0.1728
27
9.6
0.1258
0.2986
Troy Murphy†
9
12.7
0.1694
8
8.0
0.0491
0.2185
Carlos Arroyo†
8
12.0
0.1978
7
13.4
0.0683
0.2661
Luke Harangody
17
10.2
0.1508
11
6.3
0.1143
0.2651
Sasha Pavlovic†
6
11.0
0.1218
11
7.5
0.0405
0.1623
Avery Bradley
17
4.7
0.0916
14
5.9
0.0557
0.1473
†表示季中交易過來的球員, 灰色底表示球隊季中交易出去的球員。
表 3.4-1 BOS-主/客場 PCRS 數據 由上表來看,Paul Pierce、Ray Allen、Rajon Rondo、Kevin Garnett 都是 先發主力, 由上場時間就可以看得出來, 相對的當球隊勝率高時,PCRS 也相對高, 但我們可以發現雖然 BOS 是以三巨頭 Paul Pierce、Ray Allen、Kevin Garnett 三人為主的球隊, 但是 Rondo 的 PCSR 卻遠高於其他人, 表示球隊對於該位球 員對於球隊是相當重要的。 另外 Shaquille O0 Neal 與 Kendrick Perkins 這兩人是最為值得關注的, O0 Neal 因傷只為 BOS 出賽 22 場, 又因高齡 40 歲, 所以上場的時間相對較少, 但
是我們可以發現扣除高時間上場的球員 O0 Neal 的 PCRS 是相不錯的, 由此可 以得知,O0 Neal 對於球隊的貢獻相當重要, 也表示出當 O0 Neal 在一定的出場時 間內, 球隊的勝率是相當高的。 Kendrick Perkins 這點又是更為明顯, 出賽場次 少, 上場時間低於 30 分鐘, 卻能有相當不錯的 PCRS, 可見得 Kendrick Perkins 與 O0 Neal 的存在對於 BOS 而言是相當重要的, 因為他們都是能在不多的上場 時間內, 對球隊提供一定的貢獻。 特別是 Kendrick Perkins 在主/客場的 PCRS 都相差不遠,BOS 本賽 季主場勝率 80.48%, 所以球員在主場有較高的 PCRS 並不意外, 但是細看客場 PCRS, 就可發現就可以發現 Kendrick Perkins 的重要性,BOS 本賽季客場勝
率 56.09%。
18
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
LAL
主場
客場
Name
G
MIN
PCRS
G
MIN
PCRS
All PCRS
Kobe Bryant
41
33.4
0.516
41
34.3
0.4652
0.9812
Pau Gasol
41
36.5
0.563
41
37.5
0.5085
1.0715
Lamar Odom
41
32.1
0.4883
41
32.2
0.4418
0.9301
Shannon Brown
41
19.8
0.2992
41
18.4
0.2626
0.5618
Ron Artest
41
28.8
0.4449
41
30.0
0.4035
0.8484
Andrew Bynum
26
27.5
0.3785
28
28.0
0.3939
0.7724
Derek Fisher
41
27.2
0.425
41
28.8
0.3846
0.8096
Matt Barnes
28
18.1
0.2862
25
20.5
0.2579
0.5441
Steve Blake
39
20.5
0.3102
40
19.6
0.2713
0.5815
Luke Walton
28
9.6
0.1257
26
8.3
0.1437
0.2694
Derrick Caracter
21
6.3
0.0951
20
4.1
0.0601
0.1552
Devin Ebanks
11
7.7
0.1002
9
3.6
0.0792
0.1794
Sasha Vujacic
6
7.3
0.103
5
2.0
0.1104
0.2134
Joe Smith
9
4.1
0.0691
3
2.7
0.0771
0.1462
Theo Ratliff
8
6.9
0.1469
2
8.0
0.1994
0.3463
†表示季中交易過來的球員, 灰色底表示球隊季中交易出去的球員。
表 3.4-2 LAL-主/客場 PCRS 數據 LAL 是 2008-2009 與 2009-2010 賽季 NBA 總冠軍隊伍, 陣中有世界知名
的球星 Kobe Bryant, 但從上表來看 Kobe 的 PCRS 並不是最高的, 反而是 Pau Gasol 是高的, 這也顯示出雖然 LAL 是以 Kobe 為核心打造隊伍, 但是對
球隊而言 Pau Gasol 的貢獻是最為重要的, 另外 Lamar Odom 是 LAL 的替 補,2010-2011 賽季年度最佳第六人, 由 PCRS 也顯示出他在球隊的貢獻是多麼 的重要。
第 3.5 節 模擬賠率方法 於國際上各家公司對於籃球賠率的計算方式, 是由勝率 (win percentage; PERC) 所推算出來的, 在國際上各大博弈網站常見的 Money Line, 就是所謂
的賠率。
19
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
由於各家網站對於賠率的表示有所不同, 主要可以分為三種賠率, 分別是美 式賠率 (例如:-129、+109)、 小數式賠率 (例如:1.25)、 分數式賠率 (例如:5/1、1/6)。 賠率與勝率的計算方式 (以美式賠率舉例): 1. money line into percentage
如果 money line 是負數, 則公式為 money line/(money line-100) 假設 money line=-129, 轉換成勝率則為 56.3%: = −129/(−129 − 100) = −129/ − 229 = 56.3%
如果 money line 是正數, 則公式為 100/(money line+100) 假設 money line=+109, 轉換成勝率則為 56.3%: = 100/(109 + 100) = 100/209 = 47.8% 2. percentege into money line
如果勝率高於 50%, 則公式為P ERC/(100% − P ERC) × (−100) 假設勝率為 55%, 轉換成賠率則為-122 = P ERC/(100% − P ERC) × (−100) = 55%/(100% − 55%) × (−100) = 55%/45% × (−100) = 1.22 × −100 = −122
如果勝率低於 50%, 則公式為P ERC/(100% − P REC) × (−100) 假設勝率為 45%, 轉換成賠率則為+122 = (100% − P ERC)/P ERC × 100 = (100% − 45%)/45% × 100 = 55%/45% × 100 = 1.22 × 100 = −122
20
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
以小數賠率舉例, 公式為 1/(1-PERC)。 假設 A 隊獲勝的機率為 55%, 則 B 隊獲勝的機率則為 45%。
則 A 隊的賠率為 1/55%=1.82 B 隊的賠率為 1/(1-55%)=1/45%=2.22
分數賠率的計算方式與小數賠率是相同的。 本研究主題在於求得球隊獲勝的機率, 所以在模擬賠率的部分, 本 研究採用小數賠率的方式來進行模擬賠率, 所以球隊實力較強, 相對賠率 就較低; 反之球隊實力較弱, 相對賠率就較高; 如果兩支球隊實力不相上下, 則賠率則會相同。
21
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 4 章 預測策略 第 4.1 節 選擇模型 在研究初期列出五個羅吉斯迴歸模型來進行比較, 利用自助法 (Bootstrap Method) 對五個模型進行模型正確率的計算, 模型正確率高的模型, 將挑選為之
後進行模擬的主要模型。 進行測試的資料都經過標準化過後才進行分析, 資料為 08-09 與 09-10 賽季的資料, 主/客場分別共 2460 筆資料, 總共 4920 筆。
以下分別對五個模型作介紹: 模型一:W/L∼ FGA+FTA+TRB+AST+STL+BLK+TOV+PF 模型一的變數選擇是去除對於勝負有直接性影響的總進球數 (FG)、 三分 球進球數 (3P)、 罰球進球數 (FT), 將剩下的變數選擇總出手次數 (FGA)、 罰球 出手次數 (FTA)、 總籃板 (TRB)、 助攻 (AST)、 抄截 (STL)、 阻攻 (BLK)、 失 誤 (TOV)、 犯規 (PF) 當作模型的變數。 模型二:W/L∼ (EFG-Opp.EFG)+(TOV%-Opp.TOV%)+(ORB%DRB%)+(FTR-Opp.FTR)
模型二主要是在採用在第 1.2 節中的hNBA 數據的應用i所介紹過的 Wayne Winston 對於 Dean Oliver 所提出的 Four Factors 理論, 而發展出來的 Four Factor regression model。
模型三:W/L∼ EFG+TOV%+ORB%+FTR 模型三是參考採用在第 1.2 節中的hNBA 數據的應用i中,Dean Oliver 所 提出的 Four Factors 理論。 模型四:W/L∼ AST+STL+Opp.PF+ORB+DRB+TOV 模型四與模型五是作者本身藉由多年觀看 NBA 比賽與參考各項 NBA 統 計數據文章所想出來的, 模型四是採用以進攻為主軸的變數,AST 表示當助攻數 越多, 球隊所得到的分數也越多; STL 表示當抄截次數越多, 球隊獲得進攻的次 數也越多; Opp.PF 表示對手的犯規越多, 則對方球員易陷入犯規麻煩, 對我方
22
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
球隊有利; ORB、DRB 都表示獲得越多的籃板, 球隊獲得的進攻次數也越多, 但 這邊不直接採用 TRB 的用意是因為 ORB 是直接在對方半場所獲得的籃板, 而 DRB 則是由我方半場所獲得籃板, 對於進攻轉換的防守反擊是在數據看不到的,
所以才特別拆開來做區別; TOV 表示對方失誤越多, 獲得進攻的次數越多。 模型五:W/L∼ Opp.missFG+Opp.missFT+DRB+BLK +Opp.TOV+Opp.PF
模型五是採用以防守觀念的變數,Opp.missFG 表示我方球員的成功防守, 導致對方球員無法將球投進籃框; Opp.missFT 表示對方球員在罰球線上未投 進的次數越多, 在分數上就對我方有利; DRB 在這是表示我方球員成功的防守, 搶下防守籃板; BLK 表示我方球員一次的阻攻, 就成功阻止對方球員對籃框的威 脅; Opp.TOV 表示對方球員失誤越多, 相對對方球隊進攻的次數就減少; Opp.PF 表示對方犯規次數多, 則對我方防守上有利, 原因是因為主力球員可能陷入犯規 麻煩, 而上來的替補球員在進攻上並不如主力球員有威脅, 能讓我方球員在防守 上較為有利。 Bootstrap Method 的測試結果如下:
模型
平均正確率
模型一
84.01%
模型二
93.96%
模型三
80.19%
模型四
79.90%
模型五
75.68%
表 4-1.1 Bootstrap Method 測試結果 由上表的結果可以得知, 模型二的平均正確率優於其他模型的平均正確率, 所以 決定採用模型二來當作模擬球隊勝率的模型。
23
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 4.2 節 TWP策略 TWP(Team Win Percent) 策略是以分析球隊數據為主軸, 本文使用 R
統計軟體套件”ada”的 Fitting Stochastic Boosting Models(指令:ada) 來進 行球隊勝率的模擬, 將於第 4.1 節h選擇模型i所挑選出來的模型二代入 R 指令 ada(formula,data,loss,type) 的 formula, data 為 2008-2009、2009-2010 與 20102011 賽季資料,loss 則可選擇為 exponential 或 logistic,type 則是於第 3.2 節所
提過的 AdaBoost 方法, 本研究採用 real AdaBoost 方法。 在預測方面, 本文採用三項決策方式當作模型變數的預測數據, 並分別代入 模型中模擬球隊勝率。 三項策略分別是: 1. 球隊賽季數據平均策略 2. 球隊前一場比賽數據策略 3. 球隊主/客場前五場數據平均策略
下表列出一部分的模擬球隊勝率: 平均策略
前一場策略
前五場平均策略
ATL
0.707
0.927
BOS
0.854
0.732
CHA
0.683
0.829
CHI
0.927
0.122
主隊
客隊
平均策略
0.732
NJN
0.756
HOU
0.854 0.976
前一場策略
前五場平均策略
0.366
0.098
0.146
0.439
0.195
0.390
SAC
0.049
0.659
0.171
PHI
0.195
0.805
0.341
CLE
0.268
0.293
0.220
DEN
0.390
0.927
0.195
DAL
0.951
0.561
0.707
HOU
0.439
0.683
0.366
DEN
0.951
0.878
0.976
LAL
0.854
0.220
0.780
DET
0.488
0.805
0.610
MEM
0.171
0.049
0.098
GSW
0.610
0.902
0.463
CHI
0.317
0.951
0.878
HOU
0.756
0.122
0.488
NJN
0.049
0.024
0.195
IND
0.683
0.707
0.585
CHA
0.390
0.659
0.463
LAC
0.244
0.805
0.463
LAL
0.829
0.659
0.683
LAL
0.927
0.878
0.927
SAS
0.683
0.024
0.854
MEM
0.683
0.561
0.659
DAL
0.878
0.488
0.634
MIA
0.000
0.878
0.293
MEM
0.366
0.390
0.439
24
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
主隊
平均策略
前一場策略
前五場平均策略
客隊
平均策略
前一場策略
前五場平均策略
MIL
0.732
0.195
0.683
TOR
0.268
0.146
0.049
MIN
0.317
0.073
0.171
DET
0.220
0.024
0.000
NJN
0.317
0.000
0.512
LAL
0.780
0.610
0.537
NOH
0.829
0.463
0.707
ORL
0.390
0.683
0.439
NYK
0.195
0.463
0.610
MIA
0.805
0.805
0.976
OKC
0.610
0.878
0.537
ORL
0.317
0.122
0.732
ORL
0.878
0.829
0.927
PHI
0.244
0.195
0.244
PHI
0.829
0.854
0.902
NYK
0.390
0.073
0.073
PHO
0.634
0.878
0.415
NOH
0.610
0.805
0.756
POR
0.878
0.561
0.634
CLE
0.098
0.829
0.366
SAC
0.024
0.878
0.512
POR
0.293
0.268
0.268
SAS
0.976
0.732
0.951
TOR
0.268
0.512
0.195
TOR
0.293
0.122
0.268
NJN
0.341
0.049
0.024
UTA
0.780
0.317
0.610
ORL
0.366
0.098
0.537
WAS
0.659
0.732
0.659
NOH
0.512
0.805
0.220
表 4-2.1 模擬球隊勝率表
光只用模擬的方式求得球隊勝率來判斷比賽勝負會略顯資訊不足, 所 以本文還採用了三項球隊在賽季中真實的比賽數據, 三項真實比賽數據分 別為: 1. 球隊於主/客場的勝率
在 NBA 的比賽中, 主場優勢 (home-court advantage) 是相當 重要的, Dean Oliver(2004) 在Basketball on paper書中 Page.119 提到關於主場優勢簡單算法, 於 2000-2001 和 2001-2002 賽季的平均 主場得分為 96.7PPG, 平均客場得分為 93.5PPG, 主/客場平均得分 相減後相差約 3.2PPG, 表示在 2000-2001 和 2001-2002 賽季的比賽 中主場球隊平均可以比對手多得 3.2 分, 也顯示出球隊在自家主場出 賽是有一定的優勢。 因此將主/客場勝率分開來納入研究考量, 而不 是將球隊總勝率納入考量。
25
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
從下表 2010-2011 年賽季球隊主/客場勝率表, 就可以看出明顯 的主場優勢, 多數球隊都是主場勝率優於客場勝率。 球隊
主場勝率 客場勝率 球隊
主場勝率 客場勝率
BOS
0.8
0.543
OKC
0.72
0.571
NYK
0.535
0.442
DEN
0.791
0.386
PHI
0.628
0.341
POR
0.727
0.409
NJN
0.463
0.122
UTA
0.512
0.439
TOR
0.39
0.146
MIN
0.293
0.122
CHI
0.857
0.604
LAL
0.696
0.63
IND
0.581
0.295
PHO
0.561
0.415
MIL
0.537
0.317
GSW
0.634
0.244
DET
0.512
0.22
LAC
0.561
0.22
CLE
0.293
0.171
SAC
0.268
0.317
MIA
0.775
0.66
SAS
0.864
0.568
ORL
0.705
0.523
DAL
0.735
0.688
ATL
0.596
0.468
NOH
0.659
0.432
CHA
0.512
0.317
MEM
0.745
0.375
WAS
0.488
0.073
HOU
0.61
0.439
表 4-2.2 NBA 2010-2011 賽季各隊主/客場勝率表
2. 球隊與對戰球隊過往交手的勝率 NBA 聯盟中球隊實力各有差異, 但卻也不代表實力較強的隊伍
一定會贏實力較差的隊伍, 例如:2008-2009 與 2009-2010 年 NBA 總 冠軍 LAL 在 CHA 主場交手的戰績是 1 勝 5 敗, 而 CHA 在 LAL 主場交手的戰績是 3 勝 3 敗; SAS 從 2005 年賽季開始到 2011 年賽季 主場未曾輸給 MIN 過, 戰績是 13 勝 0 敗。 由此可見在兩隊過往對戰 的勝率是相當重要的考量因素。 3. 球隊休息天數差的勝率 NBA 球隊一個賽季需要比賽 82 場,30 支球隊總共所以對於球員
來說要在大約 6 個月內打完, 對於球員的體能來說是很大的消耗, 所 以在比賽與比賽之間的休息天數對於球隊來說是相當重要的, 例如:BOS
26
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
先發球員平均年齡約 32.8 歲,LAL 先發球員平均年齡約 30.4 歲, DAL 先發球員平均年齡約 30 歲,PHO 先發球員平均年齡約 31.2 歲, SAS 先發球員平均年齡約 29.2 歲, 以上隊伍都是在聯盟中先發主力年齡 偏大的球隊, 由下表可以得知上述球隊在休息天數超過 3 天 (包含) 的比賽, 都有不錯的勝率, 也因此將休息天數差的勝率納入研究考 量。 球隊
休息 0 天 休息 1 天 休息 2 天 休息 3+ 天
BOS
0.421
0.744
0.714
1.000
NYK
0.476
0.476
0.462
1.000
PHI
0.364
0.605
0.412
0.750
NJN
0.136
0.326
0.300
0.500
TOR
0.316
0.311
0.167
0.000
CHI
0.783
0.806
0.765
0.400
IND
0.381
0.558
0.250
0.400
MIL
0.435
0.444
0.412
0.400
DET
0.333
0.381
0.273
0.571
CLE
0.227
0.211
0.294
0.000
MIA
0.789
0.733
0.545
0.667
ORL
0.579
0.708
0.500
0.333
ATL
0.609
0.553
0.462
0.286
CHA
0.273
0.476
0.455
0.500
WAS
0.190
0.302
0.400
0.286
OKC
0.588
0.688
0.667
0.750
DEN
0.526
0.646
0.571
0.571
POR
0.591
0.581
0.600
0.500
UTA
0.421
0.542
0.571
0.143
MIN
0.316
0.196
0.100
0.167
LAL
0.800
0.673
0.500
0.833
27
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
球隊
休息 0 天 休息 1 天 休息 2 天 休息 3+ 天
PHO
0.500
0.471
0.444
0.800
GSW
0.389
0.447
0.500
0.333
LAC
0.364
0.308
0.643
0.500
SAC
0.278
0.364
0.125
0.000
SAS
0.611
0.818
0.625
1.000
DAL
0.700
0.659
0.750
0.800
NOH
0.333
0.583
0.600
1.000
MEM
0.524
0.625
0.471
0.667
HOU
0.333
0.659
0.538
0.333
表 4-2.3 NBA 2010-2011 賽季各隊休息天數差勝率表
藉由三項決策所模擬出來的球隊勝率分別與球隊於主/客場的勝率、 球隊與對戰球隊過往交手的勝率、 球隊休息天數差的勝率, 這三項球隊於 賽季中真實的數據, 再利用先前在第三章h統計方法i所介紹過的 Harmonic mean 方法, 來求得球隊最後的比賽勝率。 獲得球隊比賽的勝率後, 將主隊
與客隊所獲得的勝率相互比較, 勝率高的隊伍則判定該場比賽獲勝, 以上 所介紹的步驟就是 TWP 策略。 下表為三種策略利用 Harmonic mean 方 法最後模擬出的球隊勝率統計表:
平均策略
前一場策略
前五場平均策略
Diffpercent
W
L
Win%
W
L
Win%
W
L
Win%
0.1
602
165
78.49%
592
169
77.79%
596
160
78.84%
0.2
439
94
82.36%
408
88
82.26%
434
95
82.04%
0.3
287
47
85.92%
264
48
84.62%
278
48
85.28%
0.4
144
14
91.14%
123
17
87.86%
131
17
88.51%
0.5
48
2
96.00%
34
2
94.44%
42
3
93.33%
0.6
10
1
90.91%
9
2
81.82%
9
1
90.00%
表 4-2.4 球隊 TWP 策略表
上表中的 Diffpercent 的意思是指比賽的兩支球隊模擬出來的勝率 差, 由表中可以得知, 當勝率差越大時, 表示勝率較高的球隊獲勝的機會 越高, 相對的符合勝率差的場次也越少。 由表中看出三種策略所獲得的結
28
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
果都不錯, 三種策略至少都能有 64% 以上的勝率, 但要來比較哪一種策略 為最好, 則需要透過模擬賠率的方式來做判斷, 單看勝率是有其數據上的 盲點, 於這方面的論點會在第 5.1 節hTWP 策略結果i解說。
第 4.3 節 PCRS策略 在第 3.3 節h球員貢獻率i敘述了有關於 PCRS 在球員上的應用, 但 PCRS 還有另一個效用, 就是用來評斷球隊的比賽結果, 這也是 PCRS 最
大的功用。 PCRS 用來評斷球隊的方法就是將球隊中每位球員的 PCRS 數值加總起來, 就是球隊本身的 PCRS, 藉由這項加總數據可以用來評斷 兩支球隊比賽的結果。 下表為球隊比賽之間 PCRS 相差的勝率表: DiffPCRS 勝場 敗場 勝率 1
442
198
69.06%
2
233
64
78.45%
3
73
12
85.88%
4+
9
0
100%
表 3.3-2 2010-2011 賽季球隊比賽 PCRS 相差勝率表
由上表可以明顯的看出, 當兩支比賽球隊之間相差的 PCRS 越高, 則 PCRS 較高的一方獲勝的機率相對較高。
29
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 5 章 實例分析 如何證明這一系列的模擬是有效的, 並非是單純的統計出命中比賽 次數的命中率高低來看。 在運動博弈市場, 都是由d獲利率c(也就是股票的 報酬率) 來評斷結果, 如同在第 3.4 節h模擬賠率方法i中所提及的賠率, 球 隊實力有強弱之分, 賠率則有高低之別, 所以有高的命中率並不代表有好 的獲利, 例如當連續 3 場壓賠率 1.3 以下的賠率, 當第 4 場比賽爆冷, 實力 好的球隊輸給實力較差的球隊, 則本身的獲利就會變成 0.3*3-1=-0.1, 反 而是倒賠, 在運動博弈市場這是很常見的情況, 沒有 100% 勝率的球隊, 所 以接下來將以每個策略的獲利率來呈現結果。 本研究採用每次都是單場投注, 一次金額為 1000(元) 為單位, 並將投 注所獲利的金額除以總共的投注場次金額來計算獲利率。 獲利率 (%)=總獲利金額/總投注金額 (單位: 元)
第 5.1 節 TWP策略結果
Diffpercent
策略
投注場次
投注金額 (元)
獲利金額 (元)
獲利率
0.1
平均策略
767
767000
141590
18.46%
前一場策略
761
761000
135100
17.75%
前五場平均策略
756
756000
143020
18.92%
平均策略
533
533000
119040
22.33%
前一場策略
496
496000
99440
20.05%
前五場平均策略
529
529000
105670
19.98%
平均策略
334
334000
68500
20.51%
前一場策略
312
312000
57040
18.28%
前五場平均策略
326
326000
63350
19.43%
0.2
0.3
30
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
Diffpercent
策略
投注場次
投注金額 (元)
獲利金額 (元)
獲利率
0.4
平均策略
158
158000
30990
19.61%
前一場策略
140
140000
22120
15.80%
前五場平均策略
148
148000
23280
15.73%
平均策略
50
50000
9300
18.60%
前一場策略
36
36000
5880
16.33%
前五場平均策略
45
45000
6580
14.62%
平均策略
11
11000
610
5.55%
前一場策略
11
11000
-510
-4.64%
前五場平均策略
10
10000
420
4.20%
0.5
0.6
表 5.1-1 TWP 策略結果表
由上表的結果可以得知, 整體而言都有不錯的獲利率, 除了 Diffpercent=0.6 時的前一場策略的獲利率為負的, 這也証明了有高勝率並不一定
會有好的結果。 觀看各種 Diffpercent 的結果。 在 Diffpercent=0.2 時, 各 項策略的獲利率為最高, 其中又以平均策略表現最佳。
第 5.2 節 PCRS策略結果 DiffPCRS 投注場次 投注金額 (元)
獲利金額 (元) 獲利率
1
640
640000
68720
10.74%
2
297
297000
34860
11.74%
3
85
85000
7330
8.62%
4
9
9000
1390
15.44%
表 5.2-1 PCRS 策略結果表
由上表的結果顯示, 儘管 DiffPCRS 的不同, 所得到的獲利率都為 正值, 當中又以 DiffPCRS=4 時所獲得的獲利率為最佳。 TWP 策略與 PCRS 策略都能有不錯的結果, 但是相形比較之下,TWP
策略明顯優於 PCRS 策略, 這也表示在現階段的研究來看, 採取分析球隊 的方式較優於分析球員的方式。
31
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
第 6 章 結論 本研究所獲得的結果有著不錯的獲利率, 但當中也存在些不確定的因 素, 好比說模擬賠率的部分, 本研究基於學術原則不直接採用真實的賠率, 但在比較過模擬賠率跟現實賠率的差異, 實際上的結果是相差不遠, 所以 在獲利率的表現上或許會有些微的偏頗, 但差異並不會有太大的起伏。 另 外在 PCRS 策略尚且還有改進的空間, 可以增添新的數據進來, 畢竟分析 球員在細節上確實比較能夠代表整支球隊, 因為球員有季中交易、 受傷的 因素, 這方面的訊息是 TWP 策略所無法考量的, 所以 PCRS 策略尚且 還有超越 TWP 策略的表現的可能。 不過在預測 NBA 這項領域上, 並非只單單依靠一個模型、 四種策略 就能夠詮釋所有結果, 尚且還有許多因素是無法克服, 例如:d團隊合作c、d教 練的戰術c、d防守數據c· · · 等等, 這些都是目前無法一一將其數據化的的 資訊, 況且在 NBA 統計數據上尚有許多從基本數據所轉換過後的新數據, 如何將這些各種轉換後的新數據創造出新的模型, 而這些新的模型是否能 夠比 Wayne Winston 所發展出的dFour Factor regression modelc更為 有效, 這是需要經過長期的分析才能有所結果, 另外是否要考量球員薪資、 球團結構、 運動博弈市場· · · 等等, 這些經濟效應的因素, 也是在預測 NBA 上的影響因素, 再加上目前 NAB 官方與各 NBA 資料庫網站所提供的數 據都是些大範圍的數據, 所謂大範圍數據是指整場比賽的 Box Score, 而 在小範圍的數據, 例如半場數據、 每一節數據、 球隊在前三節的數據或者 是球隊在比分相近的情況下的數據· · · 等等, 這些細節的數據並不會免費 提供在網路上, 所以在取得這些數據上有一定的難度, 所以在預測 NBA 領域上還有很多的發展空間值得研究。 最後這項研究是否能夠在運動博弈市場上有著良好的表現, 這則是需 要再經歷多個賽季才能驗證。
32
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
參考文獻 1. 王派洲 (譯)(民 97) 。 資料探勘:概念與方法 (原作者:Jiawi Han and Micheline Kamber) 。 台中市:滄海書局 。 (原著出版年:2006) 2. 張美惠 (譯)(民 97) 。 什麼都能算 , 什麼都不奇怪-超級數據分析
的秘密 (原作者:Ian Ayres) 。 臺北市:時報文化 。 (原著出版年 :2007) 3. bri (民 99 年 5 月 29 日) 。 淺談 NBA 中的數據分析[線上論壇] 。
取自 telnet://ptt.cc:NBA 看板 4. Berri, David J, and Martin B. Schmidt. (2010). Appendix A: Measuring Wins Produced in the NBA Stumbling On Wins: Two Economists Expose the Pitfalls on the Road to Victory in Professional Sports.(pp. 141-160).New Jersey, NJ:Pearson Education, Inc. 5. Culp, M., Johnson, K., and Michailidis, G. (2006) ada: An R Package for Stochastic Boosting, http://www.stat.lsa.umich.edu/ culpm/math/ada/ada manual.pdf 6. David Biderman (2010, March 12). Are Statheads the NBA0 s Secret Weapon? The Wall Street Journal. Retrieved from http://online.wsj.com 7. Friedman J, Hastie T, Tibshirani R (2000). Additive Logistic Regression: A Statistical View of Boosting. The Annals of Statistics, 28(2), 337-407. 8. National Basketball Association. Retrieved from http://hoopedia.nba.com
33
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
9. Oliver, Dean. (2004). Basketball on Paper: Rules and Tools for Performance Analysis.
Washington, D.C.: Potomac
Books, Inc. 10. Winston, Wayne L. (2009). Part III.Basketball Mathletics: How Gamblers, Managers, and Sports Enthusiasts Use Mathematics in Baseball, Basketball, and Football.(pp. 185252). New Jersey, NJ: Princetion University Press. 11. Yao, King. (2007). CHAPTER 2 BASICS. Weighing the Odds in Sports Betting(pp. 29-30). Las Vegas, W. NEVSO DR: Pi Yee Press
34
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
附錄 A NBA球隊分佈表 東區 (Eastern Conference) 分組
大西洋組 (Atlantic)
中央組 (Central)
東南組 (Southeast)
球隊
中譯
隊名縮寫
成立時間
Boston Celtics
波士頓賽爾提克
BOS
1946
New Jersey Nets
紐澤西籃網
NJN
1967
New York Knicks
紐約尼克
NYK
1946
Philadelphia 76ers
費城 76 人
PHI
1946
Toronto Raptors
多倫多爆龍
TOR
1995
Chicago Bulls
芝加哥公牛
CHI
1966
Cleveland Cavaliers
克里夫蘭騎士
CLE
1970
Detroit Pistons
底特律活塞
DET
1941
Indiana Pacers
印第安納溜馬
IND
1967
Milwaukee Bucks
密爾瓦基公鹿
MIL
1968
Atlanta Hawks
亞特蘭大老鷹
ATL
1946
Charlotte Bobcats
夏洛特山貓
CHA
2004
Miami Heat
邁阿密熱火
MIA
1988
Orlando Magic
奧蘭多魔術
ORL
1989
Washington Wizards
華盛頓巫師
WAS
1961
35
逢甲大學e-Thesys(99 學年度)
評估美國職業籃球球隊戰績的預測策略
西區 (Western Conference) 分組
西北組 (Northwest)
太平洋組 (Pacific)
西南組 (Southwest)
球隊
中譯
隊名縮寫
成立時間
Denver Nuggets
丹佛金塊
DEN
1967
Minnesota Timberwolves
明尼蘇達灰狼
MIN
1989
Oklahoma City Thunder
奧克拉荷馬雷霆
OKC
1967
Portland Trail Blazers
波特蘭拓荒者
POR
1970
Utah Jazz
猶他爵士
UTA
1974
Golden State Warriors
金州勇士
GSW
1946
Los Angeles Clippers
洛杉磯快艇
LAC
1970
Los Angeles Lakers
洛杉磯湖人
LAL
1946
Phoenix Suns
鳳凰城太陽
PHO
1968
Sacramento Kings
沙加緬度國王
SAC
1945
Dallas Mavericks
達拉斯小牛
DAL
1980
Houston Rockets
休士頓火箭
HOU
1967
Memphis Grizzlies
曼菲斯灰熊
MEM
1995
New Orleans Hornets
紐奧良黃蜂
NOH
1988
San Antonio Spurs
聖安東尼奧馬刺
SAS
1967
36
逢甲大學e-Thesys(99 學年度)
Assists
Block
Center
AST
BLK
C
37
Defensive Rating
Efficiency
Effective Field Goal Percentage
Field Goals(Made)
Field Goal Percentage
Field Goal Attempts
Free Throws(Made)
Free Throw Percentage
DRtg
EFF
EFG%
FG(FGM)
FG%
FGA
FT(FTM)
FT%
Point allowed per game
3-Point Field Attempts
3PA
DPPG
3-Point Field Goals Percentage
3P%
Defensive Rebound Percentage
3-Point Field Goals(Made)
3P(3PM)
DRB%
3-Point Field Goals(Made)
3P(3PM)
Defensive Rebounds
3-Point Field Goals(Made)
3P(3PM)
DRB
英文解釋
術語
B NBA術語中英對照表
三分球出手次數 助攻次數 阻攻次數 中鋒
投籃命中率 投籃出手次數 罰球命中次數 罰球命中率
Four Factors-Shooting
有效投籃命中率
投籃命中次數
(PTS+TRB+AST+STL+REB)-(FGA-FG)-(FTA-FT)-TOV
效率值
每場平均失分
防守籃板比率 Four Factors-Rebounding
三分球命中率
三分球投籃命中次數
防守籃板次數
三分球投籃命中次數
球員
備註
三分球投籃命中次數
中文解釋
逢甲大學e-Thesys(99 學年度)
球隊
評估美國職業籃球球隊戰績的預測策略
38
Minutes Played
miss Field Goal
miss Free Throws
Offensive Rating
MP
missFG
missFT
ORtg
Player Efficiency Rating
Power Forwards
Personal Fouls
Points Guards
Possessions
Points
Point scored per game
PER
PF
PF
PG
Poss
PTS
PPG
Offensive Rebound Percentage
Losses
L
ORB%
Games Started
GS
Offensive Rebounds
Games
G
ORB
Free Throws
FTR
Opponent
Free Throw Attempts
FTA
Opp
英文解釋
術語
Four Factors-Rebounding
罰球未命中的次數
逢甲大學e-Thesys(99 學年度) 每場平均得分
得分
控球後衛
犯規次數
球隊比賽的進攻次數
大前鋒
進攻籃板次數 進攻籃板比率
對戰球隊
投籃未命中的次數
球隊
上場比賽時間
敗場數
比賽先發次數
球員
Four Factors-Free Throws
備註
比賽次數
站上罰球線的頻率及製造罰球機會
罰球次數
中文解釋
評估美國職業籃球球隊戰績的預測策略
39
Won-Lost Percentage
W-L%
Win Score
Wins
W
True Shooting Percentage
Turnovers
TOV
TS%
Team
Tm
Total Rebounds
Steals
STL
TRB
Shooting Guards
SG
Turnovers Percentage
Small Forwards
SF
TOV%
英文解釋
術語
勝率 球員的得分數值
ORB+DRB
總籃板次數
勝場數
Four Factors-Turnovers
失誤比率
失誤次數
抄截次數
球隊
球隊
得分後衛
球員
備註
小前鋒
中文解釋
評估美國職業籃球球隊戰績的預測策略
逢甲大學e-Thesys(99 學年度)