[音樂] [音樂]
[音樂]
[音樂] [音樂]
[音樂] [音樂]
各位同學大家好,那本講次呢,我們將會介紹 如何用這個
Python 程式來分析股票市場。
那就是,那我們使用的是 台灣股票市場的資料。
那我們 本講次主要就是說,希望讓大家能夠了解到怎麼樣
能夠用 Python 這個程式語言來分析這個真實世界的財經資料。
那基本上呢,我們這個一般來說在做資料分析的時候,
都會遇到這個蠻多的工作需要做。
比如說,一般來說,資料在取得之後呢,
必須要做一些這個前處理呀!比如說,很多時候,資料是在一個 CSV 的檔案格式裡面,你要怎麼樣
把這個檔案裡面的資料讀出來呢?然後做一些適當的處理,那之後呢,可能要做一些這個 所謂的資料分析。
那比如說,我們如果是用統計模型, 那統計模型這個部分也需要做一些運算。
那後面呢, 很多時候我們處理的是大量資料,所以很多時候是必須要把同一個步驟重複
做很多次。
那最後就是說,這個結果的呈現,怎麼做視覺化的部分。
所以我們今天這些部分都會有一些介紹。
那所以就是從,我們從這個股票市場 的基本介紹開始。
那股票市場大概可以分為所謂的初級市場跟次級市場兩種。
那這個初級市場呢,一般來說就是所謂的這個發行市場。
發行市場 就是說一家公司它本來是沒有公開發行的,那它要把它 變成所謂的公開發行的公司。
那所以這個 這時候它需要把它的股票上市,那這個叫做初級市場。
那次級市場就是說,這個公司一旦公開發行之後呢,
它後續我們就可以在股票市場上面交易它的股票。
那我們平常看到的股價跟交易資訊基本上都是從次級市場來的,因為初級市場
的公開發行這件事情並不是每天都會發生的事情。
那在這個,在台灣呢,處理這個股票交易的
這個單位叫做台灣證券交易所。
那台灣證券交易所 成立地相當早,是 1961 年的時候成立的。
那這個,它這個,我們的交易所是所謂的 股份有限公司,雖然說它的大部分是官方持股,但是它還是一個公司。
那在台灣,這個股票交易的時間呢, 是從禮拜一到禮拜五的早上九點到下午的一點半。
那如果說,就是,一般來說,大家如果放假,這個股票市場當然也放假了。
那特殊的狀況,比如說是地震吶,或者是有天災啊,颱風啊這些狀況的話,那就是看台北市 有沒有上班上課。
如果台北市有上班上課的話,那這個 股票就會交易,不然的話呢,這個股票就不會交易。
好,那我們很快來看一下這個台灣股票市場的這個狀況。
那台灣股票市場,目前大概有 800 家左右的上市公司。
那也有 一些這些 600 多家的上櫃公司,那整個市值還算是蠻龐大的。
這個單位是 十億元。
那這個是 2014 年的資料,所以現在應該也是還更多一些。
那你光看 這個數字可能不是很有概念。
所以我們來看一下,它在這個整個世界的股票市場的一些 排名。
那台灣的排名大概都有在十幾名啦。
那大家要知道,台灣是一個很小的一個地方,所以它的股票市場 有到十幾名,表示說它其實是一個相當活躍的一個市場。
那你可以看得出來,就是說在台灣的股票 市場交易的大部分的標的是所謂的股票,那少數的是所謂的權證, 或 ETF 這些東西。
那你如果不是那麼清楚說什麼是權證或 ETF,那也沒有關係。
那我們在這邊,本次就是會針對股票的價格來分析。
那所以我們很快來看一下這個 股票的資料長什麼樣子。
一般來說,你如果去 下載股票的歷史資料的話,大概 格式大概是長這個樣子。
就是會有一個所謂的股票代碼,然後呢,會有這個股票的名稱, 然後呢,會有它的,比如說它的產業類別啊。
這個數字 1234 這個是產業類別。
還有這個是交易的日期,還有那一天的這個開盤價, 然後最高價、 最低價,以及這個收盤價。
那在整個這些價格裡面呢, 股票的交易基本上採取的是所謂的
auction 的一個形式, auction 就是一個競標的一個形式。
那它 的這個形式其實跟,比如說,你去這個 eBay 上面,或者是 一些所謂的這個拍賣網站。
拍賣網站 上面的價格決定的這個模式是有點類似的。
那 細節我們就不在這邊多談了。
那基本上這個開盤價 就是說我們台灣的股票市場是九點開盤,所以開盤的時候,股票市場會先把
針對某一隻股票呢,所有要買的人、 要賣的人下的單拿來,然後決定一個所謂的開盤價。
那之後呢,它會每一小段時間就會做一次類似的 價格決定的這個機制。
然後呢,就會有一個價格出來,一直到
收盤前幾分鐘呢,它會把收盤前所有的買單跟賣單 結合起來再決定一次收盤的價格。
所以每一隻股票在每一天都是做這樣子的事情。
那所以呢,這個機制就會讓我們在每一天會有一個開盤價、 最高價、 最低價 跟收盤價。
那一般來說呢,股票的報酬呢,如果是指日報酬的話,指的是前一天的收盤價跟
今天的收盤價拿來做計算,就可以得到一個 今天的所謂的這個漲跌。