財報分析 Data-ming - 金融分析師
By Enid
at 2007-10-20T01:37
at 2007-10-20T01:37
Table of Contents
※ 引述《rampage (愛樂)》之銘言:
: 我是資訊系的學生
: 以後想做財會資料 data-ming這個部分
: 想請教各位先進 如果有過此類的合作經驗w/ 資訊人員 (assuming 各位學財金 會計^^")
: 1. 你們與資訊人員溝通時 面臨最大的困難是什麼
: 2. "data-ming 的資訊人員" 這樣的角色在實務界(台灣/國外) 是受到重視的嗎
: 各位覺得它的前景如何
: 3. 商科的課 我應該多修一些什麼?高階數學? (我不喜歡數學 其實..><)
: --
提供一下個人經驗供參考
我覺得和資訊人員作溝通的時候
最痛苦的是他們不知道Business Rules
由最底層的說起
1.1
公司財報格式欄位各家不一
這是因為要配合各家公司的實際營運狀況以及便利性
但是資料庫的Table和Column就是固定的
或許你可以用財政部的營利事業所得稅表格當成你資料庫的結構
但是你只是把問題弄得更複雜罷了
營利事業所的稅是稅簽基礎
稅簽和財簽有很多會計原則不同
例如說折舊 租賃
有很多原因會讓外界不喜歡用企業的稅報
更別提投資領域的人了
所以你只是創造出更多以後會是 Null的Column
一大堆Null的Column你就得合併Column才能做Data Mining
這樣問題不就又回來了 而且創造出另一個問題
1.2
你該如何設計你的資料庫呢?
基本上財報資料庫有兩種架構(個人經驗啦 非學術架構)
一種是依據會計原則 子項加總一定等於母項 母項不開放輸入
一種是依據說明事項 把附註事項的事項分門別類
(如果你認真的讀完一本 就會發現其實財報的重點在附註事項)
例如會把票據貼現金額呈現出來
那麼就可以將應收票據以及短期借款加總回去 呈現出更真實的資產負債狀況
但是這樣的設計基礎必須建立在業務上有這樣多的財報需要建檔
這包括了家數 也包括了年數
更重要的 是必須有整個對會計相當當熟析的團隊
才能夠將一年幾千本不同格式的財報展開到資料庫裡
不然也只是設計了一個一大堆空值的資料庫
2.1
單純從會計報表是無法應用的
一定會串到其他資料
例如說董監持股 資券資料 或是董事長有沒有信用瑕疵
假設你同時有董監持股 還有董事長的聯徵與票交所資料
你怎設計呢?
董監持股資料是團隊資料 Key和PK都是公司統編
董事長是個人資料 Key是董事長ID PK則是公司統編
你放在一起很可能就會出現同一家公司同時間有兩個董事長的奇怪現象
2.2
在做Data Mining的時候
一定會碰到Data Mart
Data Mart和Data Warehouse最大的不同在於
Data Warehouse是將不同系統的資料庫全都集中在一起
例如會計資料庫 股價資料庫 基本資料庫
這些資料庫的Tabale會是應用端的資料
將一整個完整的table轉到Data Warehouse
例如你要同時使用塊祭資料 董監持股 與股價
你就不必串連同三個資料庫
而且DataWareHouse的資料也同時提供不同需求者應用
但是對於一個需要頻繁使用 且同時串接到多個資料庫的User而言
如果將串接的工作留給系統做
那Performance將會非常差
最好的做法利用擷取Data Warehouse的資料時
先用ETL工具是整理過一遍 後 存到專用的資料庫
但要整之前 又得靠對Business Rules的專業知識
先規劃出Mapping Table
--
好像說不完..
算了..就先這樣囉
: [註]目前修過 經原 中會 成管會; 對會計頗有興趣
:
: --
: 我是資訊系的學生
: 以後想做財會資料 data-ming這個部分
: 想請教各位先進 如果有過此類的合作經驗w/ 資訊人員 (assuming 各位學財金 會計^^")
: 1. 你們與資訊人員溝通時 面臨最大的困難是什麼
: 2. "data-ming 的資訊人員" 這樣的角色在實務界(台灣/國外) 是受到重視的嗎
: 各位覺得它的前景如何
: 3. 商科的課 我應該多修一些什麼?高階數學? (我不喜歡數學 其實..><)
: --
提供一下個人經驗供參考
我覺得和資訊人員作溝通的時候
最痛苦的是他們不知道Business Rules
由最底層的說起
1.1
公司財報格式欄位各家不一
這是因為要配合各家公司的實際營運狀況以及便利性
但是資料庫的Table和Column就是固定的
或許你可以用財政部的營利事業所得稅表格當成你資料庫的結構
但是你只是把問題弄得更複雜罷了
營利事業所的稅是稅簽基礎
稅簽和財簽有很多會計原則不同
例如說折舊 租賃
有很多原因會讓外界不喜歡用企業的稅報
更別提投資領域的人了
所以你只是創造出更多以後會是 Null的Column
一大堆Null的Column你就得合併Column才能做Data Mining
這樣問題不就又回來了 而且創造出另一個問題
1.2
你該如何設計你的資料庫呢?
基本上財報資料庫有兩種架構(個人經驗啦 非學術架構)
一種是依據會計原則 子項加總一定等於母項 母項不開放輸入
一種是依據說明事項 把附註事項的事項分門別類
(如果你認真的讀完一本 就會發現其實財報的重點在附註事項)
例如會把票據貼現金額呈現出來
那麼就可以將應收票據以及短期借款加總回去 呈現出更真實的資產負債狀況
但是這樣的設計基礎必須建立在業務上有這樣多的財報需要建檔
這包括了家數 也包括了年數
更重要的 是必須有整個對會計相當當熟析的團隊
才能夠將一年幾千本不同格式的財報展開到資料庫裡
不然也只是設計了一個一大堆空值的資料庫
2.1
單純從會計報表是無法應用的
一定會串到其他資料
例如說董監持股 資券資料 或是董事長有沒有信用瑕疵
假設你同時有董監持股 還有董事長的聯徵與票交所資料
你怎設計呢?
董監持股資料是團隊資料 Key和PK都是公司統編
董事長是個人資料 Key是董事長ID PK則是公司統編
你放在一起很可能就會出現同一家公司同時間有兩個董事長的奇怪現象
2.2
在做Data Mining的時候
一定會碰到Data Mart
Data Mart和Data Warehouse最大的不同在於
Data Warehouse是將不同系統的資料庫全都集中在一起
例如會計資料庫 股價資料庫 基本資料庫
這些資料庫的Tabale會是應用端的資料
將一整個完整的table轉到Data Warehouse
例如你要同時使用塊祭資料 董監持股 與股價
你就不必串連同三個資料庫
而且DataWareHouse的資料也同時提供不同需求者應用
但是對於一個需要頻繁使用 且同時串接到多個資料庫的User而言
如果將串接的工作留給系統做
那Performance將會非常差
最好的做法利用擷取Data Warehouse的資料時
先用ETL工具是整理過一遍 後 存到專用的資料庫
但要整之前 又得靠對Business Rules的專業知識
先規劃出Mapping Table
--
好像說不完..
算了..就先這樣囉
: [註]目前修過 經原 中會 成管會; 對會計頗有興趣
:
: --
Tags:
金融分析師
All Comments
By Kyle
at 2007-10-24T06:05
at 2007-10-24T06:05
By Carolina Franco
at 2007-10-26T01:48
at 2007-10-26T01:48
By Charlotte
at 2007-10-29T16:21
at 2007-10-29T16:21
By Faithe
at 2007-10-29T20:31
at 2007-10-29T20:31
By Hedwig
at 2007-10-30T22:10
at 2007-10-30T22:10
By Elvira
at 2007-11-03T15:42
at 2007-11-03T15:42
By Carolina Franco
at 2007-11-04T22:35
at 2007-11-04T22:35
By Wallis
at 2007-11-08T05:08
at 2007-11-08T05:08
Related Posts
關於CFA證照???
By Edward Lewis
at 2007-10-16T19:58
at 2007-10-16T19:58
請問一下計算機按法
By Olga
at 2007-10-15T22:20
at 2007-10-15T22:20
請問level 1的考古題可以去哪下載
By Audriana
at 2007-10-15T22:15
at 2007-10-15T22:15
請問FM的參考書DerivativesMarkets有出習題的解答本嗎?
By Rae
at 2007-10-15T01:31
at 2007-10-15T01:31
為什麼零息債券被認為可操縱營運活動現金流量
By Andy
at 2007-10-14T00:40
at 2007-10-14T00:40