範文齋

相對於直接操作數據庫分析,hadoop和SPSS等分析軟件的作用

可能我的標題會讓專業人士有些鄙視,我是作爲一個基本小白的角度提出這個問題的.

我目前在某國企的基層分公司從事數據統計工作,具體的工作就是按照市場分析人員的要求,每天從oracle數據庫裏寫SQL或存儲過程,調取相應的數據,製成excel表格給市場分析人員進行二次加工或分析. 簡單來說,算是個人肉數據提取器.

一晃工作已經快十年了,感覺每天做的工作已經從新奇變成低級的重複勞動,技術上已經處於半荒廢狀態,只對oracle有個大致的瞭解,對數據倉庫的最簡單應用有個大概的認識.對於未來還是越來越惶恐,所以想學習一些新的知識來勉強跟上時代.

(我們常用的一個數據倉庫簡略來說是這樣的,若干個系統蒐集的底層數據經過清洗放在DW層,進過二次加工的原始數據放在一箇中間層MID層,最終系統級的展現及前臺應用放在DM層; 而我們是通過這三層數據用SQL語句進行一些系統外的整理加工. 一般的表日全量數據大約一千萬到1億行不等,常用的基礎表大約百來個)

由於一直從事的是數據挖掘(勉強算吧)工作,我們一直以來都是直接通過sql語句操作進行過清洗的底層數據.在網上搜索數據分析相關的知識,大部分的答案都指向SPSS及hadoop等數據挖掘軟件. 大概搜索了一下這些軟件的概況,可能我比較笨或是很久沒有學習專業知識了,很難看懂它們的作用.

說了那麼多,主要想請問下從事這個行業的牛人們,

1,假設我學習hadoop或SPSS,對我目前從事的數據統計分析工作有什麼幫助?
2,相對於直接用sql操作數據庫,hadoop和SPSS可以更便捷的實現哪些方面的功能?
3,這些軟件的學習週期大致是個什麼情況?
4,在拋開主題,我上面提到的數據倉庫的規模下,擴展學習哪些技能能起到最快的幫助.

期待專業人士的回答我這個開始有些中年危機的小白,萬分感謝. 可能我的標題會讓專業人士有些鄙視,我是作爲一個基本小白的角度提出這個問題的..

我目前在某國企的基層分公司從事數據統計工作,具體的工作就是按照市場分析人員的要求,每天從oracle數據庫裏寫SQL或存儲過程,調取相應的數據,製成excel表格給市場分析人員進行二次加工或分析. 簡單來說,算是個人肉數據提取器.

一晃工作已經快十年了,感覺每天做的工作已經從新奇變成低級的重複勞動,技術上已經處於半荒廢狀態,只對oracle有個大致的瞭解,對數據倉庫的最簡單應用有個大概的認識.對於未來還是越來越惶恐,所以想學習一些新的知識來勉強跟上時代.

(我們常用的一個數據倉庫簡略來說是這樣的,若干個系統蒐集的底層數據經過清洗放在DW層,進過二次加工的原始數據放在一箇中間層MID層,最終系統級的展現及前臺應用放在DM層; 而我們是通過這三層數據用SQL語句進行一些系統外的整理加工. 一般的表日全量數據大約一千萬到1億行不等,常用的基礎表大約百來個)

由於一直從事的是數據挖掘(勉強算吧)工作,我們一直以來都是直接通過sql語句操作進行過清洗的底層數據.在網上搜索數據分析相關的知識,大部分的答案都指向SPSS及hadoop等數據挖掘軟件. 大概搜索了一下這些軟件的概況,可能我比較笨或是很久沒有學習專業知識了,很難看懂它們的作用.

說了那麼多,主要想請問下從事這個行業的牛人們,
… 顯示全部

相對於直接操作數據庫分析,hadoop和SPSS等分析軟件的作用