範文齋

位置:首頁 > 校園範文 > 其他

常用的數據分析工具有那些?

其他2.31W

本文觀點最初來源於百度知道:數據處理軟件有那些?百度知道的推薦答案是mathlab SPSSDIMENSION QUANTUM SASSurveycraft 等軟件,這些讓小編想起了大學時代的一些數據處理軟件包,比如計量經濟學中用到的eviews,但是這些遠不夠詳細,本想自己寫一篇數據分析相關軟件的文章,谷歌一下卻發現沈浩老師在幾年前就有過這樣的總結。沈浩老師介紹全文如下:

常用的數據分析工具有那些?

工欲善其事,必先利其器!

數據分析也好,統計分析也好,數據挖掘也好、商業智能也好都需要在學習的時候掌握各種分析手段和技能,特別是要掌握分析軟件工具!我曾經說過,沈老師的學習方法,一般是先學軟件開始,再去應用,再學會理論和原理,因爲是老師,再去教給別人!沒有軟件的方法就不去學了,因爲學了也不能做,除非你自己會編程序。

那麼在數據分析領域,都有哪些軟件分析工具呢?如何選擇呢?其實很多領域或者說分析方法都有相應的軟件工具,只要你想找就應該能夠找到!

這裏我把軟件分成縱橫四個層次的的象限圖來表達!

第一維度:數據存儲層>數據報表層>數據分析層>數據展現層

第二維度:用戶級>部門級>企業級>BI級

首先,存儲層:

我們必須能夠存儲數據,對個人來講至少應該掌握一種數據庫技術,當然也不一定要熟練操作,但至少要能夠理解數據的存儲和數據的基本結構和數據類型,比如數據的安全性、唯一性、冗餘性,表的關係,粒度,容量等,最好能夠理解SQL查詢語言的基本結構和讀取等等!

Access2003、Access07等:這是最基本的個人數據庫,經常用於個人或部分基本的數據存儲;

MySQL數據庫,這個對於部門級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力;

SQL Server 2005或更高版本,對中小企業,一些大型企業也可以採用SQL Server數據庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;

DB2,Oracle數據庫都是大型數據庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型數據庫公司都提供非常好的數據整合應用平臺;

BI級,實際上這個不是數據庫,而是建立在前面數據庫基礎上的,這個主要是數據庫的企業應用級了,一般這個時候的數據庫都叫數據倉庫了,Data Warehouse,建立在DW級上的數據存儲基本上都是商業智能平臺,或許整合了各種數據分析,報表、分析和展現!

第二:報表層

當企業存儲了數據後,首先要解決的報表,還不是分析問題,是要能夠看到,看到報表,各種各樣的報表!國內外有專門提供報表分析服務的企業和軟件。

Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規範的報表設計思想,早期商業智能其實大部分人的'理解就是報表系統,不借助IT技術人員就可以獲取企業各種信息報表。而且很多數據庫內置的報表也是採用CR報表的開發版嵌入的!

Tableau軟件,這個軟件是近年來非常棒的一個軟件,當然它已經不是單純的數據報表軟件了,而是更爲可視化的數據分析軟件,因爲我經常用它來從數據庫中進行報表和可視化分析,先暫列在報表層;

這個軟件從3.0開始,現在已經有了5.1版本,兩年的時間已經到了服務器和Web方式了!

當然,如果企業有上萬張報表,需要好好管理起來,還有安全性,併發請求等,就需要有Server版;

博易智訊公司專門提供Crystal Report和Crystal Report Server版銷售和軟件服務;

第三:數據分析層

這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;

Excel軟件,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;

SPSS軟件:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成爲了預測分析軟件。

Clementine軟件:當前版本13.0,數據挖掘工具,我從6.0開始用,到了13版,已經越來越多的提高了更多有好的建模工具,現在改名叫PASW Modeler 13建模器了。而且與SPSS統計功能有了更多的整合,數據處理也更加靈活和好用。

SAS軟件:SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的!

當然,我主要是採用SPSS和Clementine,有時候就是習慣,當然會了一種軟件在學其他的也不是很困難!

JMP分析:SAS的一個分析分支

XLstat:Excel的插件,可以完成大部分SPSS統計分析功能

Ucinet社會網分析軟件:SNA社會網絡分析是非常流行和有價值的分析工具和方法,特別是從關係角度進行分析社會網絡,關係分析非常重要,過去我們都是屬性數據分析

大家如果有需要試用版,可以聯繫博易智訊,他們可以提供SPSS和Clementine軟件版本的諮詢。

第四:表現層

最近我一直在研究數據可視化技術,一方面是因爲Excel大家有需求,另一方面就是我第一個購買了Xcelsius,也寫了《Excel高級應用與數據分析》和《數據展現的藝術Xcelsius》。這個領域的軟件,特別是一些小工具非常有價值!

PowerPoint軟件:這個沒得說了,大部分人都是用PPT寫報告;

Visio、SmartDraw軟件:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這裏可以得到很多零件;

Swiff Chart軟件:製作圖表的軟件,生成的是Flash;

Color Wheel軟件:配色軟件

Yed軟件:網絡關係圖、流程圖和圖形分析軟件,類似SNA分析,我經常用來設計流程圖,還有就是分析優化關係圖;

Netdraw軟件:這是社會網絡分析展現軟件,主要是可視化網絡關係圖的,讀取Ucinet軟件;

Mindmanager軟件:思維導圖,非常好的軟件,可以把非線性思維很快構建起來,並且項目組織管理、報告設計構想都可以應用,直接生成PPT等,當然這個軟件功能非常強大,我的學生都用它來做筆記和會議記錄;

Xcelsius軟件:Dashboard製作和數據可視化報表工具,可以直接讀取數據庫,在Excel裏建模,互聯網展現,最大特色還是可以在PPT中實現動態報表;這個是我最希望應用的一個軟件工具,非常有價值!

最後,需要說明的是,我這樣的分層分類並不是區分軟件,只是想說明軟件的應用,其實每個層次的軟件都是相互融合的,追求:平臺化,整合化,智能化,可視化,專業化,都是各有特色;價格也不同,有免費的,有上百萬的;有單機版的,有服務器版的;有正版的,有盜版的!

有時候我們把數據庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展現;當然有時候展現就是分析,分析也是報表,報表就是數據存儲了!沒有最好,只有更好,適合你的就是最好的!

其實還有很多數據分析軟件:

AMOS軟件:結構方程式模型SEM,實證研究和理論模型的重要分析工具,從事學術研究的人,特別是社會科學工作者應該掌握;

Lisrel軟件:結構方程式模型SEM,同上!

HLM軟件:分層線性模型;

標籤:數據分析