範文齋

位置:首頁 > 行業範文 > 證券

數據在經融證券中的地位和作用論文

證券1.79W

1我國企業信息系統建設的數據基礎薄弱

數據在經融證券中的地位和作用論文

1.1我國企業的信息系統建設處在初級階段

XX新聞社網站20XX年6月1日報道,信息產業部電子信息中心和藍田市場研究公司雙方合作進行了首次全國範圍的信息產業大型調查活動,獲得了全面的基礎數據報告(簡稱ITD20XX)。調查結果顯示,我國80%以上國家重點企業已建立辦公自動化系統和管理信息系統,70%以上接入互聯網,50%以上建立了內部局域網。企業已不同程度地在日常管理和決策環節上應用了信息技術。部分企業已經開始藉助互聯網開展商務活動。金融行業(包括證券)發展較快,對計算機信息系統和網絡的依賴是百分之百的,我國數據通訊網絡中60%~70%的信息量是金融電子化信息。

中國經貿委、信息產業部和科技部共同發起了“企業信息化工程“,企業上網是該工程的組成部分。根據2001年9月初國家經貿委經濟信息中心對551家國家重點企業及試點企業集團網站建設情況的調查,當前這些企業“觸網”呈現出三個特點:一是大部分企業已“觸網”,74%的企業已在互聯網上建立網站或設有主頁;二是不同地區的企業網站建設不平衡,中西部地區企業相對薄弱;三是網站質量良莠不齊。從上述內容可以得出一個結論,90年代以來,我國企業的信息系統建設,已經獲得了長足的發展,這是不容置疑的。但是也要看到,這個最具升值潛力的信息行業,同世界上其他國家相比,我國還處在相當低的層次。

國家統計局國際統計信息中心的研究人員,對世界二十個主要國家和地區(包括髮達國家和發展中國家)的信息能力進行了測算和比較,結果顯示中國信息能力處於最低水平之列。測算和比較是從信息技術和信息技術設備利用能力、信息資源開發與利用能力、信息化人才與人口素質以及國家對信息產業發展的支持狀況等四個方面,選取了二十九個指標編制了信息能力指數來測算信息能力大小。結果第一是美國,信息能力評分是71.76,日本第二69.97,澳大利亞65.59居第三。

中國只有6.17,是韓國的15.3%,是巴西的40.2%。美國哈佛大學理查德?諾蘭(RichardNolan)教授提出了企業信息系統建設六個階段劃分理論,即初始階段、擴展階段、控制階段、統一階段、數據管理階段和成熟階段,該理論通稱“諾蘭模型”。按此理論,我國大部分企業處於前三個階段。從上述的數據和國內外的比較,從諾蘭模型理論,從到處都可以看到的全國企業信息系統建設的現狀,從應用的廣度與深度,得出我國企業信息系統建設處在初級階段的結論應該是毫無疑義的。

1.2我國企業的信息系統建設存在着數據基礎薄弱問題

按照諾蘭模型,信息系統建設的第五階段是數據管理階段,其核心內容是“建立統一的數據管理體系”,“真正做到對整個機構的數據進行統一的規劃和應用”。可見,數據基礎建設已經是國際上衡量信息系統發展水平的一項重要標誌,是我國企業信息系統建設脫離初級階段向高級階段邁進的關鍵一步。數據基礎薄弱是我國企業信息系統建設存在着的一個非常普遍的問題。爲了說明我國企業信息化建設中數據問題的嚴重性,特舉《XXwanbao》20XX年10月16日報導的一個例子。今年“五一”黃金週,出遊人數出奇地火爆,以致一些景區人滿爲患,一些地方住宿、餐飲、交通全面緊張。

針對這種情況,從今年“十一”黃金週開始,國務院實行旅遊預警制,也就是建立黃金週旅遊信息統計制度和預報體系,通過媒體向全社會發布重點旅遊城市住宿、旅遊社接待、交通客運和景區等環節上的飽和情況,讓消費者更加明智地安排旅遊行程。旅遊預警制本來是運用信息技術解決全國性問題的非常好的措施,但結果是:三大“致命傷”制約旅遊預警。信息預報不夠準確是此次旅遊預警制的首個要害。一些景區在節前就已發佈“飽和”、“客滿”的信息,讓想去那裏遊玩的遊客都打了“退堂鼓”。而實際上,許多景區的實際進場遊客只有其接待能力的一半甚至更少,生意反落得不如平常。如九寨溝、峨眉山、武夷山、黃山等。

今年國慶,九寨溝就過高估計自己的遊客量,在9月20日就提出“四限”遊客的措施,廣東的一些大旅行社聞訊立即搶訂了九寨溝賓館3000多間客房,但實際報名人數只達到預期中的1/10。下了訂金的旅行社因此叫苦不迭,而九寨溝也唱起了“空城計”,從而造成了“有人唱戲,無人看戲”的局面。旅遊預報信息的滯後性是此次旅遊預警制的第二個要害。信息發佈未趕上游客行程,夜間活動未列入統計數據。第一次預報到9月21日晚才公佈,但很多打算出遠門的人早在預報公佈之前就已定好了計劃和車票;旅行社方面其收客也已近尾聲,他們都不會因爲信息預報而取消行程。在“十一”期間,每天的信息都在下午5時之前統計出來了,對一些活動主要在夜間進行的景區如深圳的世界之窗來講,這些信息就無法計算在內了。我國信息傳送缺乏科學、準確,容易失真無法跟進是此次旅遊預警制的第三個要害。據悉,旅遊預警制並不是中國首創的,在一些歐洲國家,還有日本,早有類似的預警制度。

他們在節假日中往各地派駐記者進行現場報道,並通過媒體不斷地播放關於預訂機票和住宿等旅遊資源的信息,從而起到了很好的效果。但是它們一般都是發達國家,信息傳送作到科學、準確、快速,遊客往往能夠根據預報的信息做出最佳決定。而中國的旅遊信息預報因爲設備等方面的侷限,無法隨時隨地進行傳送、及時跟進,因而操作起來比較困難。建立旅遊預警制是發展我國旅遊事業的一個非常好的措施,但由於數據基礎問題,當前預警制在我國沒有取得成功。

旅遊數據問題並非是個別例子,即使全國經濟數據也存在數據基礎問題。國家經貿委信息中心劉力主任講,國家重點企業向國家經貿委上報數據的工作迄今已有四年。在國家經貿委上報中辦、國辦的各項信息中,重點企業信息採用率是最高的。但由於企業信息管理水平低,常有一些企業上報數據不完整、不及時、不準確,這些都嚴重影響了國家對重點企業情況的及時掌握。我國企業信息系統的數據基礎問題集中體現在四個方面:(1)信息基礎建設薄弱。其後果集中表現爲:企業的基本數據和主要數據不全面、不準確,造成基礎決策數據貧乏,影響各層機構的管理和決策。

其原因在於,企業領導和建設者們,對我國企業面臨的最迫切問題是信息基礎建設,缺乏認識和重視,往往是好高務遠;企業信息化建設中存在着技術因素,更存在着非技術因素,但對技術因素考慮得過多,對非技術因素估計不足,這裏面非技術的因素卻在起着主要作用。(2)企業信息管理水平低,數據管理混亂。其後果集中表現爲:需要數據時難於檢索,急用時查不到,只好重複向下面索要數據,反覆編制報表。(3)數據處理和數據交換的規範和標準嚴重缺乏或者有而沒有執行。其後果集中表現爲:信息交流過程中,內部的數據不統一,交換的數據不能用,報表的數據格式不符合標準,影響企業、行業、地區直到全國信息統計的準確性。(4)缺乏企業內、企業間信息化的統一規劃。

其後果集中表現爲:企業信息化各自爲政,造成本來統一和一致的信息人爲分割,數據共享程度很低,難以實現資源共享,無法開展電子商務。可見,我國企業的信息系統建設存在着普遍性的、嚴重的、不下大力氣難於解決的數據基礎問題,這是一個明顯的不爭的事實。

2數據在信息系統建設中的地位和作用

當前我國信息系統水平很低的主要原因之一是對數據在信息系統建設中的地位和作用認識不夠。因此,首先應該從理論上、認識上解決問題。

2.1數據是信息系統的原料、食糧、內容,是信息系統應用的前提,是信息系統價值之所在

當前,我們大力提倡和發展信息技術,目的是什麼呢?目的是爲了快速、高效地處理和獲取信息,爲社會的發展服務。信息來自被信息技術處理了的數據。數據經過信息加工廠的加工,變成可以排序、可以統計、可以幫助決策的信息,才能真正實現它的價值,這便是信息化的作用,使其真正地產生經濟效益。因此,數據是所有信息產生的基礎,同樣也是信息系統的基礎,更是內容產業的基礎。

2.2數據是信息系統建設的中心、核心從信息系統的組成和處理流程

可以明顯看到,以數據爲基礎的數據庫是構成信息系統諸要素的核心,信息系統都是以數據庫爲基礎實現的;在系統的處理過程中,由各種數據組成的數據流,貫穿於整個處理流程的始終,一直處於中心位置。基於數據的這種特殊地位,美國學者馬丁提出了以數據爲中心的開發思想和以數據平臺爲核心的系統結構。數據平臺不僅是系統實現各種功能的核心,也是系統可以長期穩定存在的基礎。數據處於信息系統中心地位的另一原因是數據的穩定性,具有一個穩定的數據基礎是建設信息系統最本質的問題。計算機硬件和軟件由於設備的升級被更換,企業的數據處理過程在變化,工作人員不斷流動,系統所開發的功能也會由於管理工作的變化而更換,但是其基本的數據卻是穩定不變的。例如,對於電廠來說,無論管理方式如何變化,汽機、鍋爐、人事、燃料、物資等部門的基礎數據類型卻是穩定不變的。穩定的數據基礎對一個企業來講還具備行業共性,對同行業的其它企業有參考和數據共享的作用。數據平臺不僅是系統實現各種功能的核心,也是系統可以長期穩定存在的基礎。

2.3規範化與標準化是信息資源共享的必要條件

規範化的數據及與之相關聯的標準化的規定(編碼、格式、詞表、描述語言、置標語言等)、規則化的處理(流程、作業),是整個企業、全行業、全社會信息資源共享的必要條件。企業從生產到銷售本來是一個有機結合的整體,但在非信息化的企業,其信息卻處在一種孤立的、分散的、不連接、不一致、不統一的信息隔斷的狀態,信息不能共享。計算機技術提供了改變這種狀態的可能和手段。利用信息技術,可以將企業的業務流程緊密地連接在一起,但要真正改變這種狀態,則需要從數據着手,從數據同計算機技術的結合着手。目前,惠普擁有全球最大的企業內部網,12萬5千名員工都可以通過網絡取得統一的、標準化的信息和知識。規範化的數據及與之相關聯的標準化的數據規定(編碼、詞表、格式、描述語言、置標語言等)、規則化的處理流程和作業,三者嚴密地組織起來,實行企業一體化的集成管理,使生產系統的接口數據和最終用戶查看的交流信息,達到一致,實現設計人員、企業內部、企業間、企業與用戶等相互之間信息的統一。實現異地、異構數據共享,避免大量重複性工作。實現多類型數據、多類型文獻、多媒體信息、電子信息資源與網上信息資源共享。在網絡環境下,使企業真正運作在一個Intranet-Internet-Extranet無縫連接的網絡集成環境中,構造一個企業內、外信息共享和融合的環境。

2.4全面、準確、規範的數據基礎是進行深度的數據挖掘的前提條件

目前在很多領域,數據挖掘都是一個很時髦的詞,尤其是在如銀行、電信、證券、保險、交通、零售(如超級市場)等商業領域。數據挖掘其實是一種深層次的數據分析方法。過去數據收集和分析的目的是用於科學研究,現在,更主要是爲商業決策提供真正有價值的信息,進而獲得利潤。所有企業面臨的一個共同問題是:企業數據量非常大,而其中真正有價值的信息卻很少,因此從大量的數據中經過深層分析,獲得有利於商業運作、提高競爭力的信息,就像從礦石中淘金一樣。

因此,數據挖掘是指:按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,並進一步將其模型化的先進有效的方法。數據挖掘應從以下三方面加以考慮,一是用數據挖掘解決什麼樣的商業問題,二是爲進行數據挖掘所做的數據準備,三是數據挖掘的各種分析算法。做數據挖掘研究的人,往往把主要的精力用於改進現有算法和研究新算法上。人們都知道數據準備是必不可少的一步,但很少有人去真正花時間和精力去研究。

其實數據挖掘最後成功與失敗,是否有經濟效益,數據準備起到了至關重要的作用。數據準備包含很多方面:一是從多種數據源去綜合數據挖掘所需要的數據,保證數據的綜合性、易用性、數據的質量和數據的時效性,這有可能要用到數據倉庫的思想和技術;另一方面就是如何從現有數據中衍生出所需要的指標,這主要取決於數據挖掘者的分析經驗和工具的方便性。數據挖掘需要數據的全面和準確,數據分析算法要求數據具有一定的格式和規範性。無疑,全面、準確、規範的數據基礎是進行深度的數據挖掘的前提條件。

3巨靈公司在數據基礎建設方面的實踐

爲了夯實數據基礎建設,20XX年巨靈公司花大力氣對高新技術產品——金融證券期貨類報刊檢索系統主題詞表和主題標引規則,進行了全面修訂。經過半年的艱苦工作,現已修訂出了《金融證券期貨信息主題標引規則》和《金融證券期貨專業主題詞表》。同時與之相配合,編制了若干詞表:信息類型詞表、關鍵詞表、人物詞表、機構詞表、上市公司詞表(包括上市公司關聯公司詞表、公司更名情況表、易混淆公司表)和地區詞表;相應,編制了若干標引細則:信息類型標引細則、人物標引細則、機構標引細則、審校工作細則和詞表維護細則等。從而,形成了一整套主題詞表和主題標引規則產品。在實踐中,我們遵循瞭如下的一些原則:

3.1以系統工程作爲指導思想信息系統建設是一項複雜的系統工程。

信息系統由5個系統組成,即:硬件系統、軟件系統、數據庫、規程和人員。數據庫是信息系統的核心,計算機硬件系統和軟件系統是信息系統的運行環境,人員和規程是信息系統的開發與使用的環境。對於這樣一項複雜的系統工程,人們的認識是有一個過程的,我國企業信息系統建設的實踐恰切地說明了這一認識過程。人們最早注意的僅僅是看得見、摸得着的計算機硬件;而後才瞭解到需要軟件,進一步知道需要構成一個整體的計算機應用系統;再後體會到更需要既懂計算機又懂本專業的複合型人才;當信息系統投入使用之後,發現了過去沒有或不大重視的數據和規程出了問題,成爲系統真正實用的攔路虎,而且數據和規程問題既廣泛存在又繁瑣,同過去手工系統的'工作攪和在一起,處理起來比購買計算機系統更難、更要花時間。巨靈人在實踐中認識到了作爲一項複雜的系統工程的信息系統建設,必須重視數據的重要性,認爲數據就是系統的生命。

爲此,有三條系統建設的具體指導思想是公司領導一直強調的:(1)數據庫是系統的核心,要求數據庫的設計能支持公司產品的可持續發展;(2)主題詞表和主題標引是報刊網絡系統的生命線,要求研究所配合報刊部,一定要搞好主題詞表的更新和標引規則的制定;(3)信息系統一般都從單項應用系統開始,逐步向綜合應用系統過渡,這是一個從量變到質變的過程,我們不能用項目級或程序級的經驗去指導系統級的建設。組成信息系統的5個系統既涉及技術系統又踏足社會系統。計算機硬件系統和軟件系統作爲運行環境,強調了信息系統是一種技術系統的特徵;人員和規程作爲開發與使用環境,則強調了信息系統是一種社會系統的特徵。長期以來的偏向是,人們往往只注意到信息系統的技術系統特徵,而沒有注意到信息系統的社會系統特徵。爲此,公司強調:(1)系統設計必須有專家和相應業務人員的參加和評議;(2)吸收最終用戶的意見;(3)在實際使用中不斷信息反饋和改進系統。

3.2數據的總體設計

在進行數據的總體設計時,數據被作爲一種獨立的資源來對待,並被看作是支持所有應用項目的基石,以系統的整體最優爲目標。在金融證券期貨主題詞表經過一年多的試用和主題標引經過一年多的實踐後,我們收集了各方面的反映,並試圖採用總體設計的原則,進行全方位的修訂和制定,以達到系統的整體最優目標。修訂的做法和過程是:(1)對原系統進行總體上的調研和評估:經過對原系統的全面而實際的瞭解,特別是徵求從事實際工作的員工們的意見,認爲報刊檢索系統的總體設計是合理的,系統實施的進度較快,目前已初步實現了規模性生產。但是,在某些環節上存在有問題,這些環節主要是:各種詞表(主題詞表、關鍵詞表、機構詞表和人物詞表等)、標引規則、標引方法、人員培訓等方面。

這些問題反映在實際工作中表現爲:主題詞表選詞不當、不規範、不完善;標引工作缺乏共同遵循的規則;信息加工耗費人力和時間過多,必須儘快發展系統的自動化;系統實施的正規化和規範化程度較低,急需改進和提高。(2)狠抓影響全局的關鍵環節:金融證券報刊數據庫建設首先必須夯實數據基礎,鑑於當前各種詞表、標引規則和標引方法問題,已經成爲了影響系統全局的關鍵環節,我們重點抓了主題詞表和標引規則的修訂和制定。(3)從整體上設計和修訂主題詞表:以金融證券專業主題詞表的修訂爲主,作爲專業詞表整體,同時設計和修訂關鍵詞表、機構詞表、人物詞表和系統專用的信息類型詞表。這多種詞表應構成爲一體化的、有機結合的一整套金融證券專業性的主題詞表。(4)從整體上考慮和制定標引規則:以金融證券專業主題詞的標引爲主,作爲標引工作整體,同時考慮和制定關鍵詞、機構、人物和系統專用的信息類型的標引規則。這多種標引規則應構成爲一體化的、有機結合的一整套金融證券專業性的主題標引規則。(5)建立詞表和標引規則的不斷更新機制:制定了《詞表維護細則》,規定了詞表和標引規則的維護措施,以確保未來詞表和標引規則的不斷更新。這樣,不僅在空間而且在時間的延續上保證了詞表和標引規則的新穎性。

3.3數據規範化及其處理的規則化

(1)詞表和標引規則的修訂遵循和參照國家標準:按照國家標準規定的文獻主題結構模式,從主體、通用、空間、時間和信息類型等五項因素,全面反映金融證券報刊文獻的內容主題;同時,又結合金融證券專業的特點,加強機構,特別是上市公司的揭示和信息披露,使修訂工作既符合總的標引原則又結合報刊檢索系統實際,使報刊系統能夠同全國的信息系統並軌,又有自己的特點。

(2)形成全公司的信息工作標準:作爲一個專業性很強的信息公司,詞表和標引規則是可以通用的,因此修訂的詞表和標引規則將逐步成爲全公司的信息加工工作標準。

(3)修訂的詞表可供全行業參考:在金融證券行業目前沒有可供使用的專業主題詞表情況下,巨靈公司編制出的主題詞表可供金融證券整個行業參考和使用。

3.4詞表和標引規則的系統化和可操作性

(1)詞表和標引規則的系統化:修訂的詞表和制定的標引規則不是個別的、孤立的,而是主題詞表和其它相應的多種詞表相互結合,標引總則、分則和多個細則的有機配合,形成了系統化,構成了實用的詞表和標引規則體系。

(2)確立了詞表維護體系:作爲標引總則的補充和細化,編制了《詞表維護細則》。在《細則》中說明,詞表維護是指“對本系統現有的各種詞表,爲保證其新穎性、正確性和權威性,進行增加、修改、刪除以及調整主題詞之間關係的不斷進行的過程”;具體規定了對新增、修改和刪除主題詞的處理方法、審定權限和詞表更新辦法,即“分別按各自的詞表編制規則,處理、編排和匯入到相應的詞表中去,完成了一次各種詞表的修訂工作”,永葆主題詞表的新穎性。

(3)強化詞表和標引規則的可操作性:爲了在全公司推行標準化,必須使主題詞表和標引規則具有可操作性。爲此,在修訂和制定中,對需要進一步說明的各項操作細節,均要求以附件(細則)的形式一一列出。配合標引總則,我們編制了以下幾方面細則:信息類型標引細則、人物標引細則、機構標引細則、審校工作細則和詞表維護細則。

3.5手工與自動化規範保持一致性和可過度性

在標引規則中,規定了手工與自動化兩種標引規範必須保持一致性和可過渡性,統一手工和自動化兩種標引方式的主題標引規則,爲報刊系統逐步過渡到自動化標引,提供了統一的規則和過渡的條件

標籤:經融 論文 證券