範文齋

位置:首頁 > 行業範文 > 設計

基於網絡數據抓取的醫院本科畢業管理系統的設計

設計2.67W

摘要 隨着醫療技術的不斷髮展和更新,新的技術和成果不斷涌現,醫護工作者發表和參閱醫學論文已然成爲展示科研成果和獲取最新技術的重要途徑。對於醫院,論文可以從一個側面反映出醫院的綜合實力,同時也是評價醫院科研能力和學術水平的重要指標。作爲醫院科教管理部門,科教科在職工考覈、職稱晉升等工作中都需要考察論文的發表情況,並且還需要時刻掌握全院發表論文的數據,並以此作出統計和分析,把結果作爲證明醫院科研能力和發展現狀的依據。

基於網絡數據抓取的醫院本科畢業管理系統的設計

關鍵詞 網絡數據 系統

1 醫院學術論文管理情況現狀

隨着計算機的廣泛應用,絕大多數醫院管理論文的方法已經從手工登記轉變爲使用計算機軟件管理,其中最爲普及的是使用Excel軟件製作電子表格登記論文資料。這種方法可以較好地幫助工作人員解決查找和數據統計的問題。但是,數據的收集需要做大量的前期工作,由論文作者上報至科教科,再由科教科工作人員進行手工錄入製成Excel表格,需要生成報表和統計數據的時候也必須手動操作。

大量繁瑣枯燥的手工錄入工作制成的Excel的本地文件,卻並不能較好的實現數據共享。因此,隨着網絡的普及,部分醫院建立了基於Web的論文管理系統。依靠B/S架構的Web論文管理系統,可以很好的解決數據共享的問題。相比於使用Excel文件記錄論文數據,網絡論文管理系統的優點在於只要有可用的網絡,無論何時何地都可以通過手機或個人計算機進入系統,進行論文上報、登記、查詢操作,使論文管理工作不僅限於辦公室。並且依靠計算機技術也可以一定程度的簡化手工工作,以鼠標點選、自動生成等方式優化錄入、統計分析的過程。

2 基於網絡數據抓取的醫院論文管理系統

基於網絡數據抓取的醫院論文管理系統保留了普通網絡論文管理系統的優點,着力優化和完善最爲繁瑣的數據錄入過程,從國內權威的論文數據庫中直接抓取需要的數據存入自己的數據庫。

據瞭解,國內絕大部分正規期刊上發表的文獻在見刊1-2個月後就會被知網、萬方、維普等專業的文獻數據庫收錄。普通用戶通過檢索,可以獲取到論文的題目、發表刊物、見刊時間、作者姓名、單位、關鍵詞、摘要等數據,足以滿足醫院論文管理系統的需求。只要實現並使用抓取功能獲得需要的數據,就能大大簡化手工錄入的工作,同時能有效的`避免論文漏報、錯報。

2.1 系統的體系結構

目前基於網絡的系統體系結構主要是C/S(客戶端/服務器)架構與B/S(瀏覽器/服務器)架構。C/S架構將大部分的運算放在客戶端處理,要求進入系統的計算機安裝相應的客戶端程序,對計算機操作系統等條件有特定的要求,限制了用戶羣,具有較高的安全性,但是靈活性不強,不便於後期維護和系統升級。B/S架構基於HTTP和TCP/IP協議,運用服務器完成大量的運算,將運算結果傳輸給瀏覽器顯示,用戶只需要使用瀏覽器就可以在個人計算機或智能手機上進行操作,不受局域網、軟件和運行平臺的限制,可以實現跨平臺的使用,並且後期維護成本低,更新方便。

爲了系統後期的維護及功能完善,本系統採用B/S架構,也更能適應目前信息系統的發展趨勢。

2.2 系統的功能模塊

如圖1所示,本系統分爲五個功能模塊,分別爲:部門管理模塊、職工管理模塊、論文抓取模塊、論文錄入模塊、查詢統計模塊。

2.2.1 部門管理模塊

部門管理模塊的主要功能是通過添加、修改、刪除操作設置醫院部門信息,構建一個完整的部門樹形結構,以便在查詢統計時可以實現按照部門查詢統計,有助於分析和比較各科室部門論文發表的情況。

2.2.2 職工管理模塊

職工管理模塊同樣通過數據庫的操作建立職工的花名冊,並且將每個職工按照實際情況分配到科室和部門,如此便建立了論文、作者、部門的關係。

2.2.3 論文數據抓取模塊

論文數據抓取模塊使用網絡數據抓取的方法,通過請求URL、對返回數據進行分析、提取論文相關數據,將其存入論文信息表,並與醫院職工進行關聯。

2.2.4 論文數據錄入模塊

本模塊的主要功能是手工維護論文數據,以對論文數據的添加、修改、刪除操作,提供是一個查缺補漏渠道,對數據抓取過程中出現的不完善數據進行人工修改。

2.2.5 統計查詢模塊

模塊提供作者姓名查詢、關鍵詞查詢、期刊查詢、發表時間查詢、科室查詢等豐富的查詢方法。統計各科室發表論文數量、各種期刊上發表論文的數量、關鍵詞相關論文數量、任意時間段發表論文數量等以供比較分析。

2.3 網絡數據抓取模塊設計

數據抓取功能是本系統的特色和亮點,其設計原理類似於簡化的網絡爬蟲,抓取數據更具針對性,抓取範圍僅限於較權威的論文期刊數據庫。以下介紹設計思路。

2.3.1 抓取模塊涉及的數據庫設計

爲了能在網絡上抓取數據,需要一個表存放URL信息,其中包括的主要字段有URL、URL的MD5編碼、訪問狀態、請求的頁面類型等。

另外需要一個存放論文信息的表存放抓取到的數據,包含題目、刊名、發表時間、作者、關鍵詞、摘要等字段。

2.3.2 抓取數據的主要步驟

首先程序從URL表中取出一條訪問狀態爲未訪問的數據,請求此URL並接收返回數據,根據URL請求的頁面類型做提取論數據或者提取URL數據的操作。

對於返回的是論文頁面,需要提取論文詳細信息,然後到論文信息表中查找,判斷是否爲已經抓取過的論文數據,若已抓取,則標記請求的URL爲已訪問,然後進行下一個URL的請求。否則將論文數據整理併入庫,將作者與職工關聯,之後請求下一個URL。

若非論文詳情頁面,則需分離提取頁面中的URL,將提取到的URL逐個進行MD5編碼後到URL表中查重,將非重數據標記爲未訪問然後入庫。

3 實現本系統的意義

基於網絡數據抓取的醫院論文管理系統可以有效地減少論文管理過程中的繁瑣工作,簡化管理流程,爲管理人員減負。同時,得益於系統採用B/S架構,可以實現跨平臺、跨區域的管理。抓取來自論文數據庫的數據相對全面,以此數據做出的分析統計能夠更加有效的指導醫院科研的發展方向和重心。設計並實現本系統,有效地提高了科教管理工作效率。