範文齋

Oracle數據庫字符處理技巧

在Oracle數據庫中爲了幫助數據庫管理員能夠以最快的方式處理這些字符類型的數據,提供了許多有用的函數或者工具。筆者今天就談談在Oracle數據庫中處理字符串的經驗與心得。

Oracle數據庫字符處理技巧

在數據庫開發與維護中,數據庫管理員接觸最多的數據類型就是字符類型了,包括字符串、日期類型的字符串等等。

一、去掉尾部的空格字符

有時候在查詢或者進行其他處理的時候,需要把字符串尾部的空格字符去掉。如有時候應用軟件設計的不合理,會把空格字符保存在數據庫中。如在輸入產品品號的時候,用戶不小心,把“DT001輸成了“DT001 。如果應用程序在設計的時候,能夠自動把尾部的空格去掉然後在保存到數據庫中能夠就萬無一失了。但是不少的應用軟件在開發的時候沒有如此設計。這就給後續的處理帶來了很多的麻煩。因爲利用Where語句來查找記錄的時候,“DT001(最後不帶空格)與“DT001 (最後帶一個空格)兩個是不同的條件。

如果想利用這個條件來進行數據更新、查詢等等,就會遇到問題。爲此在寫相關的Update或者Select語句的時候,可能需要把後面的空格符號去掉。爲此在Oracle數據庫中,有很多種解決方式。如數據庫管理員可以使用Ltrim函數來實現。這個函數的格式爲Ltrim[c1,c2]。其作用是去掉C1左邊所包含的C2種的任何字符。當遇到不是C2種的字符串時結束,然後返回剩餘的字符串。如果把C2字符串設置爲空格符號(默認情況下就是空格),那麼就可以把DT001後面的空格符號去掉了。

二、在頭部自動進行填充

有時候可能數據庫設計的時候,考慮的不夠周到,導致某些字段不夠大。在對數據庫進行升級的時候,需要調整相關的字段。此時就可能需要對某個字段的頭部進行填充,以達到數據一致性的要求。如現在有個ERP系統,其需要用到一張產品信息的表,其中有一個產品編號字段。剛開始在設計產品編碼的時候,設計的長度不夠,如只設置了5位。隨着企業產品記錄的增多,需要對這個編碼的內容進行擴展。如產品信息屬於包裝材料類的,需要在原來產品編號的頭部加入一個字符B;如產品信息屬於客供品的,則需要在原來產品編號的頭部加入一個字符C;如產品信息屬於輔助材料的,則在原來的產品編號前面加入一個字符F;等等。

此時該如何實現這個需求呢?難道要一個個去修改嗎?現在這手工修改的工作量比較大,而且容易出錯,這個方法不可取。其實在Oracle數據庫系統中提供了一個單行字符函數,可以幫助數據庫管理員與企業來解決這個問題。這個函數就是RPAD函數。這個命令的格式爲RPAD(C1,N,C2)。這個函數的意識是在C1的右邊填充字符C2,直到字符串的總長度滿足N。默認情況下C2的值爲空格,用戶可以根據自己的需要設置這個值。如果C1的長度比N要大,則會截取C1右邊的N個字符。現在如果要實現上面這個需求,則只需要設置函數RPAD(產品編號,6,F)即可。由於原來的產品編號爲5位,現在需要爲輔助信息的產品編號前面加入一個字符F,修改後的.總長度變爲6位。不過在使用這個函數的話,往往需要利用Where條件語句進行限制。

現在這個函數還可以裏用實現字符串的截取。如還是這個產品編號,其前面一位表示產品的種類。此時數據庫管理員就可以利用RPAD(產品編號,1)來截取產品編號的第一位字符(這裏產品編號的長度比1要大,則會截取產品右邊的1個字符,即產品類別標示碼)。這在報表設計的時候也非常有用,有利於簡化報表的顯示。

三、字符大小寫的控制

在做報表的時候,我們可能需要對字符串的現實格式進行控制,如大小寫的顯示格式。另外,在進行數據庫移植的時候,可能以前的收入大小寫不規範。數據庫管理員需要採用一定的規則來規範移植後的數據庫字符串書寫規範。爲了簡化這些需求的實現方式,在Oracle數據庫中也提供了一些工具來解決這些問題。

如以前在輸入產品編號的時,可能大小寫不區分。而在前臺應用程序中也沒有進行這方面的控制。現在用戶希望所有的產品編號都爲大寫,需要把原先是小寫的產品編號全部轉換成大寫。此時如果產品數量比較多的話,顯然利用手工修改的方式會增加工作量。如果編寫一個程序來實現的話,又太複雜,其實我們可以借鑑Oracle數據庫提供的字符串處理函數來實現。在單行字符函數集中,有一個函數UPPER,它的作用就是將全部字符串都改寫爲大寫並返回。爲此我們可以利用一個子查詢或者藉助視圖的幫助,把所有產品編號中,如果含有小寫字符的產品編號都更新爲大寫。如果原來就是大寫的,就保持原樣(而不是說原來大寫的變小寫,原來小寫的變大寫)。同理,既然小寫可以變大寫,那麼大寫也就可以變爲小寫。利用單行字符串函數LOWER,就可以把全部字符串改爲小寫輸出(把大寫字母改爲小寫,而小寫字符保持不變)。

另外一個大小寫的控制原則比較複雜,如對於一些英文地址或者英文名字之類的字符串,需要首個字母大寫,而其他字符小寫。這個實現起來就有一定的難度。還好在Oracle數據庫中提供了一個現成的解決方法,即利用Initchar函數來實現。這個函數的功能是將某個字段中每個單詞的首字符轉換爲大小,其他字符都是小寫的字符串。通常情況下,這個字段之間的單詞可以利用空格、控制字符或則標點符號來表示。可見通過這個三個大小寫字符串控制函數,可以優化字符串的顯示格式,讓其顯示更加的規範。而結合Update語句的話,還可以成批的在數據庫中進行更新,讓其保存的數據也符合規範化的要求。

四、字符串中的複雜替換

幾年之後,杭州進行來一些行政區劃的規格,如把下沙市改爲了直屬杭州管轄的下沙區。爲此有一家企業的數據庫管理人員就問筆者,能否把一些記錄中的下沙市都改爲下沙區。什麼意思呢?也就是說,在數據庫中可有含有如下記錄“下沙市某某鋼鐵廠、“杭州市某某服裝廠、“濱江區某某信息有限公司等等。現在數據庫管理員希望把含下沙市的內容都改爲下沙區。這涉及到一些複雜字段的替換,實現起來具有一定的難度。數據庫是結構化數據的結合體,不比Word文檔,可以利用查找替換功能來解決這個需求。那麼在Oracle數據庫中該如何實現呢?在Oracle數據庫中就模擬實現了Word文檔中的查找替換功能。

如在單行字符函數中有一個叫做Replace的函數,就可以幫助數據庫管理員實現這個需求。這個函數的格式爲Replace(C1,C2,C3)。他的含義就彪死後把C1中出現的C2都替換成C3,然後返回字符串。這是什麼意思呢?其實就是跟Word文檔中的查找替換功能類似。從字符串C1種查找C2的內容,如果找到的話利用C3來代替。如果C3 的內容爲空,則所有在字段中出現C2內容的字符都將被刪除。那要實現上面的需求,就可以把這個函數的參數設置爲Replace(Adress,下沙市,下沙區)。然後再利用Upadate語句把這個函數返回的值賦值給地址字段即可。如此,在數據庫地址字段中,出現下沙市的地方將全部被更新爲下沙區。但是這個更改不會影響到其他的記錄。如不會把杭州市也改爲杭州區等等。

爲此,要實現一些複雜的字符替換作業,可以利用函數Replace來完成。有時會,把Replace函數與其他函數相結合,還可以實現一些更加複雜的內容。如在產品基本信息中,產品編號中可能包含了產品的分類信息,如PSD001這個產品編號,第一個字符P表示成批,第二三個字符SD表示手動工具。如果自動工具的話就爲PZD001。在生成報表的時候,如果利用這些字符來顯示結果的話,顯然報表的可讀性並不是很好。此時數據庫管理員可以先利用字符串截取函數或者利用上面所提到過的頭部填充函數等等來截取相關的字符串,然後再利用現在這個查找替換函數,則可以把ZD等字符轉換成“自動工具等代表含義的字符串,這將提高報表的可讀性。可見,將Replace替換函數與其他函數結合(C1、C2、C3參數都可以利用函數來實現)從而可以實現複雜的替換功能。