類神經模糊網路

林進燈

國立交通大學控制工程研究所

[本文 copy 自 http://ecaaser3.ecaa.ntu.edu.tw/weifang/LifeScience/FuzzyNeuro.html,特此致謝!]


一、前言

類神經網路(Neural Network)與模糊理論(Fuzzy Theory- 目前均被成功地應用在各個不同的領域上,同時也是目前研究上的一個熱門課題。由於目前已有相當多描述這兩者的文章或書籍〔l-4〕,因此在這裡我們所要探討的,並不著重於類神經網路或模糊理論個別的基礎介紹或探討。我們所要介紹、探討的角度,將著重在兩者間的關係與比較。舉例來說:類神經網路與模糊集合常常被相提並論,基本上兩者均有增加系統智慧,模擬一個輸入,輸出對應關係等的能力。這意謂著,兩者間有一種巧妙的關係存在。到底這種關係為何,兩者間有何相似、差異性,便是一個值得思索的題目。此外,在工程應用或問題解決上,如何在兩耆間做一合適的選擇,也是常見的問題。更甚者,如何擷取兩者間的優點,互補缺失,並發展一種新的模式,也 是一研究發展方向。而上述各個問 題,正是本文所要詳加介紹,探討 的。在這篇文章中,將以建立讀者 觀念為主,所以一些數學式子都將儘量避免出現。


二、類神經網路與模糊系統之共通點及差異性

一般而言,類神經網路與模糊 系統均具有在不須要知道一個系統的數學模式下,便能成功的估測此一系統的能力。由於兩者均採用數值的方法來解決問題,這使得我們可以用數學工具來處理,同時方便以演算法完成。由於方便以演算完成,使得硬體實現更加容易。而這些特性正是類神經網路和模糊理論與利用符號(Symbolic)方法來解決問題的人工智慧 Artificial intelligence)的不同處。

類神經網路及模糊理論的共同特性,大致可分為:

  1. 兩者均是用來模擬人類的大腦。在這方面,類神經扮演的角色便是仿造大腦中細胞的行為。即大腦中的生理結構等較低階的部份。相對的,模糊邏輯(Fuzzy logic)則是用來模擬人類的心智,推理等屬於心理成份的部份。如果我們把類神經網路比喻成大腦的硬體成份,則模糊邏輯就好像軟體部份,藉由兩者間的相輔相成,便能描述人類的種種思考行為。
  2. 知識的分散式表示(Distributed representation),就類神經網路而言,所貯存的知識被分散在節點 Node) 與鏈結值 Link)。而模糊系統的一個元件,則是由不同模糊集合(Fuzzy set) 上的不同的歸屬程度(Membership grade)所表達。
  3. 兩者均是可以訓練的動態系統,並且在不須要知道一個連續函數的輸入,輸出間的數學關係下,便能估測此一函數。這種特、性使它們適合應用在控制領域上。
  4. 均具有歸納 Generalization)能力及容錯能力,由於知識的分散式表示以及均屬於平行架構,使得兩者均有好的容錯能力。即當本身架構受到損害時,均能展現相當強韌性(Robustness)。
  5. 具有處理現實生活中因為資料的不確定或不精確等所造成的問題。儘管類神經網路與模糊系統有許多的相似性,在細微的部份,兩者還是有些差別。兩者的差異在於:如何由取樣點估測一個函數,如何表示及儲存這些取樣點,對於結構上的知識的表示與編碼方式,以及由輸入對應到輸出等等。

基本上,類神經網路在估測一個函式時,所採用的取樣點是數值點(Numerical-point) 這與模糊系統採用模糊集合當取樣點有所不同。在學習上,類神經網路須要一組的訓練資料,經由反覆的學習後,將這些訓練資料編碼於一個有如黑盒子的網路結構中。因此在學習之後,除非測試所有的輸入與輸出的關係,否則我們無法得知網路的學習結果。對於一般常用的若......,(IF-THEN)法則,我們無法直接將它編碼於網路中。我們可用的方法,便是提供一大筆的輸入、輸出相對應的訓練資料給系統。此外,由於使用者無法得知網路內層所代表的意思,因此很難決定一個網路的結構與大小。總言之,類神經網路是一種結構可隨意選取並且是完全分散式的模型。雖然這種分散性的結構可加強學習,但也使得我們無法以容易理解且精確的邏輯結構,如若......IF...THEN...)法則來解釋之。

相對於類神經網路,模糊系統屬於構化的數值估測 Structured numericl estimators)。模糊系統可直接將關於結構的知識以數值的組織方法編碼在系統中。所以我們只須要設計一些法則,便能完成一個模糊系統。這種設計工作,遠比設計並訓練一個類神經網路來得簡單的多。

類神經網路與模糊邏輯彼此是互補的技術 [5]。類神經網路可由所要學習或控制的系統中萃取資訊。而模糊技術通常直接的使用由專家所提供的口頭資訊。一種用來獲取兩者的優點並同時解決個別缺點的可行方法,便是將兩者結合成一套整合系統。如前所述,這兩者之間有許多的相似性,而這種相似性正 提供兩者間結合的可行性的一個不 錯的依據。

結合的系統將具有類神經的優點(如:學習能力、最佳化能力、連結式的結構),與模糊邏輯系統的優點(如:接近人類的思考行為,容易結合專家知識)。依此,我們可把類神經這種低階的學習與計算功能應用在模糊邏輯系統上,並且把模糊 邏輯系統這種高階的,接近人類思考,推理的功能應用在類神經網路上。如此一來,在類神經網路這方面,整個網路結構將透明化,這使得它更像模糊系統。相對的,模糊系統自我調整的功能,將使它更接近類神經網路。


三、類神經模糊網路的基本概念

一個模糊系統表現的好壞往往決定於輸入、輸出的歸屬函數(Membership function),模糊邏輯法則(Fuzzy logic rules),及推理機制(Inference mechanism)。僅管目前已有許多文章,是專門在探討模糊系統的理論與應用 2]-[4〕,然而一套統一且有系統的發展方法,仍然還未被提出。傳統上,一套模糊系統的完成,是根據一大串的經驗觀察後,根據觀察結果而以適合的知識來表示。然而實際上發展一套模糊系統時,往往會遇到二個嚴重的間題:如何決定策略的初始模糊法則,及如何調整初始法則及其歸屬函數。傳統的方法往住須要某一領域的專家,依此產生初始法則及它們的歸屬函數。最後再根據錯誤嘗試(Trial and error),來細部調整這些法則與締屬函式,以使最後系統的表現達到最佳化。很明顯的,要檢測一個複雜的系統所有的輸入、輸出關係,並依此來找出並調整相對應的法則與函式,對一個專家而言,將是一件極困難的事情。

以類神經網路來分析並自動設計一般的模糊邏輯法則,對以上所提到的設計問題,提供了一個嶄新且可行的解決方法 6-[7〕。一個模糊系統,當具備有自動調整參數,如歸屬函式的能力後,將很容易產生並且有適應性的能力。可見,由一個類神經網路所提供的技術,其目的在減少設計一個模糊系統時,人為設計的佔予成份,及加入自動調整的觀念,而後者將可使最後的系統有更多的自動化功能。

以類神經網路來適應性的產生模糊系統的模糊邏輯法則的基本想法大致如下。數學上來說,一個模糊系統是將輸入乘積之高立方(Hypercube)上的模糊集合,映射到輸出之高立方上的模糊集合。模糊系統連結了輸入、輸出模糊集合,所以它的動作就如同連結記憶體(Associative memory)一般。相似的輸入將產生相似的輸出。換句話說,若把這個觀念加入類神經模糊系統中則synaptic向量把輸入、輸出空間量化成輸入、輸出群集(Cluster)。由輸入輸出群集的對應關係,可追蹤出專家如何把輸入對應到適當的輸出反應。每一對相互對應的輸入、輸出群集,就如同一條模糊邏輯法則,其中輸入群集表示一個法則的前置情形(Precondition),而輸出群集則表示結果。這其中主要的幾何概念為:互相連結的輸入、輸出群集就等於法則。這裡的連結可能是適應性分群演算法的結果。所以就幾何的觀點,一個隨著時間而變 Time-varying)的群集間的對應,就如同適應性模糊系統。類神經網路的學習法則便是用來學習這些對應。由上所陳述的基本概念可知,適應性模糊系統是用類神經(或統計)的技術,由所穫取的資料中萃取出模糊法則,並利用新穫取的資料逐漸的調整這些法則。

總體而言,適應性模糊系統所做的調整可分為二類 8〕:結構的調整(Structure tuning),以及參數調整(Parameter tuning)。第一類所關心的是法則的結構,變數所代表的意義,對每個變數區的分割,法則的數目及其連結構成形式等。第二類所關心的是歸屬函式的形狀與位置。這裡所謂的歸屬函式均為參數化的歸屬函式,而相關的參數,如三角形歸屬函式的中心與寬度均可調整。類神經網路的強大調整能力正可用來做模糊系統的結構與參數調整。在類神經網路的三種學習方法中,非監督式(Unsupervised)學習由於在不須要外在的訊息下,能夠抓住輸入向量的規則性而建構模式,因此適合用來做資料的分群,並找出對應的法則。當然,類神經網路本身的結構學習技巧,也可貢獻在模糊系統的結構調整。監督式學習與加強式學習,則通常用來針對模糊系統的要求輸出值(Desired output),而調整其法則或歸屬函式。基因(Genetic)法則也可用來做結構調整,所用的方法是搜尋空間中所有可能的模糊決定表。一旦得到滿意的結構後,再做歸屬函式的微調工作,這部分可由監督式學習或加強式學習完成。類神經網路可以三種組態來參與模糊邏輯系統的自動調整 9〕:

  1. 利用類神經的學習能力來自動決定並調整模糊法則及歸屬函式。有人以類神經網路驅動的模糊推理中,類神經網路的學習本事即被用在模糊推理上。在這種情況下,模糊系統實際上並不被類神經網路的結構所影響。
  2. 利用梯度 Gradient) 法則來調整歸屬函式。這裡遞減法則所扮演的角色,與在類神經網路或其它需要尋找最佳參數的參數化系統一般。一個很明顯的例子,便是Nomura 所提出的演算法:利用階梯法則來做如Sugeno 的模糊系統之參數的最佳化。
  3. 模糊系統以如類神經網路般的結構存在,即本身為一個多層網路,而每一個結點各有其功能,便得整個網路作用就如同模糊系統一般。此為目前最常使用的方法。在後向傳遞(Backpropagation)演算法所使用 的梯度遞減 Gradient descent)法則,往往也在此方法中用來訓練整個網路。在此方法中,如同傳統的邏輯一般,亦可用遞迥(Recurrent) 神經網路,來實現模糊還輯的複雜推理機制。


四、應用

目前在許多不同的領域上,兩者皆成功的被用來增加所控制的系統的機器智慧(Machine intelligence)。如類神經網路被用在語音辨識、影像處理、高速modem 機場爆炸物偵測等。而模糊系統則用在地下鐵駕駛、 電視電腦的磁頭調整、空調系統的調整、機械手臂、工業製造程序、電梯、交通號誌的控制等。而類神經網路與模糊邏輯理論結合(類神經模糊網路)之應用也是非常廣泛。在洗衣機的應用方面,類神經網路即當作模糊控制器之補償器,在洗衣機中,除了原有之模糊控制器外,有一類神經網路被加進來,根據電導特性來量測水的透明或不透明(即乾淨或不乾淨),此電導性即當作類神經網路的輸入。在冰箱的應用方面,可以利用類神經網路來學習去預測一天當中何時冰箱的門開的頻率最高,此估測值被用到模糊控制器中,使冰箱能自動預先冷卻,這種方法可使冰箱中的食物溫度變化量在 2.2C 內。


五、未來研究方向

在一些現存模糊控制系統或類神經模糊網路, 其輸入及輸出之空間均分割成棋盤格狀,雖然在硬體實現上非常容易, 但當輸入及輸出之變數增加時, 這棋盤格狀之分割數目便隨之遽增, 導至所需之記憶體或硬體數目不切實際地增加,由於比方法在學習過程中, 欲得較好的空間分割須更多的訓練資料,否則將發生不充分的學習。 在複雜系統中, 為了避免分割數目遽增,須找出一更具彈性且不規則的分割方式是一研究方向。而具學習能力之類神經網路來實現模糊控制器, 這幾年來已使成一非常有趣的研究領域,但很多具學習能力之類神經模糊網路在應用時, 常常須事先藉由專家的知識,方能提升它的效能,所以僅由訓練資料中,自動地產生模糊法則及調整歸屬函數亦是 -研究方向。近幾年來,由於基因演算法具全域最佳化能力,使得基因演算法成為另一有用的工具,目前有利用基因演算法來調整模糊控制器之歸屬函數及類神經網路之加權值,將基因演算法與類神經模糊網路結合之應用,以加速其學習速度,亦值得探討。


六、結論

本文對類神經、模糊理論間的關聯性、差異性及結合方法與趨勢均做了一番詳細的介紹。其間該注意的重點,不在於鑽研孰劣孰優,而在於如何將兩者的優點加以結合。文中並詳細的介紹了應用及末來研究方向,以供讀者參考。