您所在的位置: 首頁  >  學術研究  >  學術報道  >  正文

香港中文大學哲學系張寄冀教授關于“可解釋人工智能與反事實生成模型”的線上講座順利舉行

點擊次數:  更新時間:2023-06-19

本網訊(通訊員唐瑞雪)6月16日晚,應beat365体育官网陳波教授邀請,香港中文大學哲學系張寄冀教授做了主題為“可解釋人工智能與反事實生成模型”的線上講座。本次講座由陳波主持,中國科學院哲學研究所吳東穎博士評議。來自國内外的400餘名聽衆參與本次線上講座。

本次講座針對可解釋人工智能研究中的反事實解釋進路,圍繞着“如何利用反事實解釋有效地指導人們的行為”這個問題,在對比無回溯(Non-backtracking)、部分回溯(Partial backtracking)、全部回溯(Full backtracking)這三種方案的優缺點的基礎上,給出了一種按需回溯的方案。

講座中,張寄冀介紹在可解釋人工智能中,一種解釋機器學習模型輸出的分類或預測結果的方式是給出反事實解釋,即輸出一個與給定實例足夠相似的反事實個例,其在該模型中得到的分類或預測會與實例得到的不同。實際個例與反事實個例的對比會揭示模型輸出對某些特征的依賴關系,以此作為對模型輸出的解釋或說明。

這樣的對比式解釋通常用虛拟或反事實條件句來表達,比如“如果你的身體質量指數(以下簡稱BMI)降為30(實際BMI是40),那麼模型會預測你患糖尿病的風險值為0.5(實際風險值是0.8)”。但問題是如何解讀這樣的條件句,不同的解讀對應不同的選擇反事實個例的标準。最開始提出反事實解釋的論文采取如下解讀:如果BMI為30,并且在其他特征不變的情況下,那麼模型會預測你患糖尿病的風險值為0.5。但是這種解讀沒有考慮到BMI與其他特征之間的因果聯系。如果BMI對其他特征有影響,那麼改變BMI通常不會讓其他特征都保持不變。因此,如果用戶想參照反事實解釋來制定行動方案以達到改變模型預測的目的,上述的解讀很可能誤導用戶。

更好的解讀,也是哲學文獻裡經常采用的解讀,是考慮因果關系(或過去與将來的區别):如果BMI降為30,并且受BMI影響的特征也随之發生相應變化,那麼模型會預測你患糖尿病的風險值為0.5。雖然此種因果解讀能更可靠地指引行動,但是它仍然面臨着諸多問題。首先,這種解釋要依賴因果關系,如何獲得可靠的因果性知識依然是知識論裡的大問題。其次,即便考慮因果關系的反事實解釋在理論上有明确的行動指引,要在實踐中遵循這樣的指引有相當的難度。最後,即使我們可以獲得因果知識,但通過這種解讀得到的反事實個例,經常是在訓練數據集中沒有得到足夠支持的個例(out-of-sample instances)。因為當下的機器學習模型還不具備強大的泛化能力,在這種個例上的分類或者預測往往既不準确也不穩定,因此其作為行為的指引還是不可靠。

本次講座聚焦最後一個問題,在假設可獲得因果結構知識的基礎上,探究我們能否找到一種對反事實條件句的解讀,來避免或者減輕這個問題。張寄冀用哲學文獻裡一個著名的例子¾ 對比“如果我現在跳下10樓,那麼我會嚴重受傷”與“如果我現在跳下10樓(因為我知道下面有安全網),那麼我不會受傷”這兩個反事實條件¾ 引入回溯的反事實推理(backtrackingcounterfactual)。不同于第一個語句,第二個語句體現的推理是在考慮反事實假設時,回溯到導緻此假設實現的因素。這樣的回溯可以用來避免産生樣本外事例。張寄冀介紹了避免樣本外事例的兩種回溯推理方式。第一種為部分回溯(Partial backtracking),第二種為全部回溯(Full backtracking)。部分回溯是指隻回溯到因果圖的某些中間節點,而不用回到初始值。而全部回溯是指回溯到初始值,并不破壞原有的因果聯系。張寄冀指出,雖然全部回溯更容易避免樣本外事例,但因為需要回到無法控制的初始值,指導行動的意義就消失了。另一方面,無回溯(Non-backtracking)指導行動的意義相對明确,但因為樣本外事例的出現,在現有的機器學習模型中應用并不可靠。因此,部分回溯有希望達到兩者兼顧的平衡。

張寄冀與合作者提出了一種平衡方案——通用回溯(General backtracking),即根據解決樣本外事例的具體需要進行回溯。如果要解決樣本外事例,隻需要回溯一步,那麼就回溯一步;如果需要回溯到初始值,那麼就回溯到初始值,此時通用回溯就相當于全部回溯。如果沒有産生樣本外事例,不需要進行回溯,那麼此時通用回溯就相當于無回溯。在通用回溯中,回溯到哪個環節是由人們解決樣本外事例的需要決定的。比起無回溯,它可以處理樣本外事例,增強預測可信性;比起全部回溯,它在處理小概率事件的同時,能保持對人們行為的一些指導作用。

在評議環節,吳東穎博士就“通用回溯的選擇标準問題”和“如何确定回溯到哪個環節”進行提問。他指出,在因果圖中,面對小概率事件,可以采取多種幹預方式。如何确定要使用哪一種幹預方式,通用回溯方案面臨着選擇标準問題。相比之下,全部回溯則不會面臨這樣的問題。張寄冀回應稱,所提出通用回溯方案隻是一個方案,确實面臨着哪種選擇标準最優或者最合理的問題。但總體上通用回溯仍堅持按需回溯,從直覺上講,回溯得越少越好。比起全部回溯,通用回溯的優點在于可以指導人們的行為,這畢竟是人工智能發展的一個重要目的。

beat365体育官网謝凱博副研究員就“如何從可能世界的角度理解全部回溯”進行提問。他質疑按照全部回溯的方式,要回到初始值來解決樣本外事例,這樣的思路似乎不應該稱為反事實推理。張寄冀回應稱,雖然在哲學界,如何理解反事實推理仍存在争議。但是從人工智能這樣的技術性角度看來,全部回溯是指面對樣本外事件,要回溯到一個(局部)因果模型的初始值,與哲學裡讨論的宇宙的初始狀态和(全局)自然律還是有所不同。但就算是用(全局的)可能世界來給出反事實條件句的語義,也有哲學家反對劉易斯式的訴諸“奇迹”的非回溯語義,而推崇保持所有自然律的回溯語義。

講座最後,陳波教授寄語張寄冀、吳東穎、謝凱博等中青年學者,希望他們充分利用曾在海外學習的經曆,融入國際學術共同體,專心科研,争取在國際學術共同體中占有一席之地。

(編輯:鄧莉萍   審稿:嚴璨)

Baidu
sogou