我對可解釋性的三個思考:可解釋資訊,合規與風險權衡,詐欺機率分數

更新 發佈閱讀 7 分鐘
vocus|新世代的創作平台

本文章分享閱讀關於可解釋性的文章後,產生的三個思考理解。

利用真實數據訓練,可解釋性與準確度的權衡,是很常聽到的現象。

研究的主題,則是去問說:「這個權衡,如果改成合成數據訓練的話,是否還是有這種現象?」

下面收入三個思考

  • 思考#1:可解釋性的需求,以利人類翻譯資訊
  • 思考#2:可解釋的模型和法規,不可解釋的模型風險低
  • 思考#3:可解釋性,給詐欺機率分數,然後可以快速進去看問題在哪裡

思考#1:可解釋性的需求,以利人類翻譯資訊

詐欺偵測,照講會抓出些可疑的東西,進行調查。

調查的過程,需要內容的「可解釋性」。這個意思是,對於調查的運營,要有可解釋的資訊,來論證可疑性以及後續處理。

Fraud experts need for this task to have access to the right and interpretable information for each investigated operation in order to justify the suspicion and the resulting action.

實務上是怎麼做的呢?需要問問想想。

人類需要「模型可解釋性」來理解這些事情,不然很難下判斷。

human tasks create the need for model interpretability in order to treat each alert or understand globally the evolution of fraudsters’ behavior.

這個完全沒錯,但實務上要怎麼弄,就會有很多細節。

思考#2:可解釋的模型和法規,不可解釋的模型風險低

本真可解釋的模型,能夠符合政策的限制,但對詐欺偵測而言,不夠準確,產生較高的金融風險。因此事後可解釋的方法是一個風險較低的做法。

Intrinsically interpretable models, such as ..... , are characterized by their transparency and by a self-explainable structure. They are generally applied for use cases with legal or policy constraints (Zhuang et al., 2020), but they may well be not accurate enough for tasks such as fraud detection, which have high financial stakes. This explains why more accurate black box models look appealing as soon as a post hoc interpretability method is applied to provide explanations on either how they work or on their results.

的確,風險太大要想辦法降低風險。但也是要看每個應用的風險是什麼。

但Post hoc 的可解釋性,有個很大的缺點,就是無法在模型之間公平比較。

Among these methods, some, called post-hoc specific, are specific to a type of model. ..... . The main disadvantage of the latter is that their use is restricted to a single type of model and it is therefore complicated to compare performances and explanations of several different models.

不曉得事後可解釋性,具體是怎麼操作的。可能要回答這個問題後,再去想看看合成數據是不是真的有辦法免疫這個問題。

也就是說,如果可解釋模型的表現,可以靠合成數據來變得很好,那就真的不一定要用很好的模型,風險也很低了。

也有道理。如果做線性模型,可能改數據還比改模型的效果大很多。這個就是Data-centric想法的引人之處。

思考#3:可解釋性,給詐欺機率分數,然後可以快速進去看問題在哪裡

可解釋的覆蓋:根據一些可疑的行為特徵,給出詐欺機率分數,然後分數太高的要調查。

First, an anti-fraud software, carried by the publisher Bleckwen, is developed for instant cash transfer fraud, characterized by high operation frequencies and limited human involvement. This software is based on the improvement of a black box scoring model (XGBoost), resulting in a fraud probability score, completed with a local interpretative overlay: all operations over a given optimal threshold are suspended and must be investigated.

我們目前好像沒有這種「詐欺機率分數」的概念,可以繼續去發展看看細節。


之後閱讀的清單

  1. Weerts H, Ipenburg W and Pechenizkiy M (2019) Case-Based Reasoning for Assisting Domain Experts in Processing Fraud Alerts of Black-Box Machine Learning Models. Available at https://arxiv.org/pdf/1907.03334.pdf


留言
avatar-img
紫式講義的沙龍
4會員
23內容數
思考合成數據的各種原理,應用與效果。
紫式講義的沙龍的其他內容
2022/08/05
思考#1:防彈筆記的四個元素:目標成果,要解決的問題,下一步行動,下一步連結 站長在呈現此書,使用的元數據(Metadata)為 目標成果 要解決什麼問題 下一步行動 下一步連結 這個格式蠻好的,可以連結書的內容。 思考#2:鳥瞰書籍內容 Part 分析 防彈筆記的改變 防彈筆記的原則 內容分析
Thumbnail
2022/08/05
思考#1:防彈筆記的四個元素:目標成果,要解決的問題,下一步行動,下一步連結 站長在呈現此書,使用的元數據(Metadata)為 目標成果 要解決什麼問題 下一步行動 下一步連結 這個格式蠻好的,可以連結書的內容。 思考#2:鳥瞰書籍內容 Part 分析 防彈筆記的改變 防彈筆記的原則 內容分析
Thumbnail
2022/08/05
這篇文章記錄與強盜算法有關的職位。 職位#1:Amazon 資深運籌學科學家 職位#2: Tripadbisor 機器學習科學家 II Machine Learning Scientist II 職位#3:BOA 資料科學家 Data Scientist Desired skills:
Thumbnail
2022/08/05
這篇文章記錄與強盜算法有關的職位。 職位#1:Amazon 資深運籌學科學家 職位#2: Tripadbisor 機器學習科學家 II Machine Learning Scientist II 職位#3:BOA 資料科學家 Data Scientist Desired skills:
Thumbnail
2022/08/04
本文章與你分享我接觸這篇認知方法論課程後,產生的思考理解。 對「認知」這個字,搭配上生老病死,我覺得有下面的意涵: 生:零認知 老:覺得認知迭代 病:覺得認知缺乏 死:不再需要認知
Thumbnail
2022/08/04
本文章與你分享我接觸這篇認知方法論課程後,產生的思考理解。 對「認知」這個字,搭配上生老病死,我覺得有下面的意涵: 生:零認知 老:覺得認知迭代 病:覺得認知缺乏 死:不再需要認知
Thumbnail
看更多
你可能也想看
Thumbnail
這篇文章與你分享,我閱讀合成數據文章以後,產生的三個思考與理解。
Thumbnail
這篇文章與你分享,我閱讀合成數據文章以後,產生的三個思考與理解。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
模型上線前的評估的嚴謹與否,攸關上線後模型的表現。你知道模型評估需要注意哪些細節?在評估過程的嚴謹性又可以如何分級呢?一起來看看吧!
Thumbnail
模型上線前的評估的嚴謹與否,攸關上線後模型的表現。你知道模型評估需要注意哪些細節?在評估過程的嚴謹性又可以如何分級呢?一起來看看吧!
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
在作模擬的時候,這個準不準這個問題絕對有資格被排在常見問題中的前三名。 當然也是我們首先要問自己的部分。如果人家要拿這份結果去做設計評估,那他的準確性到哪? 如果不能拿來做設計參考,那我們該怎麼解讀? 而準不準的問題,要分成事前諸葛和事後諸葛兩種應用來討論。 事後諸葛的類型 事前諸葛的類型
Thumbnail
在作模擬的時候,這個準不準這個問題絕對有資格被排在常見問題中的前三名。 當然也是我們首先要問自己的部分。如果人家要拿這份結果去做設計評估,那他的準確性到哪? 如果不能拿來做設計參考,那我們該怎麼解讀? 而準不準的問題,要分成事前諸葛和事後諸葛兩種應用來討論。 事後諸葛的類型 事前諸葛的類型
Thumbnail
本文延續之前康斯坦丁·霍普夫博士等人的研究,該研究談及了〈AI的組織導入:工藝與機械工作〉(Organizational Implementation of AI: Craft and Mechanical Work)中提出的五項組織挑戰。本文專注於這些挑戰中的第四項,即「無法說Why的問題」。
Thumbnail
本文延續之前康斯坦丁·霍普夫博士等人的研究,該研究談及了〈AI的組織導入:工藝與機械工作〉(Organizational Implementation of AI: Craft and Mechanical Work)中提出的五項組織挑戰。本文專注於這些挑戰中的第四項,即「無法說Why的問題」。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
班傑明.迪斯雷利:「世界上有三種謊言:謊言、該死的謊言,和統計數字。」 由於我們未知的東西可能至關重大,踏錯一步很可能導致理解不當或預測錯誤,對我們的健康、財產和福祉造成嚴重的後果。我們有理由對資料科學感到興奮,但必須抱持謹慎。唯一的解決之道就是瞭解風險,時時警覺。
Thumbnail
班傑明.迪斯雷利:「世界上有三種謊言:謊言、該死的謊言,和統計數字。」 由於我們未知的東西可能至關重大,踏錯一步很可能導致理解不當或預測錯誤,對我們的健康、財產和福祉造成嚴重的後果。我們有理由對資料科學感到興奮,但必須抱持謹慎。唯一的解決之道就是瞭解風險,時時警覺。
Thumbnail
本文章想分享給你,我在閱讀有效合成數據的文章後,產生的理解與思考。 首先,本文章有三個有趣的實驗問題: 資料前處理(Data-Preprocession)對合成數據效度的影響。 是否需要對合成的機器學習模型調參(Tuning)。 效度測量是否能預測合成數據訓練的機器學習模型的準確度。
Thumbnail
本文章想分享給你,我在閱讀有效合成數據的文章後,產生的理解與思考。 首先,本文章有三個有趣的實驗問題: 資料前處理(Data-Preprocession)對合成數據效度的影響。 是否需要對合成的機器學習模型調參(Tuning)。 效度測量是否能預測合成數據訓練的機器學習模型的準確度。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文章分享閱讀關於可解釋性的文章後,產生的三個思考理解。 利用真實數據訓練,可解釋性與準確度的權衡,是很常聽到的現象。 研究的主題,則是去問說:「這個權衡,如果改成合成數據訓練的話,是否還是有這種現象?」
Thumbnail
本文章分享閱讀關於可解釋性的文章後,產生的三個思考理解。 利用真實數據訓練,可解釋性與準確度的權衡,是很常聽到的現象。 研究的主題,則是去問說:「這個權衡,如果改成合成數據訓練的話,是否還是有這種現象?」
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News