
使用這些基本 REST API 最佳實踐構建出色的 API
數據準備:這個階段包括數據的收集和處理。數據應該是高質量的、平衡的并且代表正在解決的現實問題。擁有平衡的、有代表性的、干凈的數據可以減少未來為保持 AI 的可解釋性而付出的努力。
模型訓練:模型在準備好的數據上進行訓練,傳統的機器學習模型或深度學習神經網絡都可以。模型的選擇取決于要解決的問題和所需的可解釋性水平。模型越簡單就越容易解釋結果,但是簡單模型的性能并不會很高。
模型評估:選擇適當的評估方法和性能指標對于保持模型的可解釋性是必要的。在此階段評估模型的可解釋性也很重要,這樣確保它能夠為其預測提供有意義的解釋。
解釋生成:這可以使用各種技術來完成,例如特征重要性度量、可視化技術,或通過構建固有的可解釋模型。
解釋驗證:驗證模型生成的解釋的準確性和完整性。這有助于確保解釋是可信的。
部署和監控:XAI 的工作不會在模型創建和驗證時結束。它需要在部署后進行持續的可解釋性工作。在真實環境中進行監控,定期評估系統的性能和可解釋性非常重要。
SHAP是一種博弈論方法,可用于解釋任何機器學習模型的輸出。它使用博弈論中的經典Shapley值及其相關擴展將最佳信用分配與本地解釋聯系起來。
LIME 是一種與模型無關的方法,它通過圍繞特定預測在局部近似模型的行為來工作。LIME 試圖解釋機器學習模型在做什么。LIME 支持解釋文本分類器、表格類數據或圖像的分類器的個別預測。
ELI5是一個Python包,它可以幫助調試機器學習分類器并解釋它們的預測。它提供了以下機器學習框架和包的支持:
基本用法:
Show_weights() 顯示模型的所有權重,Show_prediction() 可用于檢查模型的個體預測
ELI5還實現了一些檢查黑盒模型的算法:
TextExplainer使用LIME算法解釋任何文本分類器的預測。排列重要性法可用于計算黑盒估計器的特征重要性。
Shapash提供了幾種類型的可視化,可以更容易地理解模型。通過摘要來理解模型提出的決策。該項目由MAIF數據科學家開發。Shapash主要通過一組出色的可視化來解釋模型。
Shapash通過web應用程序機制工作,與Jupyter/ipython可以完美的結合。
from shapash import SmartExplainer
xpl = SmartExplainer(
model=regressor,
preprocessing=encoder, # Optional: compile step can use inverse_transform method
features_dict=house_dict # Optional parameter, dict specifies label for features name
)
xpl.compile(x=Xtest,
y_pred=y_pred,
y_target=ytest, # Optional: allows to display True Values vs Predicted Values
)
xpl.plot.contribution_plot("OverallQual")
Anchors使用稱為錨點的高精度規則解釋復雜模型的行為,代表局部的“充分”預測條件。該算法可以有效地計算任何具有高概率保證的黑盒模型的解釋。
Anchors可以被看作為LIME v2,其中LIME的一些限制(例如不能為數據的不可見實例擬合模型)已經得到糾正。Anchors使用局部區域,而不是每個單獨的觀察點。它在計算上比SHAP輕量,因此可以用于高維或大數據集。但是有些限制是標簽只能是整數。
BreakDown是一種可以用來解釋線性模型預測的工具。它的工作原理是將模型的輸出分解為每個輸入特征的貢獻。這個包中有兩個主要方法。Explainer()和Explanation()
model = tree.DecisionTreeRegressor()
model = model.fit(train_data,y=train_labels)
#necessary imports
from pyBreakDown.explainer import Explainer
from pyBreakDown.explanation import Explanation
#make explainer object
exp = Explainer(clf=model, data=train_data, colnames=feature_names)
#What do you want to be explained from the data (select an observation)
explanation = exp.explain(observation=data[302,:],direction="up")
Interpret-Text 結合了社區為 NLP 模型開發的可解釋性技術和用于查看結果的可視化面板。可以在多個最先進的解釋器上運行實驗,并對它們進行比較分析。這個工具包可以在每個標簽上全局或在每個文檔本地解釋機器學習模型。
以下是此包中可用的解釋器列表:
它的好處是支持CUDA,RNN和BERT等模型。并且可以為文檔中特性的重要性生成一個面板
from interpret_text.widget import ExplanationDashboard
from interpret_text.explanation.explanation import _create_local_explanation
# create local explanation
local_explanantion = _create_local_explanation(
classification=True,
text_explanation=True,
local_importance_values=feature_importance_values,
method=name_of_model,
model_task="classification",
features=parsed_sentence_list,
classes=list_of_classes,
)
# Dash it
ExplanationDashboard(local_explanantion)
AI Explainbability 360工具包是一個開源庫,這個包是由IBM開發的,在他們的平臺上廣泛使用。AI Explainability 360包含一套全面的算法,涵蓋了不同維度的解釋以及代理解釋性指標。
工具包結合了以下論文中的算法和指標:
OmniXAI (Omni explable AI的縮寫),解決了在實踐中解釋機器學習模型產生的判斷的幾個問題。
它是一個用于可解釋AI (XAI)的Python機器學習庫,提供全方位的可解釋AI和可解釋機器學習功能,并能夠解決實踐中解釋機器學習模型所做決策的許多痛點。OmniXAI旨在成為一站式綜合庫,為數據科學家、ML研究人員和從業者提供可解釋的AI。
from omnixai.visualization.dashboard import Dashboard
# Launch a dashboard for visualization
dashboard = Dashboard(
instances=test_instances, # The instances to explain
local_explanations=local_explanations, # Set the local explanations
global_explanations=global_explanations, # Set the global explanations
prediction_explanations=prediction_explanations, # Set the prediction metrics
class_names=class_names, # Set class names
explainer=explainer # The created TabularExplainer for what if analysis
)
dashboard.show()
XAI 庫由 The Institute for Ethical AI & ML 維護,它是根據 Responsible Machine Learning 的 8 條原則開發的。它仍處于 alpha 階段因此請不要將其用于生產工作流程。
文章轉自微信公眾號@算法進階