ShinyLab

Explainable AI

[논문리뷰] Deconvolution

2025.04.21

오늘은 deconvolution에 대해 다뤄보려고 한다. 편하게 그냥 deconv라고 하겠다. 이름에서부터 알 수 있듯이 CNN 속의 과정을 탐구하는 방법론이며, 이미지를 받아서 줄이고 줄이고 줄여가는 CNN과 반대로 우리가 관심이 있는 어떤 단계의 줄여진 친구를 다시 늘리고 늘리고 늘려가면서 최종적으로 히트맵을 출력, 특정 단계에서의 CNN이 어떤 부분에 집중하고 있는지를 알 수 있는 방법론이다. 논문 원문은 다음과 같다.https://arxiv.org/abs/1311.2901 Visualizing and Understanding Convolutional NetworksLarge Convolutional Network models have recently demonstrated impressive c..

Explainable AI

[논문리뷰] MPS-LIME

2025.04.18

LIME을 같이 다뤘었는데, (블로그 이전 글 참조) LIME의 slight modification인 MPS-LIME이 재미있어 보여서 가지고 왔다. 원문링크:https://arxiv.org/abs/2002.07434 A Modified Perturbed Sampling Method for Local Interpretable Model-agnostic ExplanationExplainability is a gateway between Artificial Intelligence and society as the current popular deep learning models are generally weak in explaining the reasoning process and prediction res..

Explainable AI

[논문리뷰] TCAV (Testing with Concept Activation Vectors)

2025.04.11

여태까지는 Local explanation에 해당하는 XAI 기법들만 다뤄보았다. Activation Maximization, Saliency Map Visualization, Layer-wise Relevance BackPropagation, LIME(Local Interpretable model-Agnostic Explanations), SHAP(SHapley Additive exPlanations) 모두 Local explanation 기법이다. 지금부터는 Global explanation에 해당하는 XAI 기법들을 다뤄볼 건데, 그 시작은 바로 TCAV(Testing with Concept Activation Vectors)이다. 참고로, Local explanation 기법들은 하나의 데이터..

Explainable AI

[논문리뷰] SHAP (SHapley Additive exPlanations)

2025.04.08

오늘은 XAI framework 중 하나인 SHAP에 대해 다뤄볼 것이다. SHAP는 LIME 이후에 나온 이론적 framework로, 여태까지 이 블로그에서 다루었던 LIME, LRP 뿐만 아니라, DeepLIFT, 그리고 다른 Shapeley-valued method들을 모두 통합하는 하나의 framework이다. 그래서 논문 이름도 "A Unified Approach to Interpreting Model Predictions"이다. 위의 방법론들을 통합하는 하나의 framework이기 때문이다. 대략적으로 어떤 느낌의 방법론이냐면, LIME에서도 그랬듯이 복잡한 문제를 local의 범위에서 linear function으로 간략화하여 다루는 방법론의 큰 틀을 제시했다고 보면 될 것 같다. 원본 ..

Explainable AI

[논문리뷰] LIME (Local Interpretable Model-agnostic Explanations)

2025.04.01

오늘은 XAI 분야에서 유명한 논문 중 하나인, LIME에 대해서 다뤄보고자 한다. LIME은 Local Interpretable Model-Agnostic Explanations의 줄임말이다. 제목을 보면 이 모델의 특징을 잘 알 수 있는데, 1. Local한 부분을 이용한다.2. Model-Agnostic 하다. 라는 큰 특징 2가지가 보인다. 원문은 다음과 같다(Ribeiro et al., 2016).https://arxiv.org/abs/1602.04938 "Why Should I Trust You?": Explaining the Predictions of Any ClassifierDespite widespread adoption, machine learning models remain mos..

[논문리뷰] Deconvolution

[논문리뷰] MPS-LIME

[논문리뷰] TCAV (Testing with Concept Activation Vectors)

[논문리뷰] SHAP (SHapley Additive exPlanations)

[논문리뷰] LIME (Local Interpretable Model-agnostic Explanations)

티스토리툴바