Zakłócenia w sieci przyczynowej

Zakłócenie

Zakłócenie to wszystkie zmienne w sieci przyczynowej, które powodują, że $P [Y ∣ d o (X)] \neq = P [Y ∣ X]$ (zobacz: do operator). Operator do zmazuje wszystkie strzałki dochodzące do $X$ , przez co blokuje przepływ informacji o $X$ w kierunku nieprzyczynowym.

Jak usunąć zakłócenia?

Kryterium ścieżki od zaplecza

Aby usunąć zakłócenia zmiennych $X$ i $Y$ wystarczy zablokować każdą łączącą je ścieżkę nieprzyczynową bez blokowania lub zaburzania ścieżek przyczynowych. Ścieżka od zaplecza to każda ścieżka łącząca $X$ i $Y$ , której pierwsza strzałka skierowana jest do $X$ .

Czasami nie możemy usunąć ścieżki od zaplecza, bo nie jesteśmy w stanie kontrolować ze względu na czynnik zakłócający. Jest tak np. wtedy, kiedy nie obserwujemy czynnika zakłócającego (np. zakłóceniem jest “gen palenia” - nie jesteśmy w stanie zmierzyć czy ktoś taki gen ma czy nie)

Kryterium wejścia frontowego

Jeśli na ścieżce przyczynowej między przyczyną a skutkiem jest jakiś pośrednik (lub pośrednicy), którego obserwujemy i nie ma bezpośredniej ścieżki między przyczyną a skutkiem oraz na pośrednika nie oddziałują inne czynniki to może zastosować kryterium wejścia frontowego. Przykładowy taka sieć przyczynowa:

flowchart LR
gen_palenia --> palenie
gen_palenia --> rak_płuc
palenie --> substancje_smoliste
substancje_smoliste --> rak_płuc

Możemy wtedy policzyć na ile palenie powoduje wzrost szansy na obecność substancji smolistych i policzyć na ile obecność tych substancji powoduje raka płuc.

Uwaga: można spróbować wykorzystać tę metodę jeśli istnieje ścieżka przyczynowa do pośrednika, ale tylko jeśli to oddziaływanie jest słabe.

Rachunek operatora do

Mamy 3 reguły:

jeśli zbiór zmiennych $Z$ blokuje wszystkie ścieżki prowadzące od $W$ do $Y$ po usunięciu wszystkich strzałek prowadzących do $X$ , to: $P [Y ∣ d o (X), Z, W] = P [Y ∣ d o (X), Z]$
jeśli $Z$ spełnia kryterium wejścia od zaplecza, tzn. jeśli zastosujemy kontrolowanie ze względu na wystarczający zbiór zmiennych umożliwiających usunięcia zakłócenia, to pozostała korelacja stanowi już prawdziwe oddziaływanie przyczynowe, czyli: $P [Y ∣ d o (X), Z] = P [Y ∣ X, Z]$
jeśli nie istnieje ścieżka prowadząca od $X$ do $Y$ , to: $P [Y ∣ d o (X)] = P [Y]$ Powyższe reguły pozwalają przekształcić wyrażenie zawierające do operator w wyrażenie bez tego operatora. Jeśli jesteśmy w stanie to zrobić tzn. że nie musimy robić kontrolowanych badań randomizacyjnych, a wystarczą jedynie badania obserwacyjne! Rachunek ten jest zupełny, tzn. jeśli nie da się przekształcić wyrażenia w postać bez operatora do, tzn. że nie da się określić przyczynowości z danych obserwacyjnych.

Istnieje również tzw. algorytm Shpitsera, który pozwala rozstrzygnąć w czasie wielomianowym czy wyrażenie zawierające do operator można przekształcić w wyrażenie bez tego operatora.

Metoda zmiennych instrumentalnych

Zmienna instrumentalna w sieci przyczynowej to zmienna Z w diagramie:

flowchart LR
Z --> X
X --> Y
U --> X
U --> Y

Spełnia ona 3 wymagania:

nie istnieje strzałka między $U$ a $Z$
istnieje strzałka między $Z$ a $X$
nie ma bezpośredniej strzałki między $Z$ a $Y$

Zmienna instrumentalna przypomina rzut monetą, bo nie dochodzą do niej żadne strzałki. Tzn. związek między $Z$ a $Y$ nie ma czynników zakłócających, więc wszelka obserwowana korelacja między nimi musi być przyczynowa! Co więcej, ponieważ $Z$ oddziałuje na $Y$ przez $X$ , to korelacja między $X$ a $Y$ też musi być przyczynowa.

Źródło: The book of why

Quartz 4

Explorer