Zakłócenie

Zakłócenie to wszystkie zmienne w sieci przyczynowej, które powodują, że (zobacz: do operator). Operator do zmazuje wszystkie strzałki dochodzące do , przez co blokuje przepływ informacji o w kierunku nieprzyczynowym.

Jak usunąć zakłócenia?

Kryterium ścieżki od zaplecza

Aby usunąć zakłócenia zmiennych i wystarczy zablokować każdą łączącą je ścieżkę nieprzyczynową bez blokowania lub zaburzania ścieżek przyczynowych. Ścieżka od zaplecza to każda ścieżka łącząca i , której pierwsza strzałka skierowana jest do .

Czasami nie możemy usunąć ścieżki od zaplecza, bo nie jesteśmy w stanie kontrolować ze względu na czynnik zakłócający. Jest tak np. wtedy, kiedy nie obserwujemy czynnika zakłócającego (np. zakłóceniem jest “gen palenia” - nie jesteśmy w stanie zmierzyć czy ktoś taki gen ma czy nie)

Kryterium wejścia frontowego

Jeśli na ścieżce przyczynowej między przyczyną a skutkiem jest jakiś pośrednik (lub pośrednicy), którego obserwujemy i nie ma bezpośredniej ścieżki między przyczyną a skutkiem oraz na pośrednika nie oddziałują inne czynniki to może zastosować kryterium wejścia frontowego. Przykładowy taka sieć przyczynowa:

flowchart LR
gen_palenia --> palenie
gen_palenia --> rak_płuc
palenie --> substancje_smoliste
substancje_smoliste --> rak_płuc

Możemy wtedy policzyć na ile palenie powoduje wzrost szansy na obecność substancji smolistych i policzyć na ile obecność tych substancji powoduje raka płuc.

Uwaga: można spróbować wykorzystać tę metodę jeśli istnieje ścieżka przyczynowa do pośrednika, ale tylko jeśli to oddziaływanie jest słabe.

Rachunek operatora do

Mamy 3 reguły:

  1. jeśli zbiór zmiennych blokuje wszystkie ścieżki prowadzące od do po usunięciu wszystkich strzałek prowadzących do , to:
  2. jeśli spełnia kryterium wejścia od zaplecza, tzn. jeśli zastosujemy kontrolowanie ze względu na wystarczający zbiór zmiennych umożliwiających usunięcia zakłócenia, to pozostała korelacja stanowi już prawdziwe oddziaływanie przyczynowe, czyli:
  3. jeśli nie istnieje ścieżka prowadząca od do , to: Powyższe reguły pozwalają przekształcić wyrażenie zawierające do operator w wyrażenie bez tego operatora. Jeśli jesteśmy w stanie to zrobić tzn. że nie musimy robić kontrolowanych badań randomizacyjnych, a wystarczą jedynie badania obserwacyjne! Rachunek ten jest zupełny, tzn. jeśli nie da się przekształcić wyrażenia w postać bez operatora do, tzn. że nie da się określić przyczynowości z danych obserwacyjnych.

Istnieje również tzw. algorytm Shpitsera, który pozwala rozstrzygnąć w czasie wielomianowym czy wyrażenie zawierające do operator można przekształcić w wyrażenie bez tego operatora.

Metoda zmiennych instrumentalnych

Zmienna instrumentalna w sieci przyczynowej to zmienna Z w diagramie:

flowchart LR
Z --> X
X --> Y
U --> X
U --> Y

Spełnia ona 3 wymagania:

  1. nie istnieje strzałka między a
  2. istnieje strzałka między a
  3. nie ma bezpośredniej strzałki między a

Zmienna instrumentalna przypomina rzut monetą, bo nie dochodzą do niej żadne strzałki. Tzn. związek między a nie ma czynników zakłócających, więc wszelka obserwowana korelacja między nimi musi być przyczynowa! Co więcej, ponieważ oddziałuje na przez , to korelacja między a też musi być przyczynowa.

Źródło: The book of why