Zakłócenie
Zakłócenie to wszystkie zmienne w sieci przyczynowej, które powodują, że (zobacz: do operator). Operator do zmazuje wszystkie strzałki dochodzące do , przez co blokuje przepływ informacji o w kierunku nieprzyczynowym.
Jak usunąć zakłócenia?
Kryterium ścieżki od zaplecza
Aby usunąć zakłócenia zmiennych i wystarczy zablokować każdą łączącą je ścieżkę nieprzyczynową bez blokowania lub zaburzania ścieżek przyczynowych. Ścieżka od zaplecza to każda ścieżka łącząca i , której pierwsza strzałka skierowana jest do .
Czasami nie możemy usunąć ścieżki od zaplecza, bo nie jesteśmy w stanie kontrolować ze względu na czynnik zakłócający. Jest tak np. wtedy, kiedy nie obserwujemy czynnika zakłócającego (np. zakłóceniem jest “gen palenia” - nie jesteśmy w stanie zmierzyć czy ktoś taki gen ma czy nie)
Kryterium wejścia frontowego
Jeśli na ścieżce przyczynowej między przyczyną a skutkiem jest jakiś pośrednik (lub pośrednicy), którego obserwujemy i nie ma bezpośredniej ścieżki między przyczyną a skutkiem oraz na pośrednika nie oddziałują inne czynniki to może zastosować kryterium wejścia frontowego. Przykładowy taka sieć przyczynowa:
flowchart LR gen_palenia --> palenie gen_palenia --> rak_płuc palenie --> substancje_smoliste substancje_smoliste --> rak_płuc
Możemy wtedy policzyć na ile palenie powoduje wzrost szansy na obecność substancji smolistych i policzyć na ile obecność tych substancji powoduje raka płuc.
Uwaga: można spróbować wykorzystać tę metodę jeśli istnieje ścieżka przyczynowa do pośrednika, ale tylko jeśli to oddziaływanie jest słabe.
Rachunek operatora do
Mamy 3 reguły:
- jeśli zbiór zmiennych blokuje wszystkie ścieżki prowadzące od do po usunięciu wszystkich strzałek prowadzących do , to:
- jeśli spełnia kryterium wejścia od zaplecza, tzn. jeśli zastosujemy kontrolowanie ze względu na wystarczający zbiór zmiennych umożliwiających usunięcia zakłócenia, to pozostała korelacja stanowi już prawdziwe oddziaływanie przyczynowe, czyli:
- jeśli nie istnieje ścieżka prowadząca od do , to:
Powyższe reguły pozwalają przekształcić wyrażenie zawierające do operator w wyrażenie bez tego operatora. Jeśli jesteśmy w stanie to zrobić tzn. że nie musimy robić kontrolowanych badań randomizacyjnych, a wystarczą jedynie badania obserwacyjne! Rachunek ten jest zupełny, tzn. jeśli nie da się przekształcić wyrażenia w postać bez operatora
do, tzn. że nie da się określić przyczynowości z danych obserwacyjnych.
Istnieje również tzw. algorytm Shpitsera, który pozwala rozstrzygnąć w czasie wielomianowym czy wyrażenie zawierające do operator można przekształcić w wyrażenie bez tego operatora.
Metoda zmiennych instrumentalnych
Zmienna instrumentalna w sieci przyczynowej to zmienna Z w diagramie:
flowchart LR Z --> X X --> Y U --> X U --> Y
Spełnia ona 3 wymagania:
- nie istnieje strzałka między a
- istnieje strzałka między a
- nie ma bezpośredniej strzałki między a
Zmienna instrumentalna przypomina rzut monetą, bo nie dochodzą do niej żadne strzałki. Tzn. związek między a nie ma czynników zakłócających, więc wszelka obserwowana korelacja między nimi musi być przyczynowa! Co więcej, ponieważ oddziałuje na przez , to korelacja między a też musi być przyczynowa.
Źródło: The book of why