Inaczej - probabilistic inference. O co chodzi? Chodzi o to, że szukamy nie posteriora, tylko aproksymacji posteriora, z której łatwo się sampluje. Czyli szukamy jakiegoś “prostszego” posteriora, który jest zbliżony do tego “prawdziwego” posteriora.
Jedna z metod Variational Inference to Laplace Approximation.
Jak w praktyce podchodzi się do Variational Inference?
Często wybieramy jakiś szczególny podzbiór różnych rozkładów prawdopodobieństwa, które możemy sparametryzować (np. rodzina rozkładów normalnych), a następnie szukamy takiego zbioru parametrów (czyli takie konkretnego rozkładu prawdopodobieństwa z naszej wybranej rodziny), który minimalizuje odległość (najczęściej Kullback Leibler divergence) do naszego “prawdziwego” posteriora. W ten sposób sprowadzamy nasz problem do problemu optymalizacyjnego.
Jak efektywnie minimalizować Kullback Leibler divergence?
Można wykazać (patrz Probabilistic Artificial Intelligence, rozdział 5.5), że minimalizacja KL-divergence to to samo co maksymalizacja ELBO.
Jak efektywnie maksymalizować ELBO?
Możemy próbować maksymalizować ELBO poprzez SGD, a do tego musimy policzyć gradient ELBO. Tam jednak pojawia się trudność, bo mamy do czynienia z takim elementem i tutaj nie możemy wprost wsadzić ten gradient pod wartość oczekiwaną (bo wartość oczekiwana jest po parametrze , zobacz Probabilistic Artificial Intelligence, rozdział 5.5.1). Tutaj jednak z pomocą przychodzi Reparametrization trick.
Samplowanie z posteriora
Tak naprawdę najczęściej szukamy posteriora po to, żeby mieć możliwość inferencji na nowych danych, czyli policzenia Powyższe można interpretować jako wartość oczekiwaną Likelihood jest prosty do policzenia, trudny do policzenia jest posterior. Ale tutaj wystarczyłoby, żebyśmy potrafili samplować z posteriora i wtedy moglibyśmy ten sampling wykorzystać do inferencji wykorzystując Monte Carlo, czyli dla dużej liczby próbek policzyć średnią .
Jak więc samplować? Pomysłem na to jest skonstruowanie łańcucha Markova, który jest efektywny w samplowaniu i jego rozkładem stacjonarnym jest posterior! Ta metoda to MCMC.