Autorzy w A Practical Method for Solving Contextual Bandit Problems Using Decision Trees proponują następującą metodę symulacji Thompson Sampling: Budujemy las drzew decyzyjnych (Random forest) tak, żeby każde drzewo decyzyjne było uczone na innej, wylosowanej próbce z naszego zbioru danych (Bootstrapping). Podczas predykcji, wybieramy losowo jedno drzewo, i odpowiedź z tego drzewa traktujemy jako odpowiedź całego modelu. W ten sposób dostajemy losową odpowiedź na wzór odpowiedzi jaką dostajemy z Thompson samplingu.