마르코프 프로세스1 [강화학습2]마르코프 프로세스(Markov Process) 마르코프 프로세스 아래 그림은 잠에 드는 마르코프 프로세스를 도식화한 것이다. 위 그림은 잠에 드는 마르코프 프로세스를 도식화한 것이다. 마르코프 프로세스는 상태의 집합$S$와 각 상태 간의 전이 확률$P$를 통해 구성된 확률적인 구조로 정의할 수 있다 $$MP \equiv (S, P)$$ 상태의 집합 $S$ 가능한 상태들을 모두 모아놓은 집합이다. 아래와 같이 표기된다 $S = \{s_0, s_1, s_2, \ldots, s_n\}$이다 전이 확률 행렬 $P$ 전이 확률은 특정상태에서 특정상태로 상태전이 될 때의 확률을 말한다. 이 확률은 여러 방식으로 표현될 수 있으며, 예를 들어 상태 $s_0$에서 상태 $s_1$로의 전이확률을 표기한다고 할 때$P_{s_0s_1}$ 또는 $P(s_1|s_0)$의 .. 2023. 9. 4. 이전 1 다음