머신러닝의 기초: 확률적 과정(Stochastic Process)

AI Study/머신러닝(ML)

머신러닝의 기초: 확률적 과정(Stochastic Process)

Brownee 2025. 12. 4. 16:35

1. 확률적 과정

확률적 과정(Stochastic Process)이란 시간의 진행에 따라 확률적인 변화를 가지는 현상을 수학적으로 기술한 것입니다. 이는 AI, 금융, 공학 등 다양한 분야에서 불확실성을 모델링하는 데 사용되는 핵심 개념입니다. 특히 금융계에서는 투자 수익률, 인플레이션율, 시장 변동성 등 불확실한 상황에서 결과를 추정하기 위해 이 모델을 사용합니다.

확률적 과정(이미지 출처: https://www.wallstreetmojo.com/stochastic-process/)

2. 확률적 과정의 예시: 임의 보행

확률적 과정은 임의 보행(Random Walk)을 예로 들어 설명할 수 있어요.

임의 보행의 조건

술 취한 사람이 매 초마다 동전 던지기 결과에 따라 앞으로 한 발 또는 뒤로 한 발 움직이는 상황.

시점 t: 매 초 (1초, 2초, 3초, ...)
확률 변수 X_t: t초 후 사람의 현재 위치
확률: 다음 스텝에서 앞으로 갈 확률(예: 50%) 또는 뒤로 갈 확률(예: 50%)

이 사람의 위치(X_t)는 매 순간 확률적으로 결정되며, 이전 위치(X_{t-1})에 영향을 받으면서 시간의 흐름에 따라 변화합니다. 이러한 전체적인 움직임의 궤적을 확률적 과정으로 모델링할 수 있습니다.

왜 술 취한 사람을?

'술 취한 사람'을 예로 드는 것은 모델링의 본질적인 조건을 가장 쉽게 설명하기 위함입니다.
술에 취한 사람이 과거나 환경 등의 조건을 고려하여 움직이지 '못히고', 당장 정해지는 규칙대로만 움직인다는 설정입니다.
과거를 고려하지 않는 순수한 확률적 변동성을 시각화하기 위한 가장 효과적인 비유입니다.

술 취한 사람 예시의 핵심 (독립성과 무기억성)

'술 취함'은 수학적으로 다음 두 가지 중요한 성질을 내포합니다.

독립성 (Independence)
- 의미
  - 다음 행동이 이전 행동의 결과나 횟수에 전혀 영향을 받지 않음.
- 술 취한 사람
  - 이 사람은 매 순간 동전 던지기 결과에 따라서만 움직입니다.
  - 방금 몇 발자국을 걸었든, 이전에 오른쪽으로 많이 갔든, 다음 스텝에서 오른쪽/왼쪽으로 갈 확률은 항상 50%로 독립적입니다.
무기억성 (Memorylessness)
- 의미
  - 현재의 상태가 과거의 모든 정보를 요약하고 있으며, 미래의 상태는 오직 현재 상태에만 의존한다는 뜻입니다.
  - 이것이 마르코프 성질(Markov Property)입니다.
- 술 취한 사람
  - 이 사람의 다음 위치는 현재 위치와 동전 던지기 결과에 의해서만 결정됩니다.
  - 과거에 어떤 경로를 거쳐 현재 위치에 왔는지는 전혀 중요하지 않습니다.
  - 방향성이 없습니다.

술에 취하지 않은 사람을 가정하면?

'술에 취하지 않은 사람'을 가정한다면, 모델링의 조건이 훨씬 복잡해지고 비확률적 요소가 개입하게 됩니다.

조건	술 취한 사람 (단순 임의 보행)	술 취하지 않은 사람 (현실적 보행)
행동 결정 기준	오직 확률(동전 던지기)에 의존	목표 지점, 피로도, 환경, 의지 등 복잡한 요인에 의존
독립성	독립적 (과거를 기억하지 않음)	비독립적 (목표를 향해 가려는 '의도' 때문에 움직임이 연속성을 가짐)
수학적 모델	단순한 확률적 과정 (이산적인 마르코프 체인)	복잡한 최적화 문제나 비선형 모델이 필요

현상을 단순화하기

PM으로서 AI 모델을 설계한다면, 현실의 현상을 단순화하여 모델링하는 것이 초기 단계에서는 매우 중요합니다.

'술 취한 사람'은 가장 단순하고 순수한 확률적 현상을 나타내며, 이를 통해 마르코프 체인과 같은 기초적인 확률 모델을 쉽게 이해할 수 있게 해줍니다.
만약 처음부터 '술에 취하지 않은 사람'을 모델링하려면, 사람은 '목표 지점'을 가지므로, 단순 확률이 아닌 '목표를 달성하기 위한 최적의 행동을 학습'하는 강화 학습(Reinforcement Learning)과 같은 훨씬 복잡한 모델이 필요해집니다.

3. 확률적 과정의 활용

확률적 과정은 AI, 특히 생성형 AI와 강화 학습(Reinforcement Learning)의 기반을 이루는 핵심 수학적 도구입니다.

생성형 AI (예: LLM, Diffusion Model)
- 순차적 생성의 불확실성을 모델링할 때 활용.
- 대규모 언어 모델(LLM)이 다음 단어를 선택할 때, 단순히 가장 높은 확률의 단어(결정론적)만 고르는 것이 아니라, 확률 분포를 기반으로 유동적으로 선택하여 다양하고 창의적인 답변을 생성합니다.
- 결과가 매번 다를 수 있습니다.
Diffusion Model
- 노이즈 제거 과정을 모델링할 때 활용.
- Diffusion Model은 노이즈를 제거하는 수천 개의 단계(t=T --> t=0)를 확률적 과정으로 정의하고, 각 단계에서 노이즈 제거 방향을 확률적으로 학습합니다.
강화 학습 (RL)
- 에이전트의 행동을 결정하고 및 환경을 전이시키는 역할.
- 에이전트(AI)가 어떤 상태(State)에서 다음 행동(Action)을 결정할 때, 또는 그 행동으로 인해 환경이 다음 상태로 전이될 때, 이 과정은 마르코프 결정 과정(Markov Decision Process, MDP)이라는 확률적 과정으로 모델링됩니다.
- 마르코프 결정 과정이란, 마르코프 성질에 '의사결정' 과 '보상' 을 추가한 개념입니다. 즉, 행동을 선택해서 좋은 결과를 얻으려는 상황을 모델링합니다.

4. 확률적 과정의 의미

AI 모델의 결과가 항상 100% 동일하지 않고 '다양성'을 가지는 것은 이 확률적 과정이 내포되어 있기 때문입니다. PM은 이 확률적 특성(불확실성)을 이해해야 제품의 안정성/신뢰성(Determinism) 요구 사항과 창의성/다양성(Stochasticity) 요구 사항 사이에서 균형을 잡을 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'AI Study > 머신러닝(ML)' 카테고리의 다른 글

주니어 PM의 AI 자습서: Flux.1 [dev] (0)	2025.12.11
머신러닝의 기초: 디퓨전 모델(Diffusion models) (0)	2025.12.05
머신러닝의 기초: VAE (Variational Autoencoder; 변분 오토인코더) (3)	2025.12.02
VAE 참고자료 - "잠재 공간을 확률 분포로 모델링한다" (2)	2025.12.02
머신러닝의 기초: 생성 학습(Generative Learning) (2)	2025.12.01

현재글머신러닝의 기초: 확률적 과정(Stochastic Process)

Brownlab

인공지능(Ai) 공부하는 주니어 기획자 브라우니의 블로그. 인공지능, 머신러닝, 딥러닝을 서비스/제품 기획자 관점에서 스터디합니다!

자기지도학습, 머신러닝, 디퓨전모델, decisiontree, 스터디, Ai, lightgbm, 나이브베이즈, 오토인코더, 경사하강법, CatBoost, 과적합, 그래디언트부스팅, vae, 지도학습, xgboost, 확률적과정, PM, 랜덤포레스트, 잠재공간,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Brownlab