8. Probabilitc Reasoning (2)
Revisiting Probabilistic Inference
- ํ๋ฅ ์ ์ถ๋ก (Probabilistic Inference) ์์คํ ์ ๊ธฐ๋ณธ ์์ ์ ์ฌํ ํ๋ฅ ๋ถํฌ (Posterior Probability Distribution)๋ฅผ ๊ณ์ฐํ๋ ๊ฒ, ์ฆ ๋ฅผ ๊ตฌํ๋ ๊ฒ
- : Query variables (์ง์ ๋ณ์). ๋จ์ํ๋ฅผ ์ํด ํ๋์ ์ง์ ๋ณ์ ๋ง ๊ณ ๋ ค
- : Evidence variables (์ฆ๊ฑฐ ๋ณ์). : ์ฆ๊ฑฐ ๋ณ์์ ํ ๋น๋ ๊ฐ
- : Hidden (Non-evidence, Non-query) variables (์๋ ๋ณ์).
- ์ ์ฒด ๋ณ์ ์งํฉ์ ์ด๋ฉฐ, ๋ชฉํ๋ ๋ฅผ ๋์ถ
Inference by Enumeration (์ด๊ฑฐ๋ฅผ ํตํ ์ถ๋ก )
- ์์์ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์์ ๊ฒฐํฉ ๋ถํฌ (Full Joint Distribution)์ ํญ๋ค์ ํฉ์ฐํ์ฌ ๊ณ์ฐ ๊ฐ๋ฅ
- ๋ฐ๋ผ์, ๋ฒ ์ด์ฆ ๋ท (Bayes net)์ ์ฌ์ฉํ์ฌ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๊ณฑ์ ํฉ์ ๊ณ์ฐํจ์ผ๋ก์จ ์ง์์ ์๋ต ๊ฐ๋ฅ
- ์์: ๊ฒฝ๋ณด (Alarm) ์์ ์์ ์ง์ , ์๋ ๋ณ์
- ์ด ๋ฐฉ๋ฒ์ ๊ณ์ฐ ๋ณต์ก๋๋ ๊ฐ์ ๋ถ๋ฆฌ์ธ ๋ณ์์ ๋ํด ๋ก, ๋๊ท๋ชจ ๋ฒ ์ด์ฆ ๋ท (Bayesian Networks)์ ๋ํด์๋ ๋ค๋ฃจ๊ธฐ ํ๋ฆ (intractable)
Approximate Inference for Bayeisan Networks
Approximate Inference (๊ทผ์ฌ ์ถ๋ก )
- ๋๊ท๋ชจ ๋ฒ ์ด์ฆ ๋ท (Bayesian networks)์ ๋ํ ์ ํํ ์ถ๋ก (Exact Inference)์ ๋ณต์ก๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ Solution: ๋ฌด์์ ์ํ๋ง ์๊ณ ๋ฆฌ์ฆ (Randomized Sampling Algorithms) ๋๋ Monte Carlo algorithms
- Monte Carlo algorithms๋ ์์ฑ๋ ์ํ์ ์์ ๋ฐ๋ผ ์ ํ๋๊ฐ ๋ฌ๋ผ์ง๋ ๊ทผ์ฌ ํด๋ต์ ์ ๊ณต
- ๋ฒ ์ด์ฆ ๋ท (Bayes net)์ ํ๋ฅ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ฌด์์ ์ด๋ฒคํธ (Random Events)๋ฅผ ์์ฑํ๊ณ , ๋ฐ๊ฒฌ๋ ์์ดํ ํด๋ต๋ค์ ์นด์ดํ (Counting)ํ์ฌ ์๋
- ์ถฉ๋ถํ ์ํ์ด ์์ผ๋ฉด, ์ฐธ ํ๋ฅ ๋ถํฌ (True Probability Distribution)์ ์์๋ก ๊ฐ๊น๊ฒ ๊ทผ์ ๊ฐ๋ฅ
- ๋ฒ ์ด์ฆ ๋ท (Bayes nets)์์ ์ฌํ ํ๋ฅ ์ ๊ณ์ฐ์ ์ ์ฉ๋๋ ์ํ๋ง (Sampling)์ ๊ด์ฌ
Direct Sampling Methods (์ง์ ์ํ๋ง ๋ฐฉ๋ฒ)
- ์์์ ์ํ๋ง (Sampling) ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ณธ ์์๋ ์๋ ค์ง ํ๋ฅ ๋ถํฌ (Probability Distribution)์์ ์ํ์ ์์ฑํ๋ ๊ฒ
- ๋ณ์๋ค์ ์์ ์์ (Topological Order)๋ก ์ฐจ๋ก๋ก ์ํ๋ง
- ๊ฐ์ด ์ํ๋ง๋๋ ํ๋ฅ ๋ถํฌ๋ ์ด๋ฏธ ํ ๋น๋ ๋ถ๋ชจ ๋ณ์ (Parents)์ ๊ฐ์ ์กฐ๊ฑดํ๋จ
Rejection Sampling (๊ธฐ๊ฐ ์ํ๋ง)
- ์ํ๋งํ๊ธฐ ์ด๋ ค์ด ๋ถํฌ์์ ์ํ์ ์์ฑํ๊ธฐ ์ํ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ. ์ฌ์ด ์ํ๋ง ๋ถํฌ๊ฐ ์ฃผ์ด์ก์ ๋ ์ฌ์ฉ
- ๋คํธ์ํฌ์ ๋ช ์๋ ์ฌ์ ๋ถํฌ (Prior Distribution)์์ ์ํ์ ์์ฑ
- ์ฆ๊ฑฐ (Evidence)์ ์ผ์นํ์ง ์๋ ๋ชจ๋ ์ํ์ ๊ธฐ๊ฐ (Reject)
- ๋จ์ ์๋ ์ํ์์ ๊ฐ ๋ฐ์ํ๋ ํ์๋ฅผ ์ธ์ด ๋ฅผ ์ป์
- ์ถ์ ๋ถํฌ ๋ ์ฆ๊ฑฐ ์ ์ผ์นํ๋ ์ ๊ฐ ๊ฐ์ ๋ํ ์ํ ์นด์ดํธ ๋ฒกํฐ ๋ฅผ ์ ๊ทํ (Normalizing)ํ์ฌ ๊ณ์ฐ
Challenges in Rejection Sampling (๊ธฐ๊ฐ ์ํ๋ง์ ์ด๋ ค์)
- ํ์ํ ์ํ์ ์ (Complexity)๋ ์ฃผ๋ก ์๋ฝ๋๋ ์ํ์ ๋น์จ์ ์์กด
- ์ด ๋น์จ์ ์ ํํ ์ฆ๊ฑฐ์ ์ฌ์ ํ๋ฅ (Prior Probability of the Evidence) ์ ๊ฐ์
- ๋ณต์กํ ๋ฌธ์ ์ ๊ฒฝ์ฐ (๋ง์ ์ฆ๊ฑฐ ๋ณ์), ์ด ๋น์จ์ ๋งค์ฐ ์์์ง (Vanishingly Small)
- ์์: ์ง๊ตฌ์ 1km ์ง๊ฒฝ์ ์ํ์ฑ ์ถฉ๋ ํ ์ธ๊ฐ ์์กด ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์ถ์ ํ๋ ๊ฒฝ์ฐ, ๊ฐ ๊ทน๋๋ก ์์ ์ถฉ๋ถํ ์ํ์ ์ป๋ ๋ฐ ๋งค์ฐ ์ค๋ ์๊ฐ์ด ๊ฑธ๋ฆด ์ ์์ผ๋ฉฐ, ์ด๊ฒ์ด Rejection Sampling์ Weakness
Review of Bayesian Netwokrs Visualized illustrations
Definition of Bayesian Network
- ๋ฐฉํฅ ๊ทธ๋ํ (Directed graph)
- ๊ฐ ๋ ธ๋ (Node)๋ ํ๋ฅ ๋ณ์ (Random Variable)๋ฅผ ๋ํ๋
- ์์ ๋ก์ ํ์ดํ๋ ๊ฐ ์ ๋ถ๋ชจ (Parent)์์ ์๋ฏธ
- ๊ฐ ๋ ธ๋ ๋ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ ๋ฅผ ๊ฐ์ง
An Appointment Example (์ฝ์ ์์)
- ๋ณ์:
- Rain ({none, light, heavy})
- Maintenance ({yes, no})
- Train ({on time, delayed})
- Appointment ({attend, miss})
Conditional Probability Tables (CPTs)
- Rain:
- Maintenance:
- Train:
- Appointment:
Computing Joint Probabilities (๊ฒฐํฉ ํ๋ฅ ๊ณ์ฐ)
Probabilistic Inference
- Query : ๋ถํฌ๋ฅผ ๊ณ์ฐํ ๋ณ์
- Evidence variables : ์ด๋ฒคํธ ์ ๋ํด ๊ด์ฐฐ๋ ๋ณ์
- Hidden variables : ๋น-์ฆ๊ฑฐ, ๋น-์ง์ ๋ณ์
- Goal: ๊ณ์ฐ
Inference by Enumeration (Exact Inference)
- ์์:
- : ์ง์ ๋ณ์
- : ์ฆ๊ฑฐ
- : ์๋ ๋ณ์์ ๊ฐ์ ๊ฑธ์น ๋ฒ์
- : ๊ฒฐ๊ณผ๋ฅผ ์ ๊ทํ
Approximate Inference: Sampling
- ๋ฒ ์ด์ฆ ๋ท (Bayesian Network)์ ํ ํด๋ก์ง ์์์ ๋ฐ๋ผ ๊ฐ ๋ณ์๋ฅผ ์ํ๋งํ์ฌ ์์ ํ ์ํ ์ ์์ฑ
- ์ ๊ฐ์ ํ๋ฅ ์ ์์ฑ๋ ์ํ ์ค ํด๋น ์ด๋ฒคํธ๊ฐ ๋ฐ์ํ ๋น์จ๋ก ์ถ์
- Rejection Sampling:
- ์ํ ์ค ์ธ ์ํ๋ง ๋จ๊ธฐ๊ณ , ๊ทธ ์ค์์ ์ธ ์ํ์ ๋น์จ์ ๊ณ์ฐํ์ฌ ์ถ์
