1. Basics; Linear Algebra
๊ฐ์
- ์ ํ๋์ํ(Linear Algebra) ๊ฐ๋ต ๊ฒํ
- ๋ณธ ๊ฐ์์ ๊ฐ์ฅ ๊ด๋ จ ๊น์ ํต์ฌ ๊ฐ๋ ์ ์ด์
๊ธฐ๋ณธ ๊ฐ๋ ๋ฐ ํ๊ธฐ๋ฒ (Basic Concepts and Notation)
์ ํ๋์ํ (Linear Algebra)
์ ํ ๋ฐฉ์ ์(linear equations) ์งํฉ์ ๊ฐ๊ฒฐํ๊ฒ ํํํ๊ณ ์ฐ์ฐํ๋ ๋ฐฉ๋ฒ์ ์ ๊ณต
์ค์นผ๋ผ (Scalars)
- ๋จ์ผ ์ซ์(single number)
- ์ ์(Integers), ์ค์(real numbers), ์ ๋ฆฌ์(rational numbers) ๋ฑ...
- ์ดํค๋ฆญ์ฒด (, , ) ๋ก ํ๊ธฐ
๋ฒกํฐ (Vectors)
- 1์ฐจ์ ์ซ์ ๋ฐฐ์ด(1-D array of numbers)
- ์๋ฌธ์ ๋ณผ๋ ๋ก๋ง์ ํ๊ธฐ
- ๋๋ถ๋ถ ์ด ๋ฒกํฐ(column vector)๋ก ํํ
- (ํ ๋ฒกํฐ(row vector) ๊ณผ ๋์กฐ)
- ์ค์(real), ์ด์ง์(binary), ์ ์(integer) ๋ฑ ๊ฐ๋ฅ
- ํ์ ๋ฐ ํฌ๊ธฐ ํ๊ธฐ ์:
ํ๋ ฌ (Matrices)
- 2์ฐจ์ ์ซ์ ๋ฐฐ์ด(2-D array of numbers)
- ํ์ ๋ฐ ํํ(shape) ํ๊ธฐ ์: ํ ์ด ํ๋ ฌ
- ์ ๋ฒ์งธ ์ด: ๋๋
- ์ ๋ฒ์งธ ํ: ๋๋
ํ ์ (Tensors)
- ์ซ์ ๋ฐฐ์ด
- 0์ฐจ์: ์ค์นผ๋ผ(scalar)
- 1์ฐจ์: ๋ฒกํฐ(vector)
- 2์ฐจ์: ํ๋ ฌ(matrix)
- ๋๋ ๊ทธ ์ด์์ ์ฐจ์ ๊ฐ๋ฅ
ํ๋ ฌ ๊ณฑ์ (Matrix Multiplication)
- ๊ณผ ์ ๊ณฑ
๋ฒกํฐ-๋ฒกํฐ ๊ณฑ (Vector-Vector Products)
- ๋ ๋ฒกํฐ ์ ๋ํด, ๋ด์ (inner product) ๋๋ ์ ๊ณฑ(dot product) ๋ ์ค์
- ๋ฒกํฐ , ์ ๋ํด (ํฌ๊ธฐ๊ฐ ๊ฐ์ ํ์ ์์), ๋ ์ธ์ (outer product)
ํ๋ ฌ-๋ฒกํฐ ๊ณฑ (Matrix-Vector Products)
- ํ๋ ฌ ๊ณผ ๋ฒกํฐ ์ ๊ณฑ
- ํ๋ ฌ-๋ฒกํฐ ๊ณฑ์ ๋ํ ๋ค๋ฅธ ๊ด์
- ์ ๋ฒ์งธ ์์ ๋ ์ ๋ฒ์งธ ํ๊ณผ ์ ๋ด์ ()
- ๋ ์ ์ด ๋ฒกํฐ(columns)์ ์ ํ ๊ฒฐํฉ(linear combination)์ด๋ฉฐ, ์ ํ ๊ฒฐํฉ์ ๊ณ์๋ ์ ์์
- ํ ๋ฒกํฐ๋ฅผ ์ผ์ชฝ์ ๊ณฑํ๊ธฐ: (๋จ, , , )
- ์ ๋ฒ์งธ ์์๋ ์ ์ ๋ฒ์งธ ์ด์ ๋ด์
- ๋ ์ ํ ๋ฒกํฐ(rows)์ ์ ํ ๊ฒฐํฉ์ด๋ฉฐ, ์ ํ ๊ฒฐํฉ์ ๊ณ์๋ ์ ์์
ํ๋ ฌ-ํ๋ ฌ ๊ณฑ (Matrix-Matrix Products)
- ํ๋ ฌ-ํ๋ ฌ ๊ณฑ์ ๋ณด๋ 4๊ฐ์ง ๊ด์
- ๋ฒกํฐ-๋ฒกํฐ ๊ณฑ (vector-vector products)์ ์งํฉ
- ์ ๋ฒ์งธ ์์๋ ์ ๋ฒ์งธ ํ๊ณผ ์ ๋ฒ์งธ ์ด์ ๋ด์
- ์ธ์ (outer products)์ ํฉ
- ๋ฅผ ์ด ๋ฒกํฐ๋ก, ๋ฅผ ํ ๋ฒกํฐ๋ก ํํ
- ๋ ๋ชจ๋ ์ ๋ํด ์ ๋ฒ์งธ ์ด๊ณผ ์ ๋ฒ์งธ ํ์ ์ธ์ ์ ํฉ
- ํ๋ ฌ-๋ฒกํฐ ๊ณฑ (matrix-vector products)์ ์งํฉ
- ๋ฅผ ์ด ๋ฒกํฐ๋ก ํํํ๋ฉด, ์ ์ด๋ค์ ์ ์ ์ด๋ค์ ํ๋ ฌ-๋ฒกํฐ ๊ณฑ()
- ๋ค๋ฅธ ํ๋ ฌ-๋ฒกํฐ ๊ณฑ (matrix-vector products)์ ์งํฉ (ํ ๋ฒกํฐ-ํ๋ ฌ ํํ)
- ๋ฅผ ํ ๋ฒกํฐ๋ก ํํํ๋ฉด, ์ ํ๋ค์ ์ ํ๋ค๊ณผ ์ ํ๋ ฌ-๋ฒกํฐ ๊ณฑ()
- ๋ฒกํฐ-๋ฒกํฐ ๊ณฑ (vector-vector products)์ ์งํฉ
- ์ด๋ฌํ ๋ค์ํ ๊ด์ ์ ์ง์ ์ ์ธ ์ด์ ์ ์ค์นผ๋ผ(scalars) ๋์ ๋ฒกํฐ(vectors) ์์ค/๋จ์์์ ์ฐ์ฐ ๊ฐ๋ฅ
- ํ๋ ฌ ๊ณฑ์ ์ ๋ช ๊ฐ์ง ๊ธฐ๋ณธ ์์ฑ
- ๊ฒฐํฉ ๋ฒ์น(associative):
- ๋ถ๋ฐฐ ๋ฒ์น(distributive):
- ์ผ๋ฐ์ ์ผ๋ก ๊ตํ ๋ฒ์น(commutative) ๋ถ์ฑ๋ฆฝ:
์ฐ์ฐ ๋ฐ ์์ฑ (Operations and Properties)
ํญ๋ฑ ํ๋ ฌ (Identity Matrix) & ๋๊ฐ ํ๋ ฌ (Diagonal matrix)
- ํญ๋ฑ ํ๋ ฌ : ์ฃผ ๋๊ฐ์ ์์๋ 1, ๋๋จธ์ง ์์๋ 0์ธ ์ ๋ฐฉ ํ๋ ฌ(square matrix)
- ๋๊ฐ ํ๋ ฌ(Diagonal matrix): ์ฃผ ๋๊ฐ์ ์ด์ธ์ ๋ชจ๋ ์์๊ฐ 0์ธ ํ๋ ฌ
์ ์น (Transpose)
- ํ๊ณผ ์ด์ ๋ค์ง์(flipping) ๊ฒฐ๊ณผ
- ์์ฑ
๋์นญ ํ๋ ฌ (Symmetric Matrices)
- ์ ๋ฐฉ ํ๋ ฌ ์ด ์ด๋ฉด ๋์นญ
- ์ด๋ฉด ๋ฐ๋์นญ(anti-symmetric)
- ์์์ ํ๋ ฌ ์ ๋ํด, ๋ ๋์นญ, ๋ ๋ฐ๋์นญ
- ๋ฐ๋ผ์, ์์์ ์ ๋ฐฉ ํ๋ ฌ ์ ๋์นญ ํ๋ ฌ๊ณผ ๋ฐ๋์นญ ํ๋ ฌ์ ํฉ์ผ๋ก ํํ ๊ฐ๋ฅ
- ํฌ๊ธฐ ์ธ ๋ชจ๋ ๋์นญ ํ๋ ฌ์ ์งํฉ์ ์ผ๋ก ํ๊ธฐ
- (์ ๊ฐ ๋์นญ ํ๋ ฌ์์ ์๋ฏธ)
๋๊ฐํฉ (Trace)
- ์ ๋ฐฉ ํ๋ ฌ ์ ๋๊ฐํฉ : ๋๊ฐ์ ์์์ ํฉ
- ์์ฑ
- ,
Norms (๋)
- ๋ฒกํฐ ์ norm์ ๋น๊ณต์์ ์ผ๋ก ๋ฒกํฐ์ "๊ธธ์ด(length)"๋ฅผ ์ธก์ ํ๋ ์ฒ๋
- ํํ ์ฌ์ฉ๋๋ ์ ํด๋ฆฌ๋ norm(Euclidean norm) ๋๋ norm
- ๋ณด๋ค ๊ณต์์ ์ผ๋ก, norm์ ๋ค์ 4๊ฐ์ง ์์ฑ์ ๋ง์กฑํ๋ ํจ์
- ๋น์์ฑ(non-negativity)
- ๋ชจ๋ ์ ๋ํด,
- ๋ช
ํ์ฑ(definiteness)
- ์ ์ธ ๊ฒฝ์ฐ์๋ง ์ฑ๋ฆฝ
- ๋์ฐจ์ฑ(homogeneity)
- ๋ชจ๋ , ์ ๋ํด,
- ์ผ๊ฐ ๋ถ๋ฑ์(triangle inequality)
- ๋ชจ๋ ์ ๋ํด,
- ๋น์์ฑ(non-negativity)
norm
- L1 norm ():
- ์ต๋ norm (Max norm) ():
ํ๋ก๋ฒ ๋์ฐ์ค norm (Frobenius norm) (ํ๋ ฌ์ ๋ํ norm)
์ ํ ๋ ๋ฆฝ (Linear Independence)
- ๋ฒกํฐ ์งํฉ ์, ์ด๋ค ๋ฒกํฐ๋ ๋๋จธ์ง ๋ฒกํฐ๋ค์ ์ ํ ๊ฒฐํฉ์ผ๋ก ํํ๋ ์ ์์ ๋ ์ ํ ๋ ๋ฆฝ(linearly independent)
- ์ ํ ์ข ์(linearly dependent) ์: ์ ํ ์ข ์
๊ณ์ (Rank)
- ํ๋ ฌ ์ ์ด ๊ณ์(column rank): ์ ์ด ๋ฒกํฐ ์ค ์ ํ ๋ ๋ฆฝ ์งํฉ์ ๊ตฌ์ฑํ๋ ๊ฐ์ฅ ํฐ ๋ถ๋ถ ์งํฉ์ ํฌ๊ธฐ
- ๊ฐ๋จํ ์ ์ ํ ๋ ๋ฆฝ ์ด์ ์
- ํ ๊ณ์(row rank): ์ ํ ๋ฒกํฐ ์ค ์ ํ ๋ ๋ฆฝ ์งํฉ์ ๊ตฌ์ฑํ๋ ๊ฐ์ฅ ํฐ ์
- ์์์ ํ๋ ฌ ์ ๋ํด, ์ด ๊ณ์๋ ํ ๊ณ์์ ๊ฐ์ ์ด๋ฅผ ์ด์นญํ์ฌ ์ ๊ณ์()
- ์์ฑ
- ์ ๋ํด, . ์ด๋ฉด ๋ ์์ ๊ณ์(full rank)
์ ๋ฐฉ ํ๋ ฌ์ ์ญํ๋ ฌ (Inverse of a Square Matrix)
- ์ ๋ฐฉ ํ๋ ฌ ์ ์ญํ๋ ฌ : ์ ๋ง์กฑํ๋ ์ ์ผํ ํ๋ ฌ
- ๋ชจ๋ ํ๋ ฌ์ด ์ญํ๋ ฌ์ ๊ฐ๋ ๊ฒ์ ์๋
- ์ด ์กด์ฌํ๋ฉด ๋ ๊ฐ์ญ(invertible) ๋๋ ๋นํน์ด(non-singular), ๊ทธ๋ ์ง ์์ผ๋ฉด ๋น๊ฐ์ญ(non-invertible) ๋๋ ํน์ด(singular)
- ์ญํ๋ ฌ์ ๊ฐ์ง๋ ค๋ฉด ๋ ์์ ๊ณ์(full rank)์ด์ด์ผ ํจ
- ์์ฑ
์ง๊ต ํ๋ ฌ (Orthogonal Matrices)
- ๋ ๋ฒกํฐ ์ด ์ด๋ฉด ์ง๊ต(orthogonal)
- ๋ฒกํฐ ์ด ์ด๋ฉด ์ ๊ทํ๋จ(normalized)
- ์ ๋ฐฉ ํ๋ ฌ ์ ๋ชจ๋ ์ด ๋ฒกํฐ๊ฐ ์๋ก ์ง๊ตํ๊ณ ์ ๊ทํ๋์ด ์์ผ๋ฉด ์ง๊ต ํ๋ ฌ
- ์ด ์ด ๋ฒกํฐ๋ค์ ์ ๊ท ์ง๊ต(orthonormal)
- ์์ฑ
- ์ง๊ต ํ๋ ฌ์ ์ญํ๋ ฌ์ ์ ์น ํ๋ ฌ
- ์ง๊ต ํ๋ ฌ๋ก ๋ฒกํฐ์ ์ฐ์ฐํด๋ ์ ํด๋ฆฌ๋ norm(Euclidean norm)์ ๋ณํ์ง ์์:
์คํฌ (Span)
- ๋ฒกํฐ ์งํฉ ์ ์คํฌ(span)์ ์ด ๋ฒกํฐ๋ค์ ์ ํ ๊ฒฐํฉ์ผ๋ก ํํ ๊ฐ๋ฅํ ๋ชจ๋ ๋ฒกํฐ์ ์งํฉ
- ์ด ๊ฐ์ ์ ํ ๋ ๋ฆฝ ๋ฒกํฐ ์งํฉ์ด๋ฉด,
- ์ ์์์ ๋ฒกํฐ ๋ ๋ถํฐ ๊น์ง์ ์ ํ ๊ฒฐํฉ์ผ๋ก ํํ ๊ฐ๋ฅ
ํฌ์ (Projection)
- ๋ฒกํฐ ์ ์ ์คํฌ ์๋ก ํฌ์(projection)
- ์ค์์ ์ ํด๋ฆฌ๋ norm ์ผ๋ก ์ธก์ ํ์ ๋ ์ ๊ฐ์ฅ ๊ฐ๊น์ด ๋ฒกํฐ
- ํฌ์ ํ๊ธฐ:
ํฌ์ (Projection) & ์น์ญ (Range)
- ํ๋ ฌ ์ ์น์ญ(range) (๋๋ ์ด ๊ณต๊ฐ(columnspace)) : ์ ์ด ๋ฒกํฐ๋ค์ ์คํฌ
- ๊ฐ ์์ ๊ณ์(full rank)์ด๊ณ ์ผ ๋, ๋ฒกํฐ ๋ฅผ ์ ์น์ญ ์๋ก ํฌ์
- ์ฆ๋ช ์์ฝ: , . . . .
- (!) ์ต์ ์ ๊ณฑ ์ถ์ (least squares estimation of parameters)๊ณผ์ ๊ด๊ณ (๋ค์ ์์ )
- ๊ฐ ๋จ์ผ ์ด ๋ฒกํฐ ๋ง ํฌํจํ๋ ํน์ ๊ฒฝ์ฐ (๋ฒกํฐ๋ฅผ ์ง์ ์๋ก ํฌ์)
์ ๊ณต๊ฐ (Nullspace)
- ํ๋ ฌ ์ ์ ๊ณต๊ฐ(nullspace) : ๋ฅผ ๊ณฑํ์ ๋ ์ด ๋๋ ๋ชจ๋ ๋ฒกํฐ์ ์งํฉ
- ์ฐธ๊ณ ์ฌํญ
- ์ ๋ฒกํฐ๋ ํฌ๊ธฐ , ์ ๋ฒกํฐ๋ ํฌ๊ธฐ . ์ ์ ๋ฒกํฐ๋ ๋ชจ๋ ์ ์ํจ
- ์ ๋ ์๋ก์ ๋ถ๋ถ ์งํฉ์ด๋ฉฐ, ํจ๊ป ์ ์ฒด ๊ณต๊ฐ์ ์คํฌ(span)
- ์ด๋ฌํ ์งํฉ ์ ํ์ ์ง๊ต ์ฌ ๊ณต๊ฐ(orthogonal complements)์ด๋ผ๊ณ ํจ
- (์ฐธ๊ณ : Gilbert Strang, Introduction to Linear Algebra, 5th Edition)
ํ๋ ฌ์ (Determinant)
- ์ ๋ฐฉ ํ๋ ฌ ์ ํ๋ ฌ์(determinant)
- ํจ์, ๋๋ ๋ก ํ๊ธฐ
- ํ๋ ฌ์์ ๊ธฐํํ์ ํด์
- ํ๋ ฌ ๊ฐ ์ฃผ์ด์ก์ ๋
- ์ ํ ๋ฒกํฐ ์ ๊ฐ๋ฅํ ๋ชจ๋ ์ ํ ๊ฒฐํฉ์ผ๋ก ํ์ฑ๋ ์ ์ ์งํฉ (์ ํ ๊ฒฐํฉ ๊ณ์๋ ๋ชจ๋ 0๊ณผ 1 ์ฌ์ด)
- ์ ํ๋ ฌ์์ ์ ๋๊ฐ ๋ ์งํฉ ์ "๋ถํผ(volume)" ์ธก์ ๊ฐ
- ์: . , . ํ๋ ฌ์ ๊ฐ . ํํ์ฌ๋ณํ์ ๋์ด๋ 7
- ์ ๊ฐ ํน์ด ํ๋ ฌ(singular) (์ฆ, ๋น๊ฐ์ญ(non-invertible))์ธ ๊ฒฝ์ฐ์๋ง ์ฑ๋ฆฝ
- ๊ฐ ํน์ด ํ๋ ฌ์ด๋ฉด ์์ ๊ณ์๊ฐ ์๋๋ฏ๋ก, ์ด ๋ฒกํฐ๋ ์ ํ ์ข ์
- ์ ์
- ์ ๋ํด, ๋ ์์ ๋ฒ์งธ ํ๊ณผ ๋ฒ์งธ ์ด์ ์ญ์ ํ์ฌ ์ป์ ํ๋ ฌ
- ํ๋ ฌ์์ ์ผ๋ฐ์ ์ธ (์ฌ๊ท์ ) ๊ณต์
- ์ ๋ํ์ฌ ์ด ๊ณต์์ ์์ ํ ์ ๊ฐํ๋ฉด, ์ด ๊ฐ์ ํญ ์กด์ฌ
