시계열 데이터란,
시간에 따라 순차적으로 관측한 데이터이다. 금융, 생체신호 등 다양한 도메인의 영역에서 시계열 데이터를 다루며, 시간 domain에서 데이터를 다룬다.
Frequency Domain
위의 이미지는 여러가지 주기의 신호를 나타낸다. 위의 t는 시간을 나타내고, f는 frequency를 나타낸다. 즉 하나의 시계열 데이터를 time 혹은 fequency domain에서 접근할 수 있다는 것이다.
Remark
f=T1
Fourier Series
Fourier Series는 신호 데이터를 무한개의 주기함수로 나타낸다.
- $A_n$: $\cos nx$신호의 강도
- $B_n$: $\sin nx$ 신호의 강도
- $A_0$:
- $2T$: 주기
f(x)=A0+n=1∑∞(Ancosnx+Bnsinnx)
위의 식은 어떤 신호 $f(x)$를 여러개의 주기함수로 분해한 것이다. 이제 각 요소에 대해서 살펴보자.
아래는 $A_0$에 대한 수식이다.
A0=2T1∫−TTf(x)dx
이에 대해서 수식을 다음과 같이 전개해보면, 쉽게 이해할 수 있다.
∫T−Tf(x)dx=∫−TTA0dx+0=A0×2T
$A_n, B_n$은 각 $\frac{n}{2}$주기에 함수와 함수 $f(x)$간의 inner product이다. 해석하자면, 전체신호와 각 주기함수간의 유사도를 나타내며, 전체신호에서 어느정도의 비중을 차지하는지 표현할 수 있다.
An=2T1∫−TTf(x)cosnxdx
Bn=2T1∫−TTf(x)sinnxdx
$A_n$에 대해서도 다음과 같이 전개해보겠다.
$f(x) = A_0 + \sum_{n=1}^{\infty}(A_n \cos nx + B_n \sin nx)$ 양변에 $\cos nx$를 곱한뒤 적분을 하겠다.
∫−TTf(x)cosnxdx=∫−TTA0cosnxdx+∫−TT∑i=−∞∞Aicosnxcosixdx+∫−TT∑i=−∞∞Bisinnxcosixdx
=∫−TTAn(cosnx)2dx
-
삼각함수의 직교성에 의하여 서로 다른 주기 함수의 적분 값은 0이 된다.
-
주기함수를 주기 범위로 적분하면 그 결과는 0이 된다.
-
∫−TTA0cosnxdx=0
-
$\int_{-T}^{T} (\cos nx)^2 = 2T$
함수의 내적
함수를 무한차원의 vector처럼 생각하게 되면, vector와 마찬가지로 inner product를 적용할 수 있다.
<f,g>=∫−∞∞f(x)g(x)dx
삼각함수의 직교성
서로 다른 주기함수는 서로 직교한다.
∫02πsinnxcosmxdx=∫02π21(sin(n+m)x+sin(n−m)x)dx
fourier series에서는 주기신호를 주기신호들로 분해했다. 그렇다면, 비주기의 신호는 어떻게 처리할 수 있을까?
우선, 주기신호와 비주기 신호는 수학적으로 어떻게 나타낼 수 있을까?
우선 주기신호는 T의 주기를 가진다. 비주기 신호는 무한대의 주기를 가지는 신호라고 볼 수 있다.
주기가 무한대인 주기함수 = 비주기함수
주기가 무한대일 때, $A_n$은?
An=T→∞limT1∫−2T2Tf(x)cosnxdx
$\int_{-\frac{T}{2}}^{\frac{T}{2}}f(x) \cos nx dx$은 수렴하므로, $A_n$은 0에 수렴한다.
주기가 무한대일 때, $T A_n$은?
TAn=T→∞lim∫−2T2Tf(x)cosnxdx
0이 아닌 값에 수렴한다.
유도과정
TAn=∫−2T2TfT(x)ne−jw0tdx
T가 무한대로 간다면? 다음과 같이 치환할 수 있습니다.
fT(x)≜f(x) {\}
AnT≜X(nw0),w0=T2π
nw0≜w
이를 바탕으로 위의 식을 다시 작성해보면,
X(w)=∫−∞∞f(x)e−jwtdt
$X(w)$는 주파수 도메인의 입력을 받게 됩니다. $\int_{-\infty}^{\infty} f(x)e^{-jwt} dt$는 시간도메인의 함수를 적분을 통하여 주파수 도메인의 함수로 바꿉니다.
그렇다면, 주파수 도메인에서 시간 도메인으로는 어떻게 변환할까?
f(x)=2π1∫−∞∞X(w)e−jwtdt
위와 같이, 주파수 도메인의 함수를 주파수를 기준으로 적분하면, 시간 도메인의 함수가 된다.
Reference
[1] 헥펜파임