본문 바로가기

1. 인공지능22

최적제어 3강 - 벨만의 원리와 Dynamic Programming 최적성의 원리는 a+b가 최적이라면, b보다 나은 b'은 없다는 것을 전제로 함  최적의 경로란 앞서 구한 stage까지가 최적의 해라면, 다음 stage에서 최적의 경로를 구할 때 앞서 구한 최적의 해까지는 건드리지 않는 것이 Bellman's principle이고 이게 바로 dynamic 프로그래밍 stage 형태로 만들어서 변수를 두고, Starting 포인트에서 일정 Stage까지 경로를 구했으면, 다음 Stage에서는 이전 Stage에서 다음 Stage 사이까지만 고려하고 Starting 포인트 부터 고려하지 않는것이 핵심  위 예를 봤을때, Bellman의 원리를 이용하면 계산량이 줄어듦  functional이란 벡터를 어떠한 연산을 통해서 scalar로 만들어내는 작업을 말함 여기서는 g(x.. 2024. 9. 14.
최적제어 1강~2강 - Introduction & 적용예시 state euqaion의 기본은 F = ma이고,  x dot은 어떤 state가 현재의 상태와 시간에 따라 변화하는 것을 말하는데, u라는 control 인풋을 넣어서 제어할 수 있도록 하는게 다니아믹 시스템 즉 다이나믹시스템은 현재의 상태와 제어인풋에 따라 변화하는 시스템. x dot = f(x,u,t)  시스템을 분류하면 크게 네가지 (1) nonlinear, time-varying은 그 함수 자체도 시간에 따라 변화할 때임 → time-varying이면 의미있는 변화 얻기 힘듦(2) nonlinear, time-invariant 함수가 시간에 따라 변화지는 않음 → 의미있는 변화를 얻을 수 있음(3) Linear, time-varying가 선형이면서 time-varying인 경우  → x'(t).. 2024. 9. 14.
MPPI 제어를 이해하기 위한 배경지식 Affine Transformation : 선형곱에 bias를 추가하는 Wx+b 변환 방식 HJB(Hamilton-Jacobi-Belman theory) 마르코프 체인 (Markob Chain) : 시간이 지남에 따라 현재 상태가 다른 상태로 변화는 과정을 확률로 표현 몬테카를로 시뮬레이션 : 난수를 이용해 복잡한 문제를 근사적으로 해결하는 방법 : 전체적인 절차는 (1) 랜덤 입력값의 확률 분포 선정, (2) 모델에 입력값 투입, (3) 계산 결과를 해석하여 원하는 값 도출 : 예를들어 랜덤 입력을 넣어서 최적해 추정, 원 넓이 추정 등 : 입력값의 범위와 분포, 랜덤 샘플의 개수 등을 잘 설정하는 것이 중요 Importance Sampling : 샘플링의 효율을 높이기 위해 관심(importance).. 2024. 8. 27.
Linear vs Affine Transformation 선형변환과 아핀변환에 대한 고찰 (Linear & Affine Transformation) | Hooni's Playground아핀변환을 정리하는 차원에서 글을 써본다. 선형변환 (Linear Transformation) 고등학교에서부터 배우는 내용이다. 선형변환은 스칼라 a와 벡터 u, v에 대해 두 벡터 공간(U, V) 사이에서 다음 조건을 만hooni-playground.com 머신러닝에서 자주 볼 수 있는 affine 변환. y = Wx +k 선형변환은 f(a+b) = f(a) + f(b) 를 만족하마 Affine 변환은 f(a+b) = f(a) + f(b)를 만족하지 못함 Affine 변환에서,f(a) = Wa + kf(b) = Wb + kf(a) + f(b) = W(a+b) + 2k반면 f(a.. 2024. 8. 26.