Sorting: Comparator
두 개 이상의 조건을 반영한 sorting 문제이다.
두 개 이상의 조건을 반영한 sorting 문제이다.
내적을 생각하면 개인적으로 가장 먼저 떠오르는 것은 유한차원의 벡터간의 내적으로 이는 앞서 다루었던 길이, 각도, 거리를 정의할 때 사용되었다. 이 때 내적을 정의하는 대상이 유한차원의 벡터가 아닌 무한차원일 때에 대한 내용이 함수의 내적이다.
Simplex는 주어진 공간에서의 가장 단순한 polytope로 삼각형이나 사면체의 개념을 일반적인 차원으로 확장한 것이라고 보면 된다.
앞서 두 벡터의 직교에 대해 다루었다. 이를 확장해 보면 벡터가 아닌 두 평면이 직교하고 있는 공간을 생각해보자. 방의 모서리 부분을 보면 세 평면이 직교하는 것을 볼 수 있다. 각각의 평면을 벡터공간으로 정의하면 직교하는 벡터공간이 된다. 공간의 직교개념은 기학적 관점에서 차원축소를 이해하는데 중요한 개념이 된다.
Orthonormal basis는 이름에서 나타내듯 basis vector가 서로 직교하고 크기가 각각 1인 경우이다.
Array에서 특정 구간에 주어진 숫자를 더했을 때, 최종적으로 가장 큰 수를 찾는 문제이다.
Ubuntu에서 NVIDIA 그래픽카드를 사용할 경우 드라이버, CUDA, CUDNN을 잘 관리해주는게 생각보다 쉽지 않다. 특히, 종종 Ubuntu package를 업데이트했더니 version mismatch로 에러를 보는 경우도 꽤 자주 있었다. 이런 문제를 여러번 겪으면서 시행착오를 줄이기 위해 확실한 설치방법을 남기고자 한다.
벡터의 방향에 대한 정보는 각도로 알 수 있다. 특히, 직각으로 만나는 직교의 경우 다양한 정의에 자주 사용된다.
Trust region policy optimization(TRPO)는 그 이름에서 드러나듯 최적화 방식 중 trust region방법에 기반한 방식이다. 따라서 최적화의 step size를 “적절"하게 조절해주는 방법임을 추론해볼 수 있다.
Hindsight experience replay(HER)는 agent에게 binary reward가 sparse하게 주어지는 상황에서 sample-efficient한 학습을 할 수 있도록 해주는 방법이다.