유니티의 ML-Agents 2.0 TUTORIAL 영상을 대략적인 정리한 글입니다.
Version : Unity 2021.3.5f1
using Unity.MLAgents;
Agent 를 상속 받는다.
Agent 가 빨간줄로 표시되면 PackageManger 에서 우측 하단부의 Remove 버튼 대신에 업데이트를 눌러주면 해결된다.
data:image/s3,"s3://crabby-images/d587b/d587b89b68ad67fd890fb3427af627639c2756ce" alt=""
data:image/s3,"s3://crabby-images/99874/998749e28d66470946d9e97f8b59b3e4c3d9907f" alt=""
data:image/s3,"s3://crabby-images/83861/838610431b7935d67eeff8aa68b973991d9d5b7b" alt=""
Agent를 상속받은 스크립트를 가진 오브젝트는
Behavior Parameters
Agent를 상속받은 Script
Decision Requester
이 세가지를 필수로 가지고 있어야 한다.
CMD 에서 확인
(디폴트된 런아이들을 사용)
mlagents-learn --force
DiscreteActions : 개별 작업
정수를 반환하기 때문에 참 / 거짓 Bool로 구현하기가 쉽고
특정한 행동에 사용하기가 좋다.
data:image/s3,"s3://crabby-images/f71f0/f71f07a6f4de3409be6e0f2f56f7b4dd6725fece" alt=""
data:image/s3,"s3://crabby-images/d89d6/d89d6ee8ad61706381940388a00d715d2ff628b2" alt=""
data:image/s3,"s3://crabby-images/5c61c/5c61c840bf7b6437ecae47bf4852bbf13b8b6552" alt=""
data:image/s3,"s3://crabby-images/aabee/aabeeec6d8bb91b2e0f26cab8bff256db9884a93" alt=""
public override void OnActionReceived(ActionBuffers actions) { int Discrete = actions.DiscreteActions[0]; // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 0 size // Branche 0 size 2 = 0, 1 int Discrete2 = actions.DiscreteActions[1]; // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 1 size // Branche 1 size 3 = 0, 1, 2 int Discrete3 = actions.DiscreteActions[2]; // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 2 size // Branche 0 size 5 = 0, 1, 2, 3, 4 Debug.LogFormat("Discrete : {0} / Discrete2 : {1} / Discrete3 : {2}", Discrete, Discrete2, Discrete3); }
ContinuousActions : 연속 작업
특정 행동보다는 행동의 세기에 적절하게 사용할 수 있다.
data:image/s3,"s3://crabby-images/fec55/fec55fef32c1d4d14e4926cc151a51ea39fac3ff" alt=""
data:image/s3,"s3://crabby-images/b550a/b550a9fb48275b540a738a288885df7c4cf88def" alt=""
data:image/s3,"s3://crabby-images/860fd/860fd0d0111419a0fdb293117095d54bb1c41d6c" alt=""
public override void OnActionReceived(ActionBuffers actions) { // Unity Mathf.Clamp(A, b, c) = float A의 값이 float b와 float c 사이의 범위 이외의 값을 넘지 않도록 합니다. float Continuous1 = Mathf.Clamp(actions.ContinuousActions[0], -1f, 1f); // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions // 값 반환 -1f ~ 1f float Continuous2 = 2f * Mathf.Clamp(actions.ContinuousActions[1], -1f, 1f); // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions // 값 반환 -2f ~ 2f float Continuous3 = 3f * Mathf.Clamp(actions.ContinuousActions[2], -1f, 1f); // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions // 값 반환 -3f ~ 3f Debug.LogFormat("Continuous1 : {0} / Continuous2 : {1} / Continuous3 : {2}", Continuous1, Continuous2, Continuous3); // 값 반환 -1f ~ 1f }
Decision Requester : 결정 주기
data:image/s3,"s3://crabby-images/fb996/fb99655326b8272eebd7502791e5c0fa6e65e0f0" alt=""
우리가 호출한 OnActionReceived 함수가 5번 호출될 때 마다 한번의 액션을 반환하는 설정
그러나 Take Actions Betwwn Decisions 가 체크되어 있으면 동일한 결정을 5번씩 호출
data:image/s3,"s3://crabby-images/c688e/c688e547645f775af84a69cf3842bf85d1fc57e5" alt=""
data:image/s3,"s3://crabby-images/4ac24/4ac248193082928746155a54c959b46ef4a01abe" alt=""
Heuristic : 스스로 발견하게 하는
사용자가 직접 입력을 통해서 에이전트를 조정하여 액션 및 환경 메커니즘 등..을 확인 할 수 있습니다.
data:image/s3,"s3://crabby-images/9b533/9b5332ad2c5f0bce111a54c22c11b0d56d195c9e" alt=""
관찰
Vector / Camera / Sensor 를 이용하여 학습
위치 알려주거나 센서로 탐지 / 카메라를 이용한 이미지 감지는 학습시간이 오래걸린다
data:image/s3,"s3://crabby-images/7f6ab/7f6abf62c6abb3d5ca3b894cffefb6c4f30a2455" alt=""
CollectObservations : 수집 관찰
data:image/s3,"s3://crabby-images/8034c/8034c3eaa9da57d6040c28c37d8827dd1863c412" alt=""
관측 개수와 Vector Observation – Space Size 의 크기를 맞추어 준다.
data:image/s3,"s3://crabby-images/a74ee/a74ee8dd6350cc61630dbde4452ca3e2dd371b89" alt=""
Vector Observation – Stacked Vectors
이전 그리고 그 이전의 Space Size 를 기록하는 공간입니다.
이 경우 전체의 Space Size 는 5 * 2 = 10
지금 당장의 관측값만을 사용하는 것이 아닌 이전의 관측값까지 이용하기 위함입니다
학습이 가능한 공간 범위내로 가장 작게 설정하는 것을 추천합니다.
Ray perceptions Sensor 3D
data:image/s3,"s3://crabby-images/388dd/388dd014c68ae2dad8c8bea9aae253e109a39d22" alt=""
Rays Per Direction 방향당 광선
Ray 의 방향당 광선의 수를 조절합니다.
Ray 의 수가 많을 수록 관측하는 값이 많아집니다.
data:image/s3,"s3://crabby-images/043c9/043c9b64b8d6ba46007439f7fe83058cad9b1138" alt=""
Max Ray Degrees 최대 광선 각도
광선의 원뿔 크기로 90도를 사용하면 광선이 왼쪽으로 투사됩니다.
90보다 크면 뒤로 이동합니다.
값이 60도이면 광선이 중심선의 왼쪽과 오른쪽으로 30도 이상 확산됩니다.
data:image/s3,"s3://crabby-images/5eb9d/5eb9d486afd370b6c5efc1883c4c3f6916871649" alt=""
Sphere Cast Radius 구면 주조 반지름
캐스팅할 구의 반경입니다. RayCast 의 경우 0으로 설정합니다.
data:image/s3,"s3://crabby-images/535b6/535b6170e19ea5dfbda80e3f85e46ebba816f4b0" alt=""
Ray Length 광선 길이
투사할 광선의 길이를 설정합니다.
data:image/s3,"s3://crabby-images/f1405/f1405943518becc5d5d5aaf8e6fd0a6094979df2" alt=""
Ray Layer Mask 레이 레이어 마스크
광선이 닿을 수 있는 레이어를 제어합니다. ( 물체의 레이어가 체크되지 않으면 통과합니다. )
data:image/s3,"s3://crabby-images/401a2/401a2163833cda800dee8325ba1a17427f865997" alt=""
Detectable tags 감지 가능한 태그
감지 가능한 태그 목록을 추가해 줍니다
data:image/s3,"s3://crabby-images/eadc4/eadc4aad123eb8c955163b9732cf8b428117d502" alt=""
Stacked Raycasts 누적된 레이캐스트
신경망에 피드하기 전에 스택되는 레이캐스트 결과 수 입니다.
함께 쌓을 이전 관찰의 수를 지정합니다.
기본값 1은 현재 관측값만 보는 것을 의미합니다.
data:image/s3,"s3://crabby-images/8b1de/8b1dee9c1791cb70a4a94c5447c2bbe816a14f8d" alt=""
Start Vertical Offset 수직 오프셋 시작
광선이 Y축을 따라 일부 오프셋에서 시작됨을 의미합니다(즉, 에이전트 중심 위 또는 아래).
End Vertical Offset 수직 오프셋 끝
광선이 Y축을 따라(즉, 수평선 위 또는 아래에서) 약간의 오프셋에서 종료된다는 것을 의미합니다.