Unity ML-Agents 2.0 행동 및 관측 설정 - 어제와 내일의 나 그 사이의 이야기 ML-Agents 2.0 TUTORIAL 행동 및 관측 설정

유니티의 ML-Agents 2.0 TUTORIAL 영상을 대략적인 정리한 글입니다.

Version : Unity 2021.3.5f1

using Unity.MLAgents;

Agent 를 상속 받는다.

Agent 가 빨간줄로 표시되면 PackageManger 에서 우측 하단부의 Remove 버튼 대신에 업데이트를 눌러주면 해결된다.

Agent를 상속받은 스크립트를 가진 오브젝트는

Behavior Parameters

Agent를 상속받은 Script

Decision Requester

이 세가지를 필수로 가지고 있어야 한다.

CMD 에서 확인

(디폴트된 런아이들을 사용)

mlagents-learn --force

DiscreteActions : 개별 작업

정수를 반환하기 때문에 참 / 거짓 Bool로 구현하기가 쉽고

특정한 행동에 사용하기가 좋다.

public override void OnActionReceived(ActionBuffers actions)
    {
        int Discrete = actions.DiscreteActions[0];
        // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 0 size
        // Branche 0 size   2  =  0, 1

        int Discrete2 = actions.DiscreteActions[1];
        // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 1 size
        // Branche 1 size   3  =  0, 1, 2 

        int Discrete3 = actions.DiscreteActions[2];
        // Behavior Parameters 컴포넌트에서 Actions - Discreate Branches - Branche 2 size
        // Branche 0 size   5  =  0, 1, 2, 3, 4 

        Debug.LogFormat("Discrete : {0} / Discrete2 : {1} / Discrete3 : {2}", Discrete, Discrete2, Discrete3);

    }

ContinuousActions : 연속 작업

특정 행동보다는 행동의 세기에 적절하게 사용할 수 있다.

public override void OnActionReceived(ActionBuffers actions)
    {
        // Unity Mathf.Clamp(A, b, c) = float A의 값이 float b와 float c 사이의 범위 이외의 값을 넘지 않도록 합니다.

  
        float Continuous1 =  Mathf.Clamp(actions.ContinuousActions[0], -1f, 1f);
        // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions
        // 값 반환 -1f ~ 1f

        float Continuous2 = 2f * Mathf.Clamp(actions.ContinuousActions[1], -1f, 1f);
        // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions
        // 값 반환 -2f ~ 2f

        float Continuous3 = 3f * Mathf.Clamp(actions.ContinuousActions[2], -1f, 1f);
        // Behavior Parameters 컴포넌트에서 Actions - Continuous Actions
        // 값 반환 -3f ~ 3f

        Debug.LogFormat("Continuous1 : {0} / Continuous2 : {1} / Continuous3 : {2}", Continuous1, Continuous2, Continuous3);

        // 값 반환 -1f ~ 1f

    }