RBY_ACT

Repo Structure

imitate_episodes.py Train and Evaluate ACT
policy.py An adaptor for ACT policy
detr Model definitions of ACT, modified from DETR
sim_env.py Mujoco + DM_Control environments with joint space control
ee_sim_env.py Mujoco + DM_Control environments with EE space control
scripted_policy.py Scripted policies for sim environments
constants.py Constants shared across files
utils.py Utils such as data loading and helper functions
visualize_episodes.py Save videos from a .hdf5 dataset

Installation

# install package
# pip install torchvision torch pyquaternion pyyaml rospkg pexpect mujoco==2.3.7 dm_control==1.0.14 opencv-python matplotlib einops packaging h5py ipython

# mujoco, dm_control 최신버전으로 설치 시 동작은 하나, 모션이 이상함
pip install torchvision torch pyquaternion pyyaml rospkg pexpect mujoco dm_control opencv-python matplotlib einops packaging h5py ipython

cd detr && pip install -e .

record_sim_episodes

시뮬레이션 환경에서 dataset 생성
Camera는 Top, Angle, Vis 제공. joint camera view는 없음
여기서 카메라는 관측용, 실제 학습 데이터와 상관 x

cv_record_sim_episodes

위와 동일, matplot부분만 cv로 변경
시뮬레이션 환경에서 dataset 생성
Camera는 constants.py에서 camera_names에 따라서 결정

scripted_policy

`Type`

trajectory: time(1), pos(3), quat(4), gripper(1)
mocap_pose_right, mocap_pose_left : pos(3), quat(4)
env_state(box) : pos(3), quat(4)
gripper: open/close
waypoint 사이의 값은 interpolation한 값을 사용
interpolation은 curr과 next의 비율을 통해 수행

ee_sim_env

End Effector Tracking 기반 시뮬레이션 환경 생성
top view만 생성

`get_qpos`

qpos_raw: [0, 15]
left_qpos_raw: [0, 7]
right_qpos_raw: [8, 15]
left_arm_qpos: left_qpos_raw[0:6]
left_gripper_qpos: left_qpos_raw[6]
right_arm_qpos: right_qpos_raw[0:6]
right_gripper_qpos: right_qpos_raw[6]
np.concatenate([left_arm_qpos, left_gripper_qpos, right_arm_qpos, right_gripper_qpos])
ALOHA
- env_state = 7
- qpos_raw = 23
RBY
- env_state = 9
- qpos_raw = 25

`get_observation`

관측결과 반환
qpos, qvel, env_state(box), images

`get_reward`

reward 반환
Task마다 상이

`TransferCubeEETask`

오른손으로 잡아서 왼손으로 옮기는 행위 수행

`Rewards`

touch_right_gripper(박스가 오른손에 닿은 경우) = 1
touch_right_gripper and not touch_table (박스가 오른손에 닿고, 박스가 들린 경우) = 2
touch_left_gripper (박스가 왼손에 닿은 경우)= 3
touch_left_gripper and not touch_table (박스가 왼손에 닿고, 박스가 들린 경우, 성공적으로 들고 있는 경우) = 4

utils

`sample_box_pose`

박스 위치 랜덤하게 생성

`load_data`

imitate_episodes

`args`

policy_class : policy 선정 (ACT / CNNMLP)

assets

`bimanual_viperx_ee_transfer_cube`

EE Tracking simulation(Motion Capture)

messy-snail/aloha_act

RBY_ACT

Repo Structure

Installation

record_sim_episodes

cv_record_sim_episodes

scripted_policy

`Type`

ee_sim_env

`get_qpos`

`get_observation`

`get_reward`

`TransferCubeEETask`

`Rewards`

utils

`sample_box_pose`

`load_data`

imitate_episodes

`args`

assets

`bimanual_viperx_ee_transfer_cube`

`bimanual_viperx_transfer_cube`