2023년 정리 글
이번 년도는 귀찮아서 넘어가려다가 대충이라도 쓰자는 마음으로 에디터를 켜 봅니다. 2023년은 요약하면 어찌저찌 굴러가면서 모르면서도 일한 한 해라고 할 수 있겠네요. 그리고 취미 생활도 열심히 했습니다. 2023년에는 박주은에게 무슨 일이...
2022년 정리 글
어쩐지 정리 글을 격년으로 쓰고 있네요. 요약하면 올해는 졸업하고 취업했습니다. 이번에도 시간 순서대로 써 볼 거예요. 일기와 달력을 참고합니다. 2022년에는 박주은에게 무슨 일이 있었나 1월 나는 프로그래머가 되고 싶어?...
Imitation 라이브러리의 Behavior Cloning 써보기
강화학습의 behavior cloning (BC) 을 해봐야 할 필요가 생겨서 파이썬 stable baselines3 (SB3) 기반의 imitation learning 라이브러리 imitation 을 써 보았다. 그런데 imitation 의 데이터셋과 내가 수집해 둔 데이터셋의 인터페이스가...
2020년 정리 글
연말 맞이 정리 글입니다. 제가 써 온 달력과 일기와 연구 일지를 보며 월별로 무슨 일이 있었는지 정리했습니다. 각 달의 항목 안에서도 시간 순으로 쓰려고 노력했습니다. 2020년에는 박주은에게 무슨 일이 있었나...
직접 만든 gym-env 에서 강화학습 돌려보기
지난 글에서 기록했던 대로 직접 만든 강화학습 환경이 잘 만들어졌는지 확인하기 위해서 이미 만들어진 RL 에이전트를 그 환경 위에서 학습시켜 보았다. 이 글은 그 과정과 결과를 간략히 설명하고 있다. DQN,...
gym으로 env 만들기 연습
OpenAI gym 을 이용해 RL agent 를 위한 학습 환경을 만드는 연습을 했다. 이 글에서는 연습을 하면서 무슨 일이 있었는지를 간략히 정리한다. 2019년 6월 27일부터 7월 1일까지 5일간 있었던 일이다....