의식의 흐름대로 두둥등장
in Diary on Diary
2020년 5월 26일 의식의 흐름대로 작성한 일기
빅 데이터 프로젝트 진행한 것을 Github에 저장하다 보니 벌써 새벽 4시다.. 요새 프로젝트와 공부를 하다 보면 항상 늦은 새벽에 잠이 들고 수업들 듣기 위해 9시 이전에 일어난다. 올해 포항공대에 내려가서 교육을 들었을 때를 제외하고 제일 바쁜 것 같다. 효율은 그때가 더 좋았던 것 같기도 하고.. 아닌 것 같기도 하고.. 정신이 오락가락한게 취준이 겹쳐서 그런가봄?
빅 데이터 프로젝트를 정리하면서 파일이 많이 누락된 것 같다. 프로젝트를 진행할 때 깃헙과 같은 프로젝트 관리 툴을 사용해야 되는 중요성을 다시 한번 체감했다. 카카오톡으로 파일을 주고받고, slack으로 주고받고, Trello를 사용해서 주고받고 하다 보니 자료들이 여기저기 분산되어 있다. 심지어는 저장할 수 있는 유효기간이 지나서 받지 못할 것 같다. 조원들에게 리포지토리를 보여주고 없는 자료나 데이터는 보내달라고 해야겠다.
현재는 AI Project를 진행하고 있는데, 이번 프로젝트는 수시로 데이터를 업로드해야겠다. 아마 dataset은 130GB정도 되기 때문에 직접 업로드하진 못하고, 인용한 논문 주소를 이용하여 올려야 될 것 같다. 이 데이터들을 아규먼트하면 용량이.. GTX 2080 2개를 병렬로 사용하고 CUDA 환경을 갖춘 워크스테이션에서 3일 넘게 학습을 시켰는데, 아규먼트를 진행하고 학습시킬 것을 생각하니 아찔하네.. 여기에 현재 기반이 되는 모델은 AlexNet인데 SENet이나 ResNet을 적용할 때 레이어를 50개만 쌓아서 학습 시킬 것을 생각하면 아찔하다 못해 숨이 턱 막힌다. 서버 비용은 얼마나 나올까 벌써 기대된다. 물론 내가 내는 것은 아니지만 ㅋㅋㅋㅋ
바쁘지만, 시간을 내서 블로그에 개념 정리와 알고리즘 문제를 꾸준히 업데이트해야 빨리 자립할 수 있을 것 같다. 오늘은 이만하고 자야겠다.
