기어코 다시 보는구나, 파이썬.
얼마만인지 모르겠다. 2019년? 2020년? 연구실 나오고선 py로 끝나는 파일은 한동안 편집한 적이 없었다.
머신러닝 파이프라인 구축이 연말부터 내년까지의 큰 줄기업무가 될 것 같아 공부를 시작했는데...
파이썬은 여전히 쉽지. 근데 웬걸, 인공지능 지식들은 머릿속에서 죄다 사라져버렸더라.
용어는 분명 눈에 익는데 속성으로 배워뒀던 것들이라 그런지 키워드만 살짝 스치고 '아 이게 뭐였지?'로 끝나버린다.
한번 더 느낀다. 아 그때 정리 좀 해둘걸.
근데 뭐 이번에 다시 정리해가면 되니까. 그리고 했던 것들이니 분명 어렵지 않을 거니까.
오늘이 1일차라서 모델을 만들기 전에 Numpy랑 Pandas부터 다시 배웠다. 배워가며 들었던 생각들이 몇 가지 있었는데,
- 참 파이썬이 데이터 다루기 편하구나.
- 같은 개발이더라도 필드에 따라 방법론이 다르구나.
인공지능 분야는 워낙 데이터 용량이 크다보니 리서치 단계에선 메모리 절약 차원으로 일부러 순수함수를 지양할 수도 있다는 것. - 개발하는 감각이 좀 다르다.
Jupyter Notebook에선 빌드하고 돌린다는 기분이 들질 않는다. 똑같이 돌아가는 파이썬 코드인데, 뭐랄까 같은 코드인데도 DX가 다른 듯 하다.
편집기 하나만으로 이렇게 달라질 수 있다는 게 새삼 새로웠다. 공식 홈페이지에서 for interactive computing이라고 설명하던데 진짜 컴퓨터랑 대화하는 기분이긴 하다. 디자이너나 기획자같은 다른 직군들도 큰 틀에선 '편집기'를 사용하는데, 그들에게도 업무 경험을 새로이 안기려면 완전히 새로운 툴이 필요하지 않을까? 그 툴은 어떤 UI/UX를 하고 있을까?
(3번은 요즘 에디터를 만들어보고픈 마음이 커져서 나도 모르게 떠오른 것 같다)
인공지능...은 회사에서도 내 전담 파트는 아니지만 업무적으로 소통할 수 있는 수준은 되어야 하니까 기초적인 선까진 배워두려 한다.
모델을 배포해야 하는데 그 모델이 내게 전달되기까지의 일을 모르고 있으면 최고의 결과를 낼 수 없으니까.
여담으로, Pandas 공부할 때 타이타닉 승객 데이터셋을 썼는데 승객 나이 기반으로 최대/최소값 구하다 눈물날 뻔 했다.
최소값으로 나온 0.9, 0.6, 0.4. 채 1이 되지 못한, 아무것도 몰랐을 그 어린 마음들이 안타까웠다.