가장 단순한 데이터 라벨링조차 자동화되는 날이 올까요?

쉐어하우스 내 공용 공간의 혼잡도를 파악해 이용 편의성을 높이는 것을 목표로 하는 Prehension 프로젝트에 7월부터 합류했습니다. 이 프로젝트의 시작은 각 공간에서 수집한 센서데이터를 학습시키기 위한 데이터 라벨링 작업이었습니다. 10초 단위로 수집한 모든 데이터에 실제 사람이 몇 명이 있었는지 값(라벨)을 붙여주는 일은 공용 공간의 사람 수를 정확하게 예측하는 머신러닝 모델을 만들기 위해 필수적인 데이터 학습 과정입니다.

AI시대에 발맞춰 여러 경제 지면에서 각광받는 새로운 일거리, 데이터 라벨링은 “IT업계의 막노동이자 인형 눈알 붙이기”라 불리우는 단순 수작업입니다. Prehension 프로젝트에 대입해보면, 10초 단위로 5개 공간에서 수집한 일주일 간의 데이터 15만 개가 곧 ‘인형’이며 각 데이터마다 달라지는 값(사람 수:NoP)이 인형에 붙이는 ‘눈알’이라 할 수 있겠죠?

‘눈알’을 붙이기 위해, 우리는 ‘눈알’을 만드는 것부터 시작했습니다! 센서가 있는 연구실에 탁상 시계를 놓고 시계와 함께 드나드는 모든 연구원들을 타임랩스로 촬영한 후, 영상을 돌려보며 10초 단위로 나눈 각 시점의 사람 수를 일일이 기록했습니다. 직접 ‘눈알’을 하나 하나 붙이는 작업을 하루종일 하고 있다 보니 어깨는 점점 굽어지고 고개는 점점 노트북과 가까워져 눈알이 시려졌습니다. 영상 속 사람 수를 세기 위해 방해가 되는 모든 것들에 대해 불만이 차오르다가 점점 아무 생각이 없어지더니 ‘눈알’을 붙이던 손이 엄청나게 빨라집니다. 영화 <기생충>에서 믿을 수 없는 속도로 피자 박스를 접던 장면, 왠지 나도 연습하면 할 수 있을 것만 같은 자신감이 차오릅니다. 하지만, 붙은 속도에 대한 뿌듯함과 짜릿함은 찰나입니다. 이런 업무를 하루종일, 매일하며 그 쓸모에 대해 알지 못한다면 나의 쓸모가 먼지 한 톨과 같다는 우울한 생각에 빠질 것만 같았습니다.

건장한 다섯 명의 노동으로 라벨링은 끝이 났고, 라벨링한 사람 수 데이터와 센서 데이터를 학습시켜 사람 수를 예측하는 머신러닝 모델을 만들었습니다. 눈코입이 완전한 하나의 인형을 만들어내는 뼈대는 가장 단순하고도 반복적인 과정을 사람이 수행함으로써 완성되었네요. 내가 붙인 ‘눈알’의 쓰임새를 확인하니 지루하던 작업이 미화되지만 그것도 잠깐, 이런 단순한 작업조차 자동화되는 인공지능 기술을 기대하게 됩니다. 언젠가, 가장 단순한 데이터 라벨링조차 자동화되는 날이 올까요?




작성자: 김소담