호텔리어 김모(38)씨는 코로나19로 호텔을 휴직하고 3개월째 다른 일을 하고 있다. 영상을 보면서 사람의 시선(동공)을 추적해 데이터화하거나 사진에서 도로를 골라 표시하는 일이다. 그가 작업한 결과물은 인공지능(AI)을 학습시키는 데 사용된다. 김씨는 “이 일은 배경지식이 없어도 적응하는 데 오래 걸리지 않았다”고 말했다.
그는 아르바이트로 일을 시작했지만 업무 실력을 인정받아 최근 AI 데이터 기업에 계약직으로 채용됐다. 스스로도 “코로나 시대에 맞는 일”이라며 만족감을 표시한다. 하지만 호텔리어를 완전히 그만두고 이 일을 계속할 생각은 없다. 호텔에서 부르면 돌아갈 계획이다. “제 전공도 살리고 싶고 이전에 받던 월급 수준도 있어요. 지금 하는 일은 ‘투잡’ 형식으로 주말에 하고 싶습니다.”
AI산업이 발전하면서 데이터를 수집하고 가공하는 일의 수요가 증가하고 있다. ‘데이터 노동’이라는 새로운 일의 영역이 출현한 것이다. 정부의 ‘디지털 뉴딜’ 정책으로 이런 현상은 가속화할 것으로 보인다. 정부는 AI가 학습할 데이터를 모으는 ‘데이터 댐’ 구축에 2025년까지 2조5000억원을 투입한다는 계획이다.
국민일보 취재팀은 현재 데이터 노동을 하고 있는 5명을 인터뷰해 무슨 일을 하고 있고, 일에 만족하는지를 물어봤다. 각각 휴직자, 전업주부, 프리랜서 번역가, 취업준비생, 대학생이다. 이들은 한 건에 10원대를 받는 데이터 라벨링 업무부터 하루 100만원이 주어지는 영상 촬영까지 다양한 업무를 하고 있었다.
“2~3주에 130만원 정도 버는 것 같아요”
신모(41)씨는 지인의 추천으로 데이터 라벨링 업무를 하고 있다. 중학교 교사 생활을 접고 육아를 하며 전업주부로 살고 있던 참이었다. 2018년 12월부터 이 일을 시작해 이제 만 2년이 다 돼 간다. 한국자동차연구원의 자율주행 AI 연구에 사용될 데이터 작업이다. 그는 카메라 영상에 찍힌 도로표지판, 차량, 실선 및 점선 등을 구분하는 일을 한다.
그는 낮에는 육아 및 집안일을 하고 주로 밤에 데이터 업무를 한다. “애들 재워놓고 9시부터 하루에 4~5시간 두 주 꾸준히 해요. 제가 출퇴근시간이 있는 것도 아니라 시간 분배만 잘 하면 그렇게 무리 가는 일은 아닌 것 같아요.”
급여는 작업량에 비례한다. 많이 벌 땐 월 400만원 넘게 벌었다. “400만원 넘게 받았을 때는 몇 달치를 한 달 내내 꼬박 일한 거예요. 보통은 2~3주에 120만~130만원 받았던 것 같아요.”
취업을 준비 중인 이준수(25)씨는 데이터 라벨링 기업 데이터메이커에서 ‘안면인식 프로젝트’에 참여하고 있다. 사람 얼굴 이미지를 보고 어느 나라 사람인지 구분해 AI가 인식하도록 분류하는 작업이다. 독일 일본 필리핀 베트남 등 15개 국가 사람의 얼굴 사진을 모아서 분류한다.
이씨는 친구의 지인을 통해 이 일을 접하게 됐다. 그 전에는 2017년부터 약 2년간 차량 제조 업체에서 계약직으로 일했다. “정부의 디지털 뉴딜로 일자리가 많이 생겼다고 해서 시작했어요. 어렵지 않고 원래 하던 일과 비슷한 단순·반복 업무라고 들어서요.”
신단비(20)씨는 캐나다에서 유학을 하다가 일시 귀국해 데이터 일을 하고 있다. 코로나19 때문에 학기 중 귀국한 뒤 캐나다 대학 수업은 온라인으로 듣고 있다. “한국에 오래 있을 계획이 아니어서 간단한 아르바이트를 하려고 찾아봤는데 시간도 유연하고 근무조건도 괜찮아 보여서 일하게 됐어요.” 신경세포 이미지를 300~500장 받은 뒤 세포가 어떤 식으로 움직이고, 어떤 세포가 어떤 세포와 만나는지 라벨링한다. “생소한 프로그램이어서 익숙해지는 데 시간이 걸렸어요. 초반에 3~4주는 본 작업 말고 연습하듯 수습기간처럼 계속 교육을 받았어요.”
“사람이 해석할 게 무궁무진”
인터뷰에 응한 다섯 사람은 데이터 노동이 ‘4차 산업혁명 시대의 인형 눈알 붙이기’라는 평가에 “적절한 비유인지 모르겠다”고 답했다. 김씨는 “인형 눈알 붙이기라는 평가는 살짝 후려치는 느낌”이라며 “막상 하다보면 AI 데이터의 종류가 엄청 많고 헷갈리는 것도 많다”고 말했다. 그러면서 건물의 색 변화를 체크하는 작업을 사례로 들었다. “시차를 두고 상공에서 찍은 건물 사진들이 있어요. 건물 색이 변했다면 바운딩(AI가 사물을 탐지하도록 하기 위해 박스 형태로 경계선을 설정)을 해야 하는데 제대로 바운딩했는지 검수하는 일이에요. 해가 드는 방향이나 날씨가 다르니까 명도·채도·각도가 조금씩 달라져요. 나름의 눈썰미가 필요하죠.” 김씨는 이 작업을 할 때 사내 매니저에게 여러 차례 질문을 했다고 한다. “녹색이 애매한 녹색으로 변했는데 이 정도를 변화로 쳐야 하는지, 넘어가도 되는 수준인지’ 많이 물어봤죠.”
자율주행 AI 데이터 라벨링을 하는 신모씨도 “애매한 부분이 생각보다 많다. 사람이 해석해야 하는 게 무궁무진하다”고 말했다. “차선이 점선인지 실선인지 구분해야 하는데 이게 원래 점선인지, 실선인데 차에 가려져서 점선처럼 보이는지 확신을 할 수가 없어요. 정지된 이미지를 보고 저희가 해석을 해야 하거든요. 이미지상으로만 좌회전인지 우회전인지 유턴인지 읽어내는 일도 필요하고요. 도로도 트렌드가 자꾸 바뀌니까 새로운 이미지가 나오면 익혀야 할 것들이 계속 늘어나는 거죠.”
애매한 부분, 인간이 해석해야 하는 부분이 적지 않기 때문에 데이터 라벨러와 업무를 검수하는 업체 간 원활한 의사소통이 필수다. 신모씨는 “처음에는 질문하는 게 미안할 정도로 질문의 양이 많았다. 그래도 질문에 즉각 피드백이 와 역동적이라고 느껴졌다”고 말했다. 도로주행 영상 AI 데이터세트 사업에 참여 중인 한국자동차연구원의 노형주 책임연구원은 “여러 영상이 겹쳐 있기도 하고, 객체를 어느 위치에서 끊어야 할지 등 표준화된 부분들이 없다”며 “주관적 판단이 어느 정도 필요한데 그게 잘못되면 쓸 수 없는 데이터가 된다. 작업하는 분들과의 호흡이 중요하다”고 말했다.
취업준비생 이씨는 작업 자체는 쉽지만 몸을 움직이는 일이 익숙한 자신에게는 맞지 않는 것 같다고 했다. “솔직히 말해 특별한 기술이 없어도 누구나 할 수 있는 것 같아요. 집중력과 끈기가 중요한데 저한테는 하루 8시간씩 앉아 일하는 게 쉽지 않습니다.”
데이터 관련 일자리는 대부분 단순·반복 업무로 알려져 있지만 종류가 다양하다. 프리랜서 일본어 번역가인 박모(31)씨는 다른 사람들이 번역한 문장을 검수하는 일을 한다. 그의 검수를 거친 번역 말뭉치 데이터는 파파고와 같은 AI 번역기를 학습시키는 데 쓰인다. 박씨는 이동하면서도 스마트폰으로 일할 수 있다는 것을 장점으로 들었다. “체감으로는 시간당 1만원 정도 버는 것 같아요. 기존의 번역 일과 비교하면 굉장히 후한 편이에요. 가볍게 할 수 있는데 페이도 괜찮아서 이 일을 더 늘려보려고 생각해요.”
AI 데이터 기업에 계약직으로 채용된 김씨는 최근 얼굴 촬영 단기 프로젝트에 참여하고 일당으로 100만원에 해당하는 포인트를 받았다(대부분 AI 데이터 기업은 일에 대한 보상을 포인트로 주고 일정 포인트 이상이 됐을 때 세금, 수수료 등을 제외한 나머지를 돈으로 바꿔준다). 김씨는 12시간 이상 카메라 앞에서 무작위로 주는 스크립트를 읽거나 질문을 받으면 대답하는 일을 했다. 초상권을 어느 정도 포기하는 대가로 비교적 높은 보수를 받았다. 그의 얼굴 촬영물은 딥페이크 방지 AI에 데이터로 쓰일 예정이다. “찍을 때 고생스럽긴 했지만 하루 고생해서 100만원이니까요. 주변 친구들한테도 추천해줬어요.”
스트레스 없어… ‘알바’로는 만족
데이터 노동자들은 대체로 업무에 만족했다. 신모씨는 만족도를 10점 만점에 8~9점으로 평가했다. 교사로 일할 때보다 지금 스트레스가 더 없다고 했다. “이 일이 좋은 게 사람 스트레스가 없다는 거예요. 컴플레인 들어올 일도 별로 없고요. 그분(자동차연구원)들이 갑이지만 권위적인 것 없이 수평적인 관계라고 할까요? 정말 마음이 편해요. 일이 힘들고 안 힘들고를 떠나서요.”
이준수씨는 “업무량과 시간, 육체적 피로감을 고려하면 만족감이 ‘중상’ 정도 되는 것 같다”며 “워라밸(Work and Life Balance·일과 삶의 균형)도 좋다”고 말했다.
애니메이션이 전공인 신단비씨는 과거 학습만화 채색이나 컬러링북 제작 아르바이트를 했지만 현재 일에 더 만족했다. “이전 아르바이트 작업은 커뮤니케이션이 잘 안 되고 수입이 합리적이지 못해 불만족스러웠어요. 캐나다에 돌아가서도 라벨링을 계속 하고 싶어요.” 신씨는 또 “서비스업 아르바이트를 하면 대인관계에서 스트레스를 받는데 그런 점이 없어서 괜찮다”고 말했다. 그는 친구 2명에게 추천해 함께 일하고 있다.
다만 이 일을 평생 직업으로 하겠다는 사람은 없었다. 박씨는 “기존의 일을 놓기엔 불안한 마음이 있다”고 했다. “단기 프로젝트이다 보니 전업으로 하기에는 안정성이 떨어진다는 생각이죠. 아직까지 데이터 검수자를 직업으로 하기에는 가야 할 길이 많은 것 같아요.”
이준수씨는 “본업으로 삼으려는 분들에게는 더 전문적인 교육과 기술을 알려주면서 취업할 수 있도록 하는 제도가 필요할 것 같다”고 말했다.
이슈&탐사2팀 권기석 김유나 권중혁 방극렬 기자 keys@kmib.co.kr
[AI를 위해 일한다. 데이터 노동의 등장]
▶①
▶②
▶③
▶⑤