AI의 노동시장 영향: 새로운 측정 방법과 초기 증거 Anthropic

주요 발견
1. 이론적 LLM 역량과 실제 사용 데이터를 결합한 새로운 AI 대체 위험 지표인 ‘관찰된 노출(observed exposure)’ 방법론을 도입했다. 이 지표는 ‘AI가 단순히 얼마나 활용되는가’보다 ‘일자리를 위협하는 자동화적·업무적 활용’에 더 높은 가중치를 부여한다.
2. AI의 실제 활용은 이론적 잠재력에 크게 미치지 못하며, 현실에서의 커버리지는 이론적으로 가능한 수준의 일부에 불과하다.
3. 관찰된 노출이 높은 직업일수록 미국 노동통계국(BLS)의 2034년까지 고용 성장 전망이 낮게 나타난다.
4. 노출 위험이 가장 높은 직종의 종사자는 더 고령이고, 여성 비율이 높으며, 학력과 임금 수준이 더 높은 경향이 있다.
5. 2022년 말 이후 고노출 직종 종사자의 실업률에서 체계적인 증가는 발견되지 않았다. 다만 해당 직종에서 청년층의 신규 채용이 둔화되었다는 초기 신호는 포착됐다.

연구의 배경과 문제의식
AI가 노동시장에 미치는 영향을 측정하고 예측하려는 연구들이 급증하고 있으나, 과거의 유사한 시도들은 실망스러운 성과를 보였다. 예컨대 직업 오프쇼어링 가능성을 측정한 연구는 미국 일자리의 약 4분의 1이 취약하다고 진단했으나, 10년이 지난 후에도 해당 직업들 대부분은 건강한 고용 성장을 유지했다. 산업용 로봇이 고용에 미치는 영향을 다룬 연구들은 서로 상반된 결론에 도달했으며, 중국발 무역 충격으로 인한 일자리 손실 규모도 여전히 논쟁 중이다.

이러한 선행 연구들의 실패는 방법론적 한계에서 비롯된다. 특히 AI의 영향은 COVID-19처럼 즉각적이고 명확한 것이 아니라, 인터넷 확산이나 중국과의 무역 개방처럼 서서히, 그리고 다른 경제적 요인들과 뒤섞여 나타날 가능성이 높다. 따라서 이 연구의 저자는 AI가 아직 노동시장에 뚜렷한 흔적을 남기기 전인 지금, 방법론적 기반을 먼저 구축하는 것이 중요하다고 주장한다.

핵심 개념: 관찰된 노출(observed exposure)
이 연구의 가장 중요한 기여는 ‘관찰된 노출’이라는 새로운 측정 지표의 개발이다.
기존 연구들은 주로 ‘이론적 노출(theoretical exposure)에 의존했다. 이는 LLM이 특정 과업을 이론적으로 수행할 수 있는지를 기준으로 삼는 것으로, Eloundou et al.(2023)의 베타 지표가 대표적이다. 이 지표는 LLM 단독으로 특정 과업의 수행 속도를 두 배 이상 높일 수 있으면 1, 추가적인 소프트웨어 도구가 필요하면 0.5, 불가능하면 0으로 평가한다.

그러나 이론적 가능성과 실제 활용 사이에는 상당한 간극이 존재한다. 예를 들어, “약국에 처방 정보를 제공하고 약 재처방을 승인하는” 과업은 이론적으로는 LLM이 완전히 수행 가능하다고 평가되지만(베타=1), 실제 Claude 사용 데이터에서는 이 과업이 관찰되지 않는다. 법적 제약, 소프트웨어 요건, 인간 검증 절차 등 다양한 장벽이 실제 도입을 가로막기 때문이다.

이 연구에서는 세 가지 데이터 소스를 결합하여 관찰된 노출 지표를 구성한다. 첫째는 미국 약 800개 직업의 과업 목록을 담고 있는 O*NET 데이터베이스이고, 둘째는 Anthropic 경제 지수에서 측정된 실제 Claude 사용 데이터이며, 셋째는 앞서 언급한 Eloundou et al.의 이론적 노출 추정치이다. 계산 방식은 다음과 같다. 우선 이론적으로 LLM이 수행 가능한 과업들 중 Claude 트래픽에서 충분히 관찰되는 것들을 “커버된” 과업으로 분류한다. 이후 해당 과업이 수행되는 방식에 따라 가중치를 부여하는데, 완전 자동화 방식은 가중치 1을 받고, 인간이 AI의 도움을 받는 증강적 활용은 가중치 0.5를 받는다. 마지막으로 각 과업에 소요되는 시간 비율을 반영하여 직업 수준으로 집계한다. 결과적으로 이 지표는 직업에서 이론적으로 AI가 대체 가능한 과업들 중, 실제로 자동화된 업무 환경에서 AI가 활용되고 있는 비중을 나타낸다.

Theoretical capability and observed exposure by occupational category

가장 높은 노출 직업군
관찰된 노출 기준 상위 10개 직업을 살펴보면, 컴퓨터 프로그래머가 74.5%로 1위를 차지하고, 고객 서비스 대표(70.1%), 데이터 입력 직원(67.1%), 의료 기록 전문가(66.7%), 시장 조사 및 마케팅 전문가(64.8%) 등이 뒤를 잇는다. 반면 전체 노동자의 30%는 관찰된 노출이 전혀 없는데, 이들의 과업이 Claude 데이터에서 충분히 나타나지 않기 때문이다. 요리사, 오토바이 정비사, 수영장 안전요원, 바텐더, 식기 세척원 등이 이에 해당한다.

이론과 현실의 격차
그림이 보여주듯, 이론적 노출과 관찰된 노출 사이의 격차는 매우 크다. 컴퓨터 및 수학 분야에서 이론적으로는 과업의 94%가 LLM에 노출되어 있지만, 실제 Claude 사용 데이터 기반의 관찰된 커버리지는 33%에 불과하다. 사무 및 행정 분야에서도 이론적 노출은 90%이나 실제 활용은 이보다 훨씬 낮다. 중요한 사실은, 실제 Claude 사용 과업의 97%가 Eloundou et al. (2023)이 이론적으로 실현 가능하다고 평가한 범주(베타=0.5 또는 1.0)에 속한다는 점이다. 즉 사람들은 AI를 이론적으로 가능한 과업에만 사용하고 있지만, 그 가능한 과업들의 상당 부분은 아직 실제로 활용되지 않고 있다. 이는 AI가 이론적 잠재력의 일부만을 현실에서 실현하고 있음을 의미한다.

노출과 고용 전망의 관계
미국 노동통계국(BLS)이 2025년에 발표한 2024~2034년 직업별 고용 전망과 관찰된 노출을 비교한 결과, 관찰된 노출이 높은 직업일수록 고용 성장 전망이 낮은 경향이 있다. 구체적으로 노출이 10퍼센트포인트 증가할 때마다 BLS의 고용 성장 전망치는 0.6퍼센트포인트 하락한다. 흥미롭게도 이론적 노출 지표(Eloundou et al.의 베타)만으로는 이러한 상관관계가 나타나지 않는다. 이는 관찰된 노출 지표가 실제 노동시장 전문가들의 판단과 더 잘 일치함을 보여준다.

고노출 직업 종사자의 특성
ChatGPT 출시 직전인 2022년 8~10월 현재인구조사(CPS) 데이터를 활용하여 고노출 집단과 비노출 집단의 특성을 비교한 결과, 두 집단 간의 차이는 매우 뚜렷하다.
고노출 직업 종사자들은 여성 비율이 16퍼센트포인트 높고, 백인 비율이 11퍼센트포인트 높으며, 아시아계 비율은 거의 두 배에 달한다. 평균 시급은 47% 더 높으며, 교육 수준도 훨씬 높다. 예를 들어, 대학원 학위 소지자는 비노출 집단에서 4.5%에 불과하지만, 고노출 집단에서는 17.4%로 약 4배 차이가 난다. 이는 AI 노출의 위험이 저임금 블루칼라 노동자보다는 고임금 화이트칼라 전문직에 집중되어 있음을 시사한다.

실업률 분석: 아직 뚜렷한 영향 없음
연구팀은 노출 상위 4분위 집단과 노출 없는 집단의 실업률 추세를 2016년부터 비교하였다. 분석 결과, ChatGPT 출시 이후 두 집단 간의 실업률 격차 변화는 통계적으로 유의미하지 않은 수준(+0.0020, SE=0.0019)으로 나타났다. 즉, 현재까지 AI로 인한 실업률 상승의 체계적인 증거는 발견되지 않는다.
참고로 COVID-19 시기에는 AI 비노출 집단(대면 직업 종사자)이 훨씬 큰 폭의 실업률 상승을 경험했는데, 이는 이 방법론이 집단 간 차이를 포착할 수 있음을 역설적으로 보여준다.
이 분석틀이 탐지할 수 있는 한계 규모와 관련하여, 현재 신뢰구간 기준으로 약 1퍼센트포인트 수준의 차등적 실업률 증가는 탐지 가능하다. 2007~2009년 대침체 때와 같이 실업률이 두 배로 늘어나는 상황(고노출 집단에서 3%에서 6%로)도 이 분석으로 포착할 수 있을 것이다.

청년층 고용: 초기 신호 포착
청년층(22~25세)에서는 좀 더 주목할 만한 패턴이 나타난다. 전체 실업률 분석과 달리, 고노출 직업으로의 신규 취업률이 2024년 이후 감소하는 추세가 관찰된다. 비노출 직업으로의 취업률은 월 2%로 안정적이지만, 고노출 직업으로의 신규 취업률은 약 0.5퍼센트포인트 감소했다. ChatGPT 출시 이후 시기를 통합 추정하면, 2022년 대비 14%의 취업률 하락이 나타나며, 이는 통계적으로 간신히 유의미한 수준이다. 25세 이상의 성인에게서는 이러한 패턴이 나타나지 않는다.
단, 이 결과에 대한 대안적 해석도 존재한다. 취업에 실패한 청년들이 기존 직장에 머물거나, 다른 직종으로 이동하거나, 학업으로 복귀했을 가능성이 있다. 또한 조사 자료에서 이직 측정 자체가 오차를 포함할 수 있다. 그럼에도 이 결과는 Brynjolfsson et al.의 독립적인 연구 결과와 일치하며, AI가 청년 고용 진입에 영향을 미치기 시작했을 가능성에 대한 초기 신호로 해석된다.

결론 및 향후 과제
이 연구는 AI의 노동시장 영향을 추적하기 위한 방법론적 기반을 제시하는 첫 번째 시도이다. 현시점에서의 핵심 결론은 다음과 같다. AI의 실제 활용은 이론적 잠재력에 크게 미치지 못하고 있다. AI 노출이 높은 직업들은 향후 성장 전망이 상대적으로 낮게 예측된다. 전반적인 실업률에서는 아직 AI의 영향이 탐지되지 않는다. 그러나 청년 노동자의 고노출 직종 진입이 둔화되는 초기 징후는 존재한다.

Massenkoff, M., & McCrory, P. (2026). Labor market impacts of AI: A new measure and early evidence. Anthropic. https://www.anthropic.com/research/labor-market-impacts

Anthropic. (2026). Claude (Claude Sonnet 4.6, 2026.03.07.). [대형언어모델(LLM)]. https://claude.ai/
첨부된 논문(Massenkoff & McCrory, 2026)의 핵심 내용을 요약·설명하고, APA 형식의 참고문헌을 작성하며, 연구 내용을 시각화한 인포그래픽을 생성하는 작업에 활용했으며, 결과물은 연구자가 최종 검토 후 수정해 반영.

인포그래픽으로 보기

AI의 노동시장 영향: 새로운 측정 방법과 초기 증거 Anthropic

댓글

댓글 남기기 응답 취소

AI의 노동시장 영향: 새로운 측정 방법과 초기 증거 Anthropic

이 글 공유하기:

댓글

댓글 남기기 응답 취소