최근 AI 기술의 초점은 단순한 대화를 넘어, 스스로 계획을 세우고 실행하는 'AI 에이전트'로 빠르게 이동하고 있습니다. 하지만 우리가 실제로 AI 에이전트에게 어느 정도의 자율성을 부여하고 있는지, 그리고 그 과정에서 어떤 변화가 일어나는지에 대한 데이터는 부족했습니다.
'Claude Cowork'를 출시하며 AI에이전트 시대의 선도주자임을 선언함과 동시에 주식 시장에도 큰 파문을 일으켰던 Anthropic이 최근 수백만 건의 실제 사용 데이터를 분석한 보고서를 발표했습니다. Anthropic은 이 보고서에서 AI 에이전트와 인간의 협업 방식이 어떻게 진화하고 있는지를 흥미롭게 진단하고 있습니다.
🤹 "더 많이 써볼수록 더 많이 맡긴다" : 숙련도와 자율성의 상관관계
사용자가 AI 에이전트에 익숙해질수록 더 많은 자율성을 부여하는 것으로 나타났습니다. 신규 사용자는 작업의 약 20% 정도만 '자동 승인' 모드로 실행하는 반면, 숙련된 사용자는 이 비율이 40% 이상으로 두 배 가까이 높아졌습니다. 반복적인 경험을 통해 AI에 대한 신뢰가 점차 늘고 있다는 점을 시사합니다.
💬 역설적인 현상 : "믿지만, 더 자주 개입한다"
흥미로운 점은 숙련된 사용자들이 AI에게 더 많은 권한을 주면서도, 동시에 작업을 중단시키거나 수정하는 '개입' 빈도도 더 높았다는 것입니다. 초보자는 매 단계를 통제하려 하지만, 숙련자는 AI에 자율성을 주되 문제가 감지되는 순간 즉각 개입하는 '사후 감독' 전략을 취합니다.
⏰ AI 에이전트의 독립 실행 시간, 3개월 만에 2배 증가
AI가 인간의 개입 없이 스스로 작동하는 시간도 비약적으로 늘어났습니다. 상위 0.1%의 고난도 작업 세션을 분석한 결과, 자율 실행 시간이 기존 25분 미만에서 45분 이상으로 증가했습니다. 사용자들이 점차 더 복잡하고 야심 찬 과업을 AI에게 맡기기 시작했기 때문이라는 분석입니다.
🚧 리스크 관리 : 아직은 '안전한 영역' 위주
현재 AI 에이전트 활용의 약 50%는 소프트웨어 공학 분야에 집중되어 있으며, 의료나 금융, 사이버 보안 같은 고위험 영역에서의 활용은 아직 초기 단계입니다. 대부분의 작업은 취소가 가능한 저위험 작업이었으며, 이메일 발송 등 되돌릴 수 없는 작업을 수행한 건 전체의 0.8%에 불과했습니다.
AI의 자율성은 사용자의 신뢰와 연계되어 있습니다. 모델의 성능을 과신하기보다는 사용자의 적절한 개입을 가능하도록 사용자경험을 설계한다면, AI 에이전트의 활용 영역은 더욱 넓어질 것으로 보입니다.