AI와 인간이 함께 일한다는 것의 진짜 의미

By
Hyoeun Lee
Editorial

AI와 인간의 협업, 그것은 피할 수 없는 우리의 미래 일터

아직도 일할 때 AI 안 쓰시는 분이 있나요? Claude Cowork나 Codex같은 에이전트를 활용하는 것은 아니더라도, ChatGPT 정도는 다들 쓰시죠? 사실은 이제 나도 모르게 AI를 이미 쓰고 있는 경우도 많습니다. 이미 우리가 잘 쓰고 있던 포토샵이나 엑셀, 구글 닥스 같은 소프트웨어에도 AI가 다 도입되어 있거든요. 2025년, 전 세계 기업의 78%가 이미 AI를 업무에 도입했다고 합니다. Gartner는 2026년까지 기업용 애플리케이션의 40%에 AI 에이전트가 탑재될 것이라 예측했다고 하지요. 참고로, 2025년은 5% 미만이라고 하네요. 저도 2026년에 들어오면서 Cowork와 거의 대부분의 시간을 보내고 있고, 이 블로그 글도 Cowork로 여러 개의 에이전트와 스킬 등을 만들어서 그것들을 최대한 활용하고 있는데요. 저 역시 이렇게 일하고 있는 걸 보면, 저 통계와 예측 분석은 매우 현실적인 분석이라는 생각이 드네요.

변화의 핵심은 역할의 변화겠죠. 스타트업에서 마케팅 팀 하나를 꾸리던 과정을 혼자서 에이전트들과 해내고 있는데요. 누구나 이제 에이전트들의 리더가 될 수 있는겁니다! 한 AI 코딩 커뮤니티의 개발자는 이렇게 표현했습니다. "우리는 모두 매니저이자 리뷰어가 되어가고 있다. 이제 직업의 핵심은 요구사항을 코드로 바꾸는 것이 아니라, AI가 만들어내는 결과물을 관리하는 것으로 바뀌었다."

생산성의 향상, 그러나 마른 걸레를 쥐어짠 것은 아닐까요?

McKinsey의 2025년 11월 레포트에 의하면 AI를 활용하는 직원들은 평균 40%의 생산성 향상을 경험했다고 보고하고 있습니다. 그런데 같은 시기 Upwork의 리서치를 보면 AI를 가장 생산적으로 활용하는 직원들 중 88%가 더 높은 번아웃과 업무 이탈 징후를 보였다고 합니다. 한편, 77%의 직원들은 AI 도구가 오히려 생산성을 낮추고 업무량을 늘렸다고 답했죠.

AugmentCode와 METR의 2024년 연구는 경험 많은 개발자들이 AI 코딩 도구를 사용할 때 오히려 19% 느려진다는 결과를 내기도 했습니다. 그 이유는 "추가적인 인지 부하와 컨텍스트 스위칭" 때문인 것으로 보입니다.

AI가 빠른 결과물을 빠르게 만들어 냈기 때문에 이것을 매니징하고 리뷰하는 관리자의 입장에서는 여러 가지 주제들을 한번에 고민하고 살펴보느라 머리가 아프고 지끈 거렸다는 말입니다.

하지만 인간만 지치는 것이 아니다

인간과 AI와의 협업이 너무너무 좋지만, 정신 사납고 지친다는 이야기는 주변에서도 아주 쉽게 찾아볼 수 있습니다. 하지만 AI와 인간 협업 프로세스에서 지치는 건, 인간 뿐일까요? 아니요. 의외로 AI도 지친답니다. 물론, 그 방식은 인간과 다릅니다. 인간은 빠른 컨텍스트 전환(Context Switching)에 극도로 취약하지만, AI는 컨텍스트 창(Context Window)의 한계에 부딪힙니다. 즉, 인간의 피로가 "너무 자주 생각을 바꾸야 해서" 생기는 것이라면, AI의 한계는 "한 번에 기억할 수 있는 양이 정해져 있어서" 생기는 건데요.

물론, AI 도구들이 발전하면서 스스로 이런 한계를 극복을 하기도 합니다. 이 작업을 하고 있는 와중에 저의 귀여운 Cowork가 이 작업을 더 잘하기 위해서 중간 과정을 요약하고 저장하겠다고 했습니다. 긴 내용들을 모두 다 기억할 수는 없으니, 한계에 도달하기 전에 미리 내용들을 압축적으로 만들어 두고 그 내용을 저장하겠다고 저에게 알려주었습니다. (얼마전까지는 이쯤 되면 한 번 요약하라고 해야겠지? 이러면서 제가 직접 시켰던 기억이 있는데요)

AI의 Context Window, 이게 대체 무슨 개념일까?

Context Window(컨텍스트 창)란 무엇인가?

당신이 수다쟁이 친구와 아주 오래간만에 전화 통화를 한다고 상상해 보겠습니다. 통화가 길어질수록 앞에서 뭘 이야기했는지 점점 흐릿해지는데요. AI도 마찬가지입니다. 한 번에 볼 수 있는 텍스트의 양에 한계가 있는데, 이 한계를 컨텍스트 창이라고 부릅니다.

AI 모델컨텍스트 창 크기약 몇 단어? (영어 기준)
GPT-3.5 (무료)4,096 토큰약 3,000 단어
GPT-4o128,000 토큰약 96,000 단어
Claude Sonnet200,000 토큰약 150,000 단어
Gemini 1.5 Pro1,000,000 토큰약 750,000 단어

컨텍스트 창과 토큰의 개념은 AI를 활용하는 사람은 잘 알고 있으면 좋은데요. 일단 이걸 잘 알아두면 적은 돈을 쓸 수 있습니다. 우선 AI 사용료가 얼마나 많은 토큰을 쓰느냐에 따라 결정되기 때문이고요. 컨텍스트 창의 한계를 뛰어 넘는 과한 입력, 컨텍스트 창의 한계를 고려하지 않은 입력은 '더 큰 비용'으로 이어집니다. 물론 ChatGPT 정도를 사용하는 수준에서는 큰 차이를 느낄 수 없지만, 프로의 세계에서는 정말 중요한 개념이거든요. (돈이 든다니깐요!) 참고로, 한국어는 영어보다 토큰 효율이 낮아서, 실제로 처리 가능한 한국어 단어수는 영어보다도 더 적은 편입니다.

그런데 위에서 말한 단어들의 수를 보면 일단은 굉장히 크게 느껴지긴 하죠? 하지만 또 AI가 처리할 수 있는 양이 많아진다고 해서 모든 것을 "똑같이 잘" 기억하고 처리하는 건 아니에요. 스탠퍼드 연구팀의 분석에 따르면 AI는 대화의 처음과 끝 부분은 잘 기억하지만, 중간에 있는 내용은 덜 중요하게 처리하는 경향이 있다고 하기도 하고요. "Lost in the Middle(중간에서 길을 잃다)"이라고 부르는 현상이다. 실제로 정확도가 70-75%에서 55-60%로 떨어지는 것이 확인됐다.

우리는 상황과 관계없이 일관성 있게 지치고 않고 무언가를 아주 잘 처리해내는 것을 '로봇같다' 'AI같다'라고 많이 표현합니다만, AI도 약간 지치기도 하고, 태생적으로 조금 모자란 부분도 '아직은' 있는 겁니다.

Context Window의 한계가 만드는 AI의 한계

바이브코딩의 한계는 곧, 컨텍스트 윈도우의 한계

바이브코딩이란 단어는 이제 너무 익숙하시죠? 그래도 한번 짚고 넘어가자면, Andrej Karpathy가 2025년 2월 소셜미디어에서 처음 소개한 개념으로, 이런 말을 덧붙이면서 이 개념을 소개했었죠. "코드가 존재한다는 사실조차 잊어버려라. 그냥 원하는 것을 AI에게 말하고 AI가 만들어주는 것을 받으면 된다." 구조적인 계획도, 명확한 사양서도, 단계별 맥락 정리도 없이, 그냥 원하는 결과를 요청하면서 '바이브, 즉 느낌대로 코딩한다'는 표현이었습니다. Andrej Karpathy가 구글에서도 상당한 업적을 남기고, 테슬라 AI의 총책임자 이기도 했지만, AI 전문가라고 해서 사실 개발자가 아닐 수 있거든요. 사실 아니고요. Karpathy도 이 시기에 CursorAI라던가, Windsurf처럼 자연어로 프로그래밍을 할 수 있는 도구들을 사용해서, 데모 사이트 같은 것들을 직접 만들어서 많이 공개 하고 그랬었습니다.

Lovable 같은 Tool을 처음 써 보시면, 정말 깜짝 놀랄거에요. 한 마디만 해도 웹사이트 같은게 진짜로 만들어 집니다. 꽤 그럴듯한 모양으로요. 작은 프로젝트, 짧은 대화 안에서는 효과가 상당합니다. 입력 내용이 길지 않을때, 즉 컨텍스트 창에 여유가 있을 때는 AI가 모든 내용을 담을 수 있습니다.

그런데 왜 찐 개발자들은 바이브코딩이란 말을 싫어했는가?

하지만 찐 개발자들은 바이브코딩에 대해서 부정적으로 말하는 사람들도 상당히 많았어요. 대화가 길어지고 프로젝트가 커지면 문제가 시작되거든요. 그들이 일터에서 다루는 '프로들의 거대 프로젝트'에서는 바이브코딩이 먹히지 않을테니까요. 바이브코딩 방식에서는 무엇을 AI에게 알려줄지, 어떤 순서로 알려줄지에 대한 구조가 없다보니까 개발자가 요청할 때마다 새로운 정보가 컨텍스트 창에 쌓이게 됩니다. 이때 두 가지 문제가 동시에 발생하게 됩니다.

컨텍스트 창이 점점 채워지면서 앞서 합의했던 내용들이 '중간 어드메'에 묻히게 됩니다. AI가 처음에 정한 코드 구조나 네이밍 규칙을 슬그머니 잊어버리거나 일관성 없이 처리하기 시작합니다. 컨텍스트 창이 꽉 차면 더 이상 앞의 내용을 담을 수 없게 됩니다. AI는 이전 대화를 모른 채 새 요청을 처리하게 되고, 충돌이 생기기 시작해요.

MIT Technology Review는 2025년 11월에 이렇게 보도했습니다. "초기의 Vibe Coding은 AI 모델이 실제로 다룰 수 있는 것에 대한 안일함을 드러냈다. 사용자들은 더 많은 것을 요구했고, 프롬프트는 커졌지만 모델의 신뢰성은 떨어지기 시작했다."

그렇다면 대안은 무엇인가?

바로 '컨텍스트 관리의 구조화'입니다. AI에게 전달하는 정보를 의도적으로 설계하는 거에요. 쪽대본으로 일을 던지면 안되고, 전체 프로젝트의 사양서를 먼저 명확하게 정의해두고, 각 작업마다 AI에게 '지금 이 작업에 필요한 정보만' 정확하게 전달하는 겁니다. '바이브' 보다는 '지침' 인거죠. (P보다는 J여야 한달까요?) Addy Osmani는 이를 이렇게 표현하기도 했습니다.

"컨텍스트는 수익이 감소하는 유한한 자원으로 다뤄져야 한다." 컨텍스트 자체가 자원이라는 의미입니다.

이것이 Vibe Coding이 'Context Engineering(컨텍스트 엔지니어링)'으로 빠르게 진화하게 된 이유입니다. 느낌대로 던지는 방식이 아니라, 어떤 정보를 언제 AI에게 줄 것인가를 설계하는 것 — 이것이 AI와 인간 협업의 진짜 모습이고, '쪽대본-아무말'의 티키타카를 빠르게 진행하며 발생하는 인간의 피로도 덜어낼 수 있는 방식이 되겠죠.

인간을 헷갈리게 해서는 안 된다 — Context Switching 능력의 한계

에빙하우스 망각곡선과 Context Switching, 어떻게 연결되는가?

에빙하우스의 망각곡선(1885)을 아주 단순하게 설명하자면, '시간이 지나면 기억이 감소한다'는 이야기입니다. 다들 시험 공부할 때 많이 느끼셨죠? 다시 보지 않으면 바로 다 까먹습니다. 실제로 학습 후 1시간 안에 정보의 50%가 사라집니다. 그러니까 하나의 주제를 계속 곱씹는게 아니라, 주제를 바꾸기 시작하면 이 망각이 끊임없이 시작됩니다. 새롭게 숙지하고, 새롭게 까먹고. 이 무한의 굴레가 시작되는 거에요.

어떤 복잡한 작업을 하다가 주제가 바뀌는 순간, 뇌는 현재의 작업 맥락을 유지하는 것을 멈추게 됩니다. 에빙하우스 곡선이 바로 그 순간부터 적용되기 시작해요. 그리고 다시 원래 작업으로 돌아올 때, 이미 상당 부분이 흐릿해진 상태에서 다시 맥락을 로드해야 합니다.

이것이 Context Switching의 비용이 단순히 '전환하는 시간'이 아닌 이유다. 한 연구 결과에서는 주제를 전환한 후에 잃어버린 맥락을 다시 재건하는데 23분이 걸린다고 한 적이 있습니다. Gloria Mark 교수가 측정한 23분 15초의 정체입니다.

생명이 달린 Context Switching — 파일럿과 의사의 사례

이것이 단순한 생산성의 문제가 아니라는 것은, 컨텍스트 스위칭이 생사와 직결되는 현장을 보면 좀 더 명확해지는데요.

항공 조종사의 경우, NTSB(미국 국가교통안전위원회)의 항공사고 분석에 따르면 치명적인 조종실 사고의 주요 원인 중 하나가 절차 수행 도중 발생하는 외부 커뮤니케이션과 경보로 인한 컨텍스트 스위칭이라고 합니다. 조종사는 착륙 절차를 수행하다가 관제탑의 지시에 응하고 다시 돌아오는 순간, 이미 어느 단계에 있었는지를 순간적으로 잊어버린다는 겁니다. AI를 사용하여 일하는 사람들이 실제로 여러개의 AI 도구를 열어두고, 병렬적인 작업을 수행하게 되는데요. AI가 무언가를 뚝딱 거리는 동안 마냥 기다릴 수 없으니, 생산적으로 다른 일을 하고 있는 거지만, 실제로는 생산적이 아닐 수도 있다는 말입니다. 컨텍스트 스위칭이 단순히 '시간을 낭비'하는 것이 아니라, '의사 결정의 질'을 저하시켜 버리는 거죠.

인간과 AI, 각자의 한계를 이해하면 비로소 협업이 된다

MBTI를 한번 생각해 볼게요. 내향적인 사람에게 계속 사람을 만나게 하면 에너지가 고갈됩니다. 반대로 외향적인 사람을 고립시키면 에너지가 고갈되기 시작해요. 어느 쪽이 더 좋은 게 아니라, 서로 다른 방식으로 작동한다는 겁니다. MBTI가 대유행하고 유일하게 좋았던 점은, 인간이 모두 다 똑같지 않고 서로의 성향이 다르다는 걸 인지하기 시작했다는 점일텐데요. 인간과 AI도 마찬가지에요. (이렇다고 AI에게 MBTI 문제 풀어보게 시키지 마세요)

인간의 강점은 상황 판단에 있습니다. 맥락을 읽고, 우선순위를 정하고, 크리에이티브하게 연결하는 것. 반면, 인간의 한계는 빠른 컨텍스트 전환이 반복될 때 의사 결정의 질이 저하되고 에너지가 소진된다는 점입니다.

AI의 강점은 방대한 양의 정보를 빠르게 처리하고, 맥락만 잘 준다면 지속적으로 일관된 형식으로 결과물을 생성하는 것을 잘합니다. 반면, AI의 한계는 컨텍스트 창 안에 있는 것만 '볼' 수 있으며, 정보가 구조화되지 않으면 그 안에서도 길을 잃을 수 있습니다.

서로의 강점과 한계를 이해하는 것. 그것이 우리가 같이 일하기 전에 가져야 할 첫 번째 자세 아닐까요?