칼럼 · 글연재

1인 기업의 RAG 구축기 — 3일 만에 15년 치 지식을 AI에게 넘긴 이야기

2026-03-26

프롤로그: 그날의 전화 한 통

"김 대표님, 5년 전에 현대위아에서 했던 강의 자료 좀 찾아주세요. 그때 쓰셨던 B2B 세일즈 시나리오 분석 자료가 정말 좋았거든요."

금요일 오후, 익숙한 요청이 들어왔습니다. 저는 반사적으로 구글 드라이브를 열었습니다. '고객사' 폴더 → '현대위아' → 2018년? 2019년? 폴더를 열어봅니다. 키노트 파일이 8개. 하나씩 열어봅니다. "이건 아닌데…" 다시 닫습니다. 다른 폴더를 뒤집니다. '강의자료' → 'B2B세일즈' → 파일이 40개가 넘습니다.

결국 45분 만에 찾았습니다. 아니, 정확히 말하면 "이것 같은데…" 하는 파일을 찾았습니다. 100% 확신은 없었습니다.

이런 일이 한두 번이 아닙니다. 15년간 강의를 하면서 만든 키노트 파일만 2,000개가 넘습니다. 고객사별 제안서, 커리큘럼, 계약서, 분석 자료까지 합치면 수만 개입니다. 머릿속으로는 "분명히 어딘가에 있는데…" 싶은데, 그 '어딘가'를 찾는 게 매번 고역이었습니다.

그리고 더 큰 문제가 있었습니다. 제가 블로그에 쓴 글, 유튜브에서 강의한 내용, 책에서 정리한 이론 — 이것들이 전부 따로따로 흩어져 있다는 것입니다. 같은 주제에 대해 블로그에서는 이렇게 썼고, 강의에서는 저렇게 말했고, 책에서는 또 다르게 정리했습니다. 제 지식인데, 정작 저도 전체를 한눈에 볼 수가 없었습니다.

그래서 결심했습니다. "AI한테 내 15년을 통째로 넘기자."




1일 차: 키노트 2,023개와의 사투

삽질의 시작

토요일 아침 7시. 커피 한 잔을 내리고 맥북 앞에 앉았습니다. 계획은 단순했습니다. 제 모든 강의자료를 AI가 검색할 수 있는 데이터베이스에 넣는 것입니다. 기술적으로 말하면 RAG(Retrieval-Augmented Generation) 시스템을 구축하는 것인데, 쉽게 말하면 **"제 자료를 전부 기억하는 AI 비서를 만드는 것"**입니다.

첫 번째 관문은 키노트 파일이었습니다. 2,023개의 키노트를 먼저 PDF로 변환해야 했습니다. 맥의 오토메이터로 배치 변환을 시도했습니다. 처음에는 순조로웠습니다. 100개, 200개… 그런데 500개쯤에서 멈췄습니다. 파일명에 특수문자가 들어간 녀석들이 에러를 뿜었습니다. 괄호, 샵, 앰퍼샌드 — 15년간 별 생각 없이 지은 파일명들이 발목을 잡았습니다.

Claude Code에게 물었습니다. "특수문자 파일명도 처리하는 변환 스크립트 만들어줘." 5분 만에 해결됐습니다. 예전이라면 스택오버플로우를 뒤지며 반나절은 썼을 일입니다.

7만 3천 장의 슬라이드

PDF 변환이 끝나고, 각 슬라이드에서 텍스트를 추출했습니다. 한 파일당 평균 36장. 2,023개 파일에서 73,000장의 슬라이드 텍스트가 쏟아져 나왔습니다.

그런데 여기서 문제가 생겼습니다. 슬라이드 중 상당수가 "…", 페이지 번호만, 혹은 빈 텍스트였습니다. 이런 노이즈가 검색 결과를 오염시킵니다. 20자 미만의 무의미한 레코드를 찾아보니 7,983개나 됐습니다. 과감하게 삭제했습니다.

고객 폴더 15년 치

강의자료만으로는 부족했습니다. 고객사별로 정리해둔 폴더가 있습니다. 현대자동차, 삼성전자, LG, 포스코… 각 폴더에는 교육 제안서, 맞춤 커리큘럼, 사전 분석 자료, 계약서가 들어있습니다.

이것들을 전부 텍스트로 추출하고 데이터베이스에 넣었습니다. 67,000개의 파일 청크가 추가됐습니다. 밤 11시, 첫째 날이 끝났습니다. 눈이 뻑뻑했지만, 데이터베이스에 14만 건의 레코드가 들어간 걸 보니 뿌듯했습니다.




2일 차: 내 인생 전체를 디지털로

구글 주소록 8,590명

일요일 아침, 두 번째 날이 시작됐습니다. 오늘의 목표는 강의자료 외의 모든 것을 넣는 것입니다.

먼저 구글 주소록. 15년간 교육 현장에서 만난 사람들의 연락처가 8,590개. 이름, 회사, 직책, 이메일 — 이것들도 벡터화해서 넣었습니다. 이제 "삼성전자 마케팅팀 담당자"라고 검색하면, 관련 연락처가 유사도 순으로 나옵니다.

블로그, 유튜브, 그리고 책

다음은 콘텐츠입니다.

네이버 블로그 499개. 2012년부터 꾸준히 써온 B2B 마케팅, 세일즈, 협상 관련 글들입니다. 크롤링 스크립트를 돌려서 전부 수집하고 벡터화했습니다.

유튜브 영상 215개. 자막을 추출하고, 메타데이터와 댓글까지 함께 저장했습니다. 제가 영상에서 한 말을 텍스트로 검색할 수 있게 된 것입니다. "B2B 마케팅에서 고객 신뢰를 구축하는 방법"을 검색하면, 제가 2024년 영상에서 설명한 내용이 올라옵니다.

브런치 글 200개. 좀 더 에세이 스타일로 쓴 글들입니다. 마케팅 트렌드, 강의 현장 이야기, 1인 기업 운영 경험담.

제가 쓴 책 《B2B 마케팅 설계》. 345개 청크로 잘라서 넣었습니다. 이제 제 책의 내용을 AI가 인용하면서 답변할 수 있습니다.

홈페이지 칼럼 10개. 나눔경영컨설팅 홈페이지에 올린 칼럼들도 빠지지 않았습니다.

밤이 되니, 데이터베이스에는 이런 풍경이 펼쳐졌습니다:


데이터 소스건수

강의 슬라이드73,000장
고객 파일67,000건
구글 주소록8,590명
블로그499개
유튜브215개
345 청크
브런치200개
홈페이지 칼럼10개


제 인생 15년의 업무 기록이 하나의 데이터베이스에 모인 것입니다.




3일 차: AI에게 '의미'를 가르치다

벡터화 — 단어가 아닌 의미를 검색하다

셋째 날의 핵심 작업은 벡터화였습니다. 쉽게 말하면, 모든 텍스트에 AI가 이해할 수 있는 '의미 좌표'를 부여하는 것입니다.

일반 검색은 키워드 매칭입니다. "마케팅"이라고 검색하면, "마케팅"이라는 단어가 포함된 문서만 찾습니다. 하지만 벡터 검색은 다릅니다. **"고객에게 가치를 전달하는 전략"**이라고 검색하면, "마케팅"이라는 단어가 없더라도 의미적으로 관련된 강의자료, 블로그 글, 유튜브 자막이 모두 검색됩니다.

Voyage AI라는 임베딩 모델을 사용했습니다. 15만 건이 넘는 텍스트에 1,024차원의 벡터를 입히는 데 몇 시간이 걸렸지만, 결과는 놀라웠습니다.

하이브리드 검색의 완성

순수 벡터 검색만으로는 부족했습니다. "현대위아"나 "삼성전자" 같은 고유명사는 의미 검색보다 정확한 키워드 매칭이 더 효과적입니다. 그래서 벡터 검색과 키워드 검색을 결합한 하이브리드 검색을 구현했습니다.

의미적으로 비슷한 내용은 벡터가 찾고, 정확한 이름이나 날짜는 키워드가 찾습니다. 두 마리 토끼를 잡은 셈입니다.

카테고리 자동 분류

2,000개가 넘는 강의를 14개 카테고리로 자동 분류했습니다. B2B마케팅, AI, 창업, TRIZ/창의력, 리더십, 협상… 제목의 키워드 패턴을 분석해서 SQL 한 방으로 분류를 끝냈습니다. 이제 "AI 관련 강의자료"만 따로 검색하는 것도 가능합니다.

"현대위아" 세 글자의 마법

모든 세팅이 끝나고, 떨리는 마음으로 검색창에 **"현대위아"**를 입력했습니다.

2.6초.

화면에 결과가 쏟아졌습니다.


업종: 자동차 부품 제조업
현대자동차그룹 계열의 주요 부품 공급업체
매출액: 1조 9,224억원 (+0.7% 전년동기대비)
영업이익률: 6.4%
신규 성장 동력: 서산엔진공장 확대, 멕시코 공장 진출…


고객 폴더에 3년 전 넣어두었던 분석 자료가 자동으로 올라왔습니다. 출처까지 표시됩니다: "고객파일 - 현대위아 관련 분석자료". 예전이라면 폴더를 3~4개 뒤져야 찾을 정보를, AI가 2.6초 만에 정리해준 것입니다.

더 놀라운 건 다음이었습니다. **"B2B 마케팅 전략"**을 검색했습니다.

제 강의자료에서 관계 중심 마케팅, 솔루션 마케팅 슬라이드가 올라왔습니다. 유튜브에서 강의한 B2B 마케팅 AtoZ 영상의 자막이 함께 나왔습니다. 고객 제안서에서 작성한 마케팅 전략 부분이 추가됐습니다. 15년간 서로 다른 매체에서 서로 다른 형태로 만든 콘텐츠가, 하나의 질문 아래 일목요연하게 정리된 것입니다.

이 순간, 저는 깨달았습니다. 이건 단순한 검색 도구가 아닙니다. 15년간 흩어져 있던 제 지식의 조각들이 하나로 연결되는 경험이었습니다.

달라진 일상: Before & After

Before: 제안서 하나에 반나절

교육 제안 요청이 들어오면, 이런 과정을 거쳤습니다.

  1. 고객사 분석: 홈페이지 방문, 뉴스 검색, 기존 자료 뒤지기 — 1시간
  2. 적합한 커리큘럼 찾기: 과거 유사 교육 이력 확인 — 30분
  3. 제안서 작성: 커리큘럼 수정, 강사 프로필 첨부 — 1시간
  4. 제안 메일 작성 — 30분

총 3시간. 이게 매주 2~3건씩 반복됩니다.

After: 30분이면 끝

이제는 이렇습니다.

  1. RAG에 "○○기업 대상 B2B 세일즈 교육" 검색 → 과거 유사 교육 이력 + 관련 자료 즉시 확인 — 2분
  2. 커리큘럼 생성기(RAG 연동)로 맞춤 커리큘럼 자동 생성 — 5분
  3. 교육 제안 메일 자동 생성기(RAG 연동)로 메일 작성 — 5분
  4. 확인 및 수정 — 15분

총 30분. 6배 빨라졌습니다.

그런데 속도보다 더 중요한 게 있습니다. 품질이 올라갔습니다. 과거에는 기억에 의존해서 "대충 이런 내용이었는데…" 하면서 제안서를 썼습니다. 이제는 AI가 제 15년 치 자료에서 가장 적합한 내용을 찾아 제안합니다. 제 경험과 지식을 100% 활용하는 제안서가 나오는 것입니다.

예상치 못한 발견들

RAG를 구축하면서 뜻밖의 발견이 있었습니다.

1. 내가 뭘 많이 다뤘는지가 보입니다

카테고리 자동 분류를 하고 나니, 제 강의 포트폴리오가 숫자로 보였습니다.

  • B2B마케팅: 1,854 슬라이드
  • AI: 2,010 슬라이드
  • 동영상제작: 1,596 슬라이드
  • TRIZ/창의력: 984 슬라이드

AI 관련 강의자료가 가장 많다는 걸 처음 객관적으로 확인했습니다. 앞으로의 사업 방향을 정하는 데 중요한 데이터입니다.

2. 과거의 내가 현재의 나를 돕습니다

2015년에 만든 협상 강의자료가 있습니다. 솔직히 잊고 있었습니다. 그런데 RAG에서 "협상 전략"을 검색하니, 그 자료가 올라왔습니다. 다시 읽어보니 꽤 괜찮은 내용입니다. 현재 교육에 바로 재활용할 수 있었습니다.

이게 바로 RAG의 숨은 가치입니다. 잊혀진 자산을 되살리는 것.

3. 이미지가 주는 힘

슬라이드 이미지까지 3만 2천 장을 업로드했습니다. 검색 결과에 텍스트만 나오는 것과, 실제 슬라이드 이미지가 함께 나오는 것은 하늘과 땅 차이입니다. "아, 이 슬라이드!" 하고 바로 기억이 되살아납니다.

1인 기업의 AI 무기

솔직히 고백하면, 저는 개발자가 아닙니다. HTML이 뭔지는 알지만, 데이터베이스를 설계하거나 벡터 검색 알고리즘을 구현하는 건 제 영역이 아니었습니다.

그런데 Claude Code라는 AI 코딩 도구가 모든 걸 바꿨습니다. 제가 한 일은 **"이런 기능이 필요해"**라고 말하는 것뿐입니다. 데이터베이스 설계, 벡터 인덱스 생성, 검색 함수 최적화, 프론트엔드 개발 — 이 모든 걸 AI와 대화하면서 만들었습니다.

월 비용을 따져봤습니다.


항목비용

Supabase Pro (데이터베이스)$25/월
GitHub Pro (코드 호스팅)$4/월
Voyage AI (벡터 임베딩)무료 (200M 토큰)
합계$29/월


커피 다섯 잔 값으로, 15년 치 지식을 24시간 일하는 AI 비서에게 맡긴 셈입니다.

1인 기업이라 모든 걸 혼자 해야 하는 게 약점이라고 생각했습니다. 그런데 AI와 함께하니, 혼자라서 오히려 빠릅니다. 결재 올릴 필요도 없고, 회의할 필요도 없고, IT 부서에 요청서 쓸 필요도 없습니다. "이거 만들어줘" 하면 30분 안에 나옵니다. 필요하면 바로 만들고, 바로 쓰고, 바로 고칩니다.

기업 교육 현장에서 느끼는 변화

저는 매주 기업에서 AI, B2B 마케팅, 세일즈 교육을 합니다. 교육 현장에서 수강생들에게 이 RAG 시스템을 보여주면, 반응이 두 가지로 나뉩니다.

첫 번째: "우리 회사도 이거 만들 수 있나요?"

두 번째: "이걸 혼자 만들었다고요?"

대기업은 이미 사내 RAG 시스템을 구축하고 있습니다. 하지만 중소기업이나 1인 기업은 엄두를 못 내는 경우가 많습니다. 비용도 걱정이고, 기술도 어려워 보이니까요.

제가 이 경험을 공유하는 이유가 여기에 있습니다. 월 3만 원이면 됩니다. 개발자가 아니어도 됩니다. AI 코딩 도구가 있으면 됩니다. 중요한 건 기술이 아니라, **"내 데이터를 어떻게 활용할 것인가"**에 대한 관점입니다.

15년간 쌓아온 강의자료, 제안서, 고객 데이터, 블로그 글 — 이것들은 하드디스크에 잠들어 있으면 아무 가치가 없습니다. AI에게 먹이는 순간, 살아 움직이는 지식 자산이 됩니다.




에필로그: 3일이 바꾸는 15년

통화 녹음 자동 전사, 페이스북 게시글 연동, 링크드인 뉴스레터 연동이 대기 중입니다. 이것까지 들어가면, 제가 15년간 만들고, 쓰고, 말하고, 공유한 모든 것을 AI가 기억하게 됩니다.

얼마 전 수강생 한 분이 교육이 끝나고 이렇게 말씀하셨습니다.

"대표님은 AI를 배우는 게 아니라, AI와 함께 일하는 방법을 알려주시네요."

정확합니다. AI는 도구입니다. 도구는 쓰는 사람에 따라 가치가 달라집니다. 15년간의 경험이 있는 사람이 AI를 만나면, 그 경험이 몇 배로 증폭됩니다. 경험 없이 AI만 가져다 쓰면? 빈 껍데기입니다.

AI 시대에 진짜 경쟁력은, 축적된 경험 × AI 활용 능력입니다.

저의 3일은, 그 곱셈의 시작이었습니다.

To be continued

← 칼럼 목록 교육 문의하기

칼럼 목록

전체 칼럼 보기 →

자주 묻는 질문

  • 분류: ai-dev
  • 작성일: 2026-03-26
  • 저자: 김종혁 · 나눔경영컨설팅

프롤로그: 그날의 전화 한 통 "김 대표님, 5년 전에 현대위아에서 했던 강의 자료 좀 찾아주세요. 그때 쓰셨던 B2B 세일즈 시나리오 분석 자료가 정말 좋았거든요." 금요일 오후, 익숙한 요청이 들어왔습니다. 저는…

네, 나눔경영컨설팅은 16개 분야 154개 과정으로 이 글의 주제와 연결되는 기업 맞춤 출강·온라인 교육을 설계합니다. 교육 문의를 남겨 주세요.