그런데 자동 스크랩된 스크립트를 열어보면, 음성 인식(STT) 특유의 오탈자가 가득합니다. "오스트리아"가 "오스티아"로, "강제 수용소"가 "강제 수영소"로, "친위대"가 "친이대"로 적혔습니다.
이 글에서는 이 스크립트를 노션 AI 에이전트로 후보정하고, 요약하고, 수업 인사이트까지 도출하는 과정을 다룹니다.
1단계: STT 오탈자 후보정
에이전트가 오탈자를 판별하는 방법
AI 에이전트에게 단순히 "오탈자 고쳐줘"라고 지시하면 제대로 동작하지 않습니다. 핵심은 맥락 정보를 먼저 수집하도록 하는 것입니다.
에이전트는 다음 세 가지를 먼저 확인합니다.
영상 제목: "오스트리아는 나치의 원죄로부터 자유로울 수 있을까?" → 역사 영상임을 파악
채널명: "함께하는세계사" → 역사 전문 채널
스크립트 전문: 전체 문맥에서 등장하는 인물, 지명, 사건명 파악
이 맥락을 바탕으로 "오스티아"가 "오스트리아"의 STT 오변환이라는 판단이 가능해집니다.
💡
핑: 이 방식은 역사 영상에만 적용되는 것이 아닙니다. IT 영상이라면 영상 제목과 스크립트에서 프로그래밍 용어·서비스명을 맥락으로 잡고, 교육 영상이라면 교육과정 용어를 기준으로 보정합니다. 핵심은 맥락 정보를 미리 고정해두지 않고, 매번 영상에 맞게 새로 수집하는 것입니다.
실제 보정 예시
하나의 스크립트에서 발견된 오탈자는 약 34건이었습니다. 유형별로 정리하면 다음과 같습니다.
고유명사 오변환
원문 (STT)
보정
판단 근거
오스티아
오스트리아
영상 제목과 전체 문맥
리베르크 전범 재판
뉘른베르크 전범 재판
2차 대전 전범 재판 맥락
에렌스트 칼텐브르
에른스트 칼텐브루너
린츠 출신 친위대 지도자 맥락
일반 어휘 오탈자
원문 (STT)
보정
패턴
강제 수영소
강제 수용소
동음이의 오변환
친이대
친위대
음절 오변환
기아 급수적
기하급수적
띄어쓰기 + 음절 탈락
⚠️
주의: 숫자 누락처럼 문맥만으로 원래 값을 특정할 수 없는 항목은 에이전트가 자체적으로 보류 처리합니다. 확신할 수 없는 걸 억지로 고치는 것보다 낫습니다.
2단계: 스크립트 요약
덩어리를 나누는 기준
요약의 핵심은 화제 전환 지점을 기준으로 덩어리를 나누는 것입니다. 시간, 장소, 논점, 주체가 바뀌는 지점을 감지하여 단락으로 나눅니다.
예를 들어, 이번 영상에서는 다음과 같은 덩어리가 도출되었습니다.
도입 — "희생자 신화"의 제시
합병 이전 반유대주의 토양
합병 직후 폭력과 수정의 밤
마우타우젠 강제 수용소
오스트리아인의 홀로코스트 가담 (인물 사례)
결론 — 희생자이자 공범
여기서 중요한 것은 덩어리 수를 미리 정해두지 않는다는 점입니다. 콘텐츠의 밀도에 따라 4개가 될 수도, 8개가 될 수도 있습니다. 에이전트가 콘텐츠 밀도에 맞게 자율적으로 판단하도록 하는 것이 핵심입니다.
요약 결과물
각 덩어리마다 핵심 주장 + 근거를 개조식으로 정리합니다. 고유명사·숫자·연도 등 팩트는 보존하고, 구어체 군더더기는 제거합니다.
예를 들어 "마우타우젠 강제 수용소" 덩어리는 이렇게 요약됩니다.
1938년 8월 첫 수감자 300명 도착, 자신이 수감될 시설을 직접 건설
수감자 수: 1939년 말 2,666명 → 1944년 말 73,351명으로 기하급수적 증가
강제 수용소 체계에서 유일하게 3등급("교화 불가, 제거 대상")으로 분류
이런 식으로 전체 스크립트가 구조화된 요약본으로 변환됩니다.
3단계: 수업 인사이트 도출
여기서부터가 이 파이프라인의 핵심입니다. 단순 요약을 넘어, 교사의 수업 철학을 반영한 발문을 AI가 도출합니다.
그런데 이건 AI에게 "발문 만들어줘"라고 지시하는 것과는 완전히 다릅니다. 여기서 쓴 방법은 메타 프롬프트 기법입니다.
메타 프롬프트란?
보통 AI에게 지시할 때는 "이 주제로 발문 3개 만들어줘"와 같이 결과물을 직접 요청합니다. 메타 프롬프트는 반대입니다. 결과물을 만드는 프롬프트 자체를 AI와 함께 만드는 것입니다.
구체적으로 다음과 같은 과정을 거쳩니다.
AI에게 인터뷰를 요청합니다: "내 수업 설계 철학의 핵심이 뭐냐 파악해봐"라고 지시하면, AI가 지침 페이지와 기존 수업 자료를 분석해서 수업 철학을 정리해줍니다.
정리된 철학을 검토하고 다듬습니다: AI가 정리한 결과를 보면서 "이건 맞고, 이건 다르고, 이 부분이 더 중요해" 하고 피드백합니다. 이 과정에서 본인도 몰랐던 수업 철학의 구조가 드러납니다.
그 철학이 공 프롬프트가 됩니다: 정리된 철학을 에이전트의 스킬로 등록하면, 이후에는 어떤 영상을 넣어도 그 철학 기반으로 발문이 도출됩니다.
즉, AI에게 발문을 시킨 게 아니라, 발문을 만드는 기준 자체를 AI와 함께 만든 것입니다.