Anthropic의 스킬 가이드를 읽혔다 — 챕터별 핵심 정리

Anthropic이 “The Complete Guide to Building Skills for Claude”를 공개했다. 30페이지짜리 PDF인데, 스킬을 만들고 배포하는 데 필요한 거의 모든 것을 다루고 있다.

다 읽을 시간이 없어서 Claude에게 읽히고 챕터별 핵심을 정리해달라고 했다. 스킬을 20개 가까이 만들어 쓰는 입장에서 보니, “감으로 해오던 것”에 체계가 붙는 느낌이었다.

PDF 원본: The Complete Guide to Building Skills for Claude
공식 예제 스킬 모음: github.com/anthropics/skills

Ch1. Fundamentals — 3단계 프로그레시브 디스클로저

스킬의 구조적 핵심은 3단계 프로그레시브 디스클로저다.

YAML 프론트매터 — 항상 시스템 프롬프트에 로딩된다. Claude가 “이 스킬을 지금 써야 하나?” 판단하는 데만 쓰인다.
SKILL.md 본문 — 관련 있다고 판단되면 로딩된다. 실제 지침이 여기에 있다.
references/ 등 링크 파일 — 필요할 때만 탐색한다.

LLM 시대의 lazy loading이다. 토큰은 아끼고, 전문성은 유지하는 설계.

두 가지 설계 원칙도 짚어둘 만하다.

합성성 — 여러 스킬이 동시에 로딩될 수 있다. 내 스킬이 혼자 쓰인다고 가정하면 안 된다.
이식성 — Claude.ai, Claude Code, API 어디서든 동일하게 작동한다. 한 번 만들면 플랫폼을 가리지 않는다.

MCP + Skill

가이드에서 쓰는 비유가 좋다.

MCP = 주방 (도구 접근)
Skill = 레시피 (사용법)

MCP만 연결하면 사용자가 매번 “이걸 어떻게 쓰죠?”를 반복한다. Skill을 더하면 워크플로우가 자동으로 활성화되고, 일관된 결과가 나온다. 둘이 합쳐야 요리가 된다.

Ch2. Planning and Design — description이 가장 중요하다

description 필드

이 챕터에서 가장 중요한 건 description 필드다.

Claude가 스킬 로딩 여부를 결정하는 유일한 단서가 이 필드다. 시스템 프롬프트에 직접 올라가기 때문에 1024자 이내, XML 태그 금지라는 제약이 있다.

반드시 두 가지를 포함해야 한다:

뭘 하는지 (what)
언제 쓰는지 (when — 구체적인 트리거 문구)

좋은 예:

“Manages Linear project workflows including sprint planning, task creation, and status tracking. Use when user mentions ‘sprint’, ‘Linear tasks’, ‘project planning’, or asks to ‘create tickets’.”

나쁜 예:

“Helps with projects.” “Implements the Project entity model with hierarchical relationships.”

트리거 문구가 없으면 Claude가 언제 이 스킬을 써야 할지 모른다.

3가지 유즈케이스 카테고리

가이드는 스킬을 세 가지 카테고리로 나눈다.

Document & Asset Creation — 문서, 디자인, 코드 생성. Claude 내장 기능만으로 충분한 경우.
Workflow Automation — 멀티스텝 프로세스 자동화. 검증 게이트 포함.
MCP Enhancement — MCP 도구 위에 워크플로우 지식을 얹는 경우.

성공 지표

정량 지표와 정성 지표를 함께 제시한다.

정량:

관련 쿼리의 90%에서 트리거
스킬 유무에 따른 토큰/대화 수 비교
API 실패 0건

정성:

사용자가 다음 단계를 물어보지 않음
교정 없이 워크플로우 완료
세션 간 일관된 결과

가이드 스스로가 “아직 vibes 기반 평가 요소도 있다”고 솔직하게 밝힌다.

기술 요건

your-skill/
├── SKILL.md        ← 필수. 정확히 이 이름.
├── scripts/        ← 선택
├── references/     ← 선택
└── assets/         ← 선택

폴더명: 하이픈 연결 소문자만 (my-skill ✅, My_Skill ❌)
YAML 프론트매터: name + description 필수
"claude" / "anthropic" 이름 사용 금지 (예약어)
README.md를 스킬 폴더 안에 넣지 마. 문서는 전부 SKILL.md 또는 references/에.

지시문 작성법

❌ “Validate data before proceeding.”
✅ "Run scripts/validate.py --input {file}"

핵심 지시는 최상단에, 상세 문서는 references/로 분리. 에러 처리도 포함해야 한다.

Ch3. Testing and Iteration — 하나 성공시킨 뒤 추출해라

테스트 3단계

트리거 테스트 — 관련 쿼리에 스킬이 뜨는지, 무관한 쿼리에 안 뜨는지.
기능 테스트 — 아웃풋 정확도, 에러 처리 작동 여부.
성능 비교 — 스킬 유무에 따른 차이 측정.

가이드가 제시하는 비교 예시:

	스킬 없이	스킬 있으면
대화 수	15번	2번
API 실패	3번	0번
토큰	12,000	6,000

핵심 조언

“어려운 태스크 하나에 집중해서 성공시킨 다음, 그 접근법을 스킬로 추출해라.”

처음부터 범용 스킬을 설계하지 마. 구체적 성공 → 일반화. 이게 순서.

반복 개선 신호

언더트리거 (스킬이 안 뜸) → description에 키워드/트리거 문구 추가
오버트리거 (엉뚱한 데서 뜸) → “Do NOT use for ~” 네거티브 트리거 추가
실행 오류 (결과 불일관) → 지시문 개선 + 에러 핸들링 추가

Ch4. Distribution — 스킬이 인프라가 되고 있다

배포 모델 3단계

개인: 폴더를 zip으로 압축해서 Claude.ai에 업로드하거나, .claude/skills/에 배치 (Claude Code).
조직: 관리자가 워크스페이스 전체에 배포 (2025년 12월 출시).
API: /v1/skills 엔드포인트 + container.skills 파라미터 + Agent SDK 연동.

오픈 스탠다드

Anthropic은 스킬을 MCP처럼 오픈 스탠다드로 공개했다. 같은 스킬이 Claude든 다른 AI 플랫폼이든 작동하게 하겠다는 것이다.

현재 권장하는 배포 패턴:

GitHub에 공개 리포로 호스팅
MCP 문서에서 스킬로 링크
설치 가이드 제공

포지셔닝 원칙: 기능이 아니라 결과를 강조하라.

✅ “팀 프로젝트 워크스페이스를 수 초 만에 세팅한다” ❌ “YAML 프론트매터와 마크다운 지시문이 담긴 폴더다”

Ch5. Patterns — 실전 패턴 5가지

1. Sequential Workflow

순서대로 실행. 각 단계에 검증 게이트를 둔다.

예: 고객 온보딩 — 계정 생성 → 결제 설정(검증 대기) → 구독 생성 → 환영 이메일. 단계 간 의존성을 명시하고, 실패 시 롤백 지침을 포함해야 한다.

2. Multi-MCP Coordination

여러 서비스를 걸쳐 작업한다.

예: 디자인→개발 핸드오프 — Figma에서 추출 → Drive에 업로드 → Linear에 태스크 생성 → Slack에 알림. 페이즈를 분리하고, MCP 간 데이터 전달과 다음 단계 전 검증이 핵심.

품질을 반복적으로 개선한다.

초안 생성 → 검증 스크립트 실행 → 이슈 수정 → 재검증 → 반복. 명시적 품질 기준과 “언제 멈출지”를 정해야 한다.

4. Context-Aware Tool Selection

같은 목표인데 상황에 따라 다른 도구를 선택한다.

파일이 10MB 넘으면 클라우드 스토리지, 협업 문서면 Notion, 코드 파일이면 GitHub. 판단 기준을 명시하고, 왜 그걸 골랐는지 투명하게 보여줘야 한다.

5. Domain-Specific Intelligence

스킬의 진짜 가치다. 도구 연결이 아니라 전문 지식을 코드화하는 것.

예: 결제 처리 전 컴플라이언스 체크 — 제재 목록 확인 → 관할권 검증 → 리스크 평가 → 감사 추적. 도구는 누구나 연결한다. 지식이 차별화다.

트러블슈팅 + 최적화

Claude가 지시를 안 따를 때

원인은 대부분 세 가지: 지시가 너무 길거나, 중요한 내용이 묻혀있거나, 모호하기 때문이다.

해결법:

핵심 지시를 최상단에 배치
## Critical 같은 헤더로 강조
중요한 검증은 자연어 지시 대신 스크립트로 — 스크립트는 매번 같은 결과를 내지만, 자연어 지시는 매번 다르게 해석될 수 있다.

성능 최적화

SKILL.md는 5,000단어 이내로 유지. 나머지는 references/로 분리.
스킬 20~50개 동시 활성화를 넘으면 성능 저하.
관련 스킬끼리 “팩”으로 묶는 것을 권장.

마무리

나는 박사논문 프로젝트에서 스킬 20개 가까이 만들어 쓰고 있다. 역사 사료 크롤러, OCR, 문서 생성, 리딩로그 자동화, 아이디어 투척 도구까지. skill-creator 스킬을 써서 만든 것들이라 대체로 가이드 구조에 맞춰져 있긴 한데, 이번에 읽으면서 시간 날 때 한 번 리팩토링 해봐야겠다 싶었다. 가이드를 제대로 준수하고 있는지 점검하는 차원에서.

PDF 원본: The Complete Guide to Building Skills for Claude
공식 예제 스킬 모음: github.com/anthropics/skills