용어 사전
TTS 관련
| 용어 | 정의 |
|---|
| TTS | Text-to-Speech. 텍스트를 음성으로 변환하는 기술 |
| Vocoder | 음향 특성(멜 스펙트로그램 등)을 음성 파형으로 변환하는 모델 |
| Mel spectrogram | 인간 청각 특성을 반영한 주파수 표현. TTS 모델의 중간 표현으로 널리 사용 |
| Prosody | 운율. 높낮이(pitch), 길이(duration), 세기(energy)를 포함 |
| G2P | Grapheme-to-Phoneme. 문자열을 발음 기호로 변환 |
| Forced alignment | 음성과 텍스트의 시간축 정렬. 학습 데이터 생성에 사용 |
데이터 관련
| 용어 | 정의 |
|---|
| Utterance | 하나의 발화 단위 (문장 또는 구) |
| Speaker | 화자. 고유 코드로 식별 |
| Transcript | 전사. 음성의 텍스트 표현 |
| Clipping | 오디오 신호가 최대값을 초과하여 잘리는 현상 |
하네스 관련
| 용어 | 정의 |
|---|
| Skill | 스킬. AI 에이전트가 따르는 업무 정의 (SKILL.md) |
| Harness | 하네스. 이 레포지토리 전체를 지칭. 스킬+지식+도구의 통합 플랫폼 |
| RAG pattern | wiki/INDEX.md를 통해 필요한 문서만 선택적으로 읽는 패턴 |
이 wiki 는 ttslab-harness GitHub Wiki 의 스냅샷입니다. 작성 규칙·원칙은 harness 의 룰을 따르며, 새 페이지 또는 편집은 GitHub 에서 직접 하거나 harness skill 을 통해 수행해주세요.