3장. AI 한국어가 흐려지는 이유
AI 한국어는 표면 클리셰의 묶음으로 만들어진다. 카테고리 A(수사 클리셰)와 B(포맷 클리셰)가 그 묶음의 정체.
A. 수사 클리셰
문장 단위 수사 패턴. AI가 도입·전환·강조·마무리에 자동으로 끼워넣는다.
A.1 강조 도입어
| 패턴 | 예시 |
|---|---|
| ”핵심은 …” | 핵심은 사용자 경험입니다 |
| ”중요한 것은 …” | 중요한 것은 데이터입니다 |
| ”주목할 점은 …” | 주목할 점은 비용입니다 |
| ”한 가지 분명한 건 …” | 한 가지 분명한 건 시장이 변한다는 것입니다 |
| ”사실은 …” | 사실은 더 큰 문제가 있습니다 |
이 도입어들은 본문이 무거워 보이게 만드는 받침대다. 본문이 정말 무게 있다면 도입어가 없어도 무거움이 전달된다. 도입어가 있어야 무게가 만들어진다면, 본문에 알맹이가 없을 가능성이 크다.
처방: 강조 도입어를 모두 지우고 다음 문장만 남긴다. 의미가 같다면 도입어는 군더더기.
A.2 대조 수사
| 패턴 | 예시 |
|---|---|
| ”X가 아니라 Y” | 단순한 기능 개선이 아니라, 근본적인 재정의 |
| ”단순히 X가 아니라” | 단순히 빠른 게 아니라, 정확한 것 |
| ”이는 X의 문제가 아니라” | 이는 비용의 문제가 아니라 신뢰의 문제 |
대조 수사는 영어 “not just X but Y”의 직역이다. AI 한국어에서 가장 자주 나오는 강조 패턴.
문제는 Y가 추상명사로 채워질 때다.
나쁨: 단순한 효율성 개선이 아니라 근본적인 가치 재정립이다.
단순한 X(추상명사)가 아니라 + 근본적 Y(추상명사). 두 추상명사를 대조하면 의미가 더 흐려진다. Y가 더 무거워야 한다는 신호만 남고, Y의 정체는 여전히 모른다.
처방: Y만 단언으로 풀어 쓴다. “X가 아니라”는 보통 빼도 된다.
좋음: 가치를 다시 매겼다. (Y의 핵심을 단언으로)
A.3 정정 수사
| 패턴 | 예시 |
|---|---|
| ”정확히 말하면” | 정확히 말하면 두 가지 문제가 있다 |
| ”엄밀히 말해” | 엄밀히 말해 비용은 중요하지 않다 |
| ”사실 더 정확히는” | 사실 더 정확히는 다른 원인이다 |
정정 수사는 “앞 문장이 부정확했다”는 신호를 보낸다. AI는 자기 검열의 흔적을 글에 남긴다. 사람 글에는 거의 나오지 않는 패턴.
처방: 한 번에 정확하게 말하기. 정정 수사를 쓸 필요가 있다면 앞 문장을 다시 쓰는 것.
A.4 수렴 마무리
| 패턴 | 예시 |
|---|---|
| ”결론적으로” | 결론적으로 우리는 이 길로 가야 한다 |
| ”결국 핵심은” | 결국 핵심은 신뢰다 |
| ”정리하자면” | 정리하자면 세 가지로 요약된다 |
수렴 마무리는 본문이 이미 결론을 향해 있을 때 군더더기다. 마지막 문장은 결론임을 형식 안내 없이도 독자가 안다.
처방: 마무리 부사 삭제. 다음 문장이 결론임을 직접 말함.
A.5 메타 발화 (응답형)
| 패턴 | 예시 |
|---|---|
| ”좋은 질문입니다” | 좋은 질문입니다. 답은… |
| ”흥미로운 지점입니다” | 흥미로운 지점입니다. 한번 보면… |
| ”맞습니다, 그리고…” | 맞습니다, 그리고 거기에 더해… |
이건 챗봇 출력의 가장 분명한 흔적. 자기 발화 자체를 평가하는 메타 코멘트. 사람이 쓴 글에는 거의 없다.
B. 포맷 클리셰
문장이 아니라 출력 형식 자체에서 드러나는 AI 흔적.
B.1 콜론 제목
다음과 같습니다:
- 항목 1
- 항목 2
- 항목 3
“다음과 같이…할 수 있습니다:” 같은 콜론 제목은 AI 출력의 상징. 형식 안내가 글의 골격이 된다. 독자는 글을 읽기 전에 골격을 먼저 본다.
처방: 안내 없이 바로 본문. 또는 한 문장으로 풀어쓰기.
나쁨: 다음과 같은 세 가지 항목이 중요합니다:
- 속도
- 정확성
- 비용
좋음: 속도, 정확성, 비용 셋이 중요하다.
B.2 글머리 남용
모든 답을 불릿으로 쪼개는 경향. 특히 한 항목이 한 단어이거나 한 문장 안에 다 들어갈 만한 경우 글머리는 형식 부풀림.
처방: 정말 병렬 항목이고 길이가 비슷할 때만 글머리. 그 외에는 산문으로.
B.3 마크다운 강조 남발
한 단락에 굵게·이탤릭이 다섯 개 넘으면 강조의 의미가 사라진다. AI는 모든 핵심을 굵게 만들고 싶어한다. 결과: 모든 것이 강조되면 어떤 것도 강조되지 않음.
처방: 단락당 강조 한 개를 원칙으로.
B.4 이모지 장식
헤더와 글머리마다 이모지를 다는 패턴. 한국어 본문에 영어식 이모지 배열은 이질적이다.
처방: 의미를 더하지 않는 이모지는 빼기.
B.5 엠대시·물결표
영어 문장 부호 — 가 한국어에 그대로 들어오면 어색하다. 물결표 ~ 도 마찬가지(일부 렌더러에서 취소선으로 표시).
처방: — 는 쉼표·괄호·마침표·콜론으로. ~ 는 “에서” 또는 하이픈으로.
도구가 잡는 방식
| 카테고리 | 룰 종류 | v0.1 정확도 |
|---|---|---|
| A.1 도입어 | 정규식 사전 | 높음 |
| A.2 대조 | 패턴 매칭 (“X가 아니라 Y”) | 중간 (false positive 가능) |
| A.3 정정 | 정규식 사전 | 높음 |
| A.4 수렴 | 정규식 사전 | 높음 |
| A.5 응답 메타 | 정규식 사전 | 높음 |
| B.1 콜론 제목 | ”다음과 같” 패턴 | 높음 |
| B.2 글머리 남용 | 줄 단위 통계 | 중간 |
| B.3 강조 남발 | 단락당 ** 카운트 | 중간 |
| B.4 이모지 | 유니코드 카운트 | 높음 |
| B.5 엠대시·물결표 | 정규식 | 높음 |
A 카테고리는 룰이 잘 듣는다. B 카테고리 일부(글머리 남용·강조 남발)는 단락 단위 통계라 v0.2에서 정확도 향상 예정.