문자 깨짐

DnlzkWiki
(뷁어에서 넘어옴)

컴퓨터 등 IT 기기에서 문자가 올바르게 표시되지 않는 현상을 의미한다.

일본어에서는 문자 깨짐을 모지바케(文字化け, mojibake)라고 하며 영어권에도 이 용어가 수입돼 이 현상을 그냥 mojibake라고 부른다.

원인

다른 인코딩으로 읽음

텍스트 작성에 쓰인 문자 인코딩과 텍스트를 열 때의 문자 인코딩이 다른 경우이다. 예시로 EUC-KR(또는 CP949)로 작성된 텍스트를 Windows-1252로 열었을 경우, 또는 Shift_JIS로 작성된 텍스트를 CP949로 열었을 경우 등이 있다.

문자가 깨지면서 출력되는 획수가 많은 확장완성형 한글이 과거 유행어였던 뷁을 연상시켜 이를 인터넷 속어로 뷁어라고 부르기도 하는데, 뷁의 어원이 'break it'이란 걸 생각해보면 의미까지 적절한 번역인 셈이다. 인터넷에 돌아다니는 뷁어 번역기들의 원리는 간단하게 말하자면 CP949로 잘못 인코딩된 텍스트를 Shift_JIS로 재변환하는 것이다. 실제 변환 예시는 문자 깨짐/뷁어 테이블 문서를 참조 바란다.

같은 언어라고 해도 인코딩 체계가 다르면 역시 깨진다. MS-DOS 시절 한글 BIOS를 적용한 한글 DOS를 쓰면서 조합형을 완성형으로 변환하거나, 그 반대의 경우를 해봤다면 알 것이다.

가지고 놀아보기 : 실험

  • ASCII ↔ 7비트 2바이트 완성형 한글 코드(일명 청계천 한글)
    • dBase ↔ 늦ase
  • ASCII(cp437) ↔ 8비트 2바이트 완성형 한글 코드(cp949)
    • ┌──────────┐ ↔ 旼컴컴컴컴커
    • └──────────┘ ↔ 읕컴컴컴컴켸
  • Shift_JIS ↔ CP949
    • こんにちは ↔ 궞귪궸궭궼
    • ソウル → ?긂깑
    • Ryu☆ ↔ Ryu걲
    • 冥 ↔ 뼸
    • 特訓 ↔ 벫똏
    • 東方 ↔ 뱦뺴
    • 猫叉Master ↔ 봍뜵Master
      • 猫叉王子 ↔ 봍뜵돞럔
    • 斬る·ビル ↔ 럂귡긮깑
    • 音楽 ↔ 돶뒁
    • 桜 ↔ 랎
    • V ↔ 놶
    • 誹 ↔ 뷁
    • 力 ↔ 쀍
    • しょぼんのアクション ↔ 궢귛귍귪궻귺긏긘깈깛
    • うまぴょい伝説 ↔ 궎귏귃귛궋?먣
    • クレヨンしんちゃん ↔ 긏깒깉깛궢귪궭귗귪
    • 문자 깨짐/뷁어 테이블 참조.
  • Shift_JIS ↔ UTF-16
    • 繧ゅ⊆繧ゅ⊆縺」縺ヲ縺ェ繧薙〒縺吶° ↔ もぺもぺってなんですか
  • EUC-CN ↔ EUC-KR/CP949
    • 猫叉Master ↔ 챔꿩Master
    • 火龙 ↔ 삽질
    • 首尔 ↔ 看랑
    • 魂斗罗 ↔ 산떱쭈
    • 东京热 ↔ 땜쑴훑
    • 法拉利赛车 ↔ 랬윗적힙났
    • 七彩龙 ↔ 폄꽈질
    • 高尔夫球 ↔ 멕랑뤼헷
    • 究极虎 ↔ 씩썜빪
    • 埃及 ↔ 간섟
    • 目标地球 ↔ 커깃뒈헷
    • 机器人格罗 ↔ 샙포훙목쭈
    • 疯狂大脚 ↔ 룩욺댕신
    • 宾果 ↔ 깟벎
    • 打气泡 ↔ 댔폭텟
    • 滑板 ↔ 뺄겼
    • 阿拉丁 3 ↔ 각윗땀 3
    • 保龄球 ↔ 괏줙헥
    • 摩艾君 ↔ 칡갔엌
    • 扑克方块 ↔ 팝옹렘욥
    • 超级玛丽 ↔ 낚섬쯔쟝
    • 忍者 ↔ 땃뎟
    • DJ 男孩 ↔ DJ 켕벗
    • 仓库番 ↔ 꾑욋랸
    • 美国大兵 ↔ 쳄벌댕깡
    • 火炮 ↔ 삽텔
    • 超级马里奥 ↔ 낚섬쯩쟁걔
    • 柏青哥 ↔ 겝행며
    • 企鹅和海豹 ↔ 폐띠뵨베괭
    • 雷鸟号 ↔ 잉쿰뵀
    • 大蜜蜂 ↔ 댕쵯룝
    • 敲冰块 ↔ 플깝욥
    • 疯狂赛车 ↔ 룩욺힙낫
    • 火鸡 ↔ 삽샷
    • 金刚 ↔ 쏜먼
    • 火箭车 ↔ 삽숬낫
    • 冲击波 ↔ 녑샌꺼
    • 雷电 ↔ 잉든
    • 谍对谍 ↔ 딴뚤딴
    • 人间兵器 ↔ 훙쇌깡포
    • 恶魔城 2 ↔ 띳침냘 2
    • 间谍猎人 - ↔ 쇌딴죤훙
    • 将棋秘传 ↔ 쉥펙쵤눈
    • 比卡丘 ↔궐엥헴
    • 七宝谋奇 ↔ 펌괜캇펜
    • 崩坏3 ↔ 굼뻐3
    • 赛马娘 ↔ 힙쯩쿤
    • 米浴 ↔ 쵠棹
    • 气槽 ↔ 폭꾼
    • 马卡洛夫 ↔ 쯩엥쭤리
    • 李-恩菲尔德 ↔ 쟀-람렵랑돠
    • 利贝罗勒 ↔ 적굔쭈잇
    • 内格夫 ↔ 코목뤼
    • 布伦 ↔ 꼈쬈
    • 赫丽安 ↔ 붐쟝갛
    • 格林娜 ↔ 목주컹
    • 克鲁格 ↔ 옹쨀목
    • 诺爱尔梵蜜莉欧 ↔ 킵갖랑拗쵯쟌킹
    • 克莉尔 ↔ 옹쟌랑
    • 皮卡丘 ↔ 튄엥헴
    • 天安门广场 ↔ 莖갛쳔밤끝
    • 卑弥呼 ↔ 굅최빌
  • UTF-8 ↔ EUC-KR(cp949)
    • 全てあなたの所為です。 ↔ 押ⓦ겍徇귙겒徇잆겗偃?縯뷩겎徇쇻?
  • UTF-8 ↔ EUC-JP
    • 魔方大厦 ↔ 鬲疲婿螟ァ蜴ヲ
  • 유니코드 2.0 ↔ 북한 인코딩 (남북한 한글 코드의 충돌 문제)
    • 가꼯 괃 쟗깏좨너 혒호떄 가바 ↔ 가는 길 험난해도 웃으며 가자
    • 피카츄 라이츄 파이리 꼬부기 ↔ 쮀카똬 바풰똬 쫘풰붸 느졔궤
    • 논리적인 결론으로써 ↔ 듡붸혹풵 굵븑풔브토
    • 릴리에 ↔ 붸표
    • 정말이지 예의를 모르는 리자몽이로군 ↔ 홏삵풰훼 퓨퐤붥 스붜둱 붸하슻풰브곉
    • 뮤츠 ↔ 솨뚸
    • 나인테일 ↔ 다풵쑈풹
    • 봓쥬 ↔ 진화