λμ§νΈ μ»΄ν¨ν°μ λ©λͺ¨λ¦¬μλ λΉνΈλ§ μ μ₯ν μ μμΌλ―λ‘ μ»΄ν¨ν°λ₯Ό μ΄μ©νμ¬ μμ νκ³ μ νλ λͺ¨λ κ²μ λΉνΈμ ννλ‘ κ΅¬μ±λμ΄ μμ΄μΌ νλ€.
μ»΄ν¨ν° μΈμμμ κ°μ₯ λ§μ΄ μ¬μ©νλ λκ°μ§ μ½λλ‘, 첫 λ²μ§Έλ 8λΉνΈ λ¨μλ‘ μ½μμ μ ν ASCII(μ΄ν μμ€ν€)μ΄κ³ , λ€λ₯Έ νλλ 16λΉνΈ λ¨μλ‘ μ½μμ μ ν Unicode(μ λμ½λ)μ΄λ€.
8λΉνΈλ 2λ₯Ό 8λ² κ³±ν 256κ°μ§ μ½μμ ν μ μκ³ , 16λΉνΈλ 2λ₯Ό 16λ² κ³±ν΄μ λμ¨ μ«μμΈ 65,536κ°μ§μ μ½μμ ν μ μλ€.
μνλ²³μ μν μ½μ.
μμ€ν€λ λ―Έκ΅νμ€ννμμ λ§λ μ½λλ‘, American Standard Code for Information Interchange(μ 보κ΅νμ μν λ―Έκ΅ νμ€ μ½μ)μ μ½μμ΄λ€. μμ€ν€μμλ μμ΄ λλ¬Έμ, μμ΄ μλ¬Έμ, μ«μ, νΉμλ¬Έμλ₯Ό 8λΉνΈ μμ μ½μνλ€.
λͺ¨λ μΈμ΄λ₯Ό μν μ½μ.
μ»΄ν¨ν°μμ μλ¬Έμλ§ μ¬μ©νλ€λ©΄ μμ€ν€λ‘λ μΆ©λΆνμ§λ§ μκ°μ΄ νλ¬ λ€λ₯Έ λλΌ μ¬λλ€λ μ¬μ©νλ€ λ³΄λ μκ΅μ΄λ₯Ό μ¬μ©νκ³ μ νλ€. μλ¬Έμ μΈμ μΈκ³ μ¬λ¬ λλΌμ λ¬Έμλ νκΈ°ν΄μΌ ν μν©μ΄ λ κ²μ΄λ€. κ·Έλμ μ λμ½λλΌλ μλ‘μ΄ μ½μμ λ§λ€μ΄ μ½μ 곡κ°μ λ λλ Έλ€.
μμ μ€λͺ ν μ λμ½λμ μ νν λͺ μΉμ UTF(Unicode Transformation Format, μ λμ½λ λ³ν μμ)μ΄λ€. μ ννκ²λ μ λμ½λλ κ΅μ νμ€ λ¬Έμνμ΄κ³ UTF-8μ μΈμ½λ© λ°©μμ μλ―Ένλ€.
16λΉνΈλ₯Ό νλμ λ¬Έμ κΈ°μ€μΌλ‘ νλ UTF-16λ μμΌλ©° κ·Έ μΈμ 32λΉνΈ 곡κ°μΌλ‘ νμ₯ν UTF-32λ μλλ° μ΄λ μΈμ΄ μΈμ μ΄λͺ¨μ§μ κ°μ νΉμκΈ°νΈλ ν¬ν¨λ μ½μμ΄λ€.
Web μΈμ½λ©μ λλΆλΆμ UTF-8μ΄ μ°¨μ§νκ³ μλ€. μ μ₯, ν΅μ μ©λμ λ―Όκ°νλ€λ©΄ UTF-8, UTF-16 μ€μμ κ³ λ―Όν΄μΌνλ€. λ¬Έμμμ λ§μ΄ μ¬μ©λ CodePointλ€μ΄ λͺ λ°μ΄νΈλ‘ ννλ μ§ κ³ λ―Ό ν κ²°μ νλ©΄ μ μ₯, ν΅μ μ©λμ μλ μ μλ€. μλ₯Ό λ€μ΄ μλ¬ΈμΌλ‘ κ°λμ°¬ λ¬Έμμ κ²½μ° UTF-8λ‘ νννλ©΄ λλΆλΆ 1 byteλ‘ ννλκ³ UTF-16μΌλ‘ νννλ©΄ 2 byteλ‘ ννλλ UTF-8μ΄ μ 리νκ³ , νκΈμ κ²½μ° UTF-8μ 3 byte, UTF-16μ 2 byteλ‘ ννλλ UTF-16μ΄ μ 리νλ€.
π‘ μΈμ½λ©(Encoding)? μ¬λμ μΈμ΄λ₯Ό μ»΄ν¨ν° μΈμ΄λ‘ λ°κΎΈλ κ³Όμ μ μΈμ½λ©(Encoding), κ·Έ λ°λ κ³Όμ μ λμ½λ©(Decoding)μ΄λΌκ³ νλ€.
-
μ°Έμ‘°
https://ko.wikipedia.org/wiki/UTF-8
https://jeongdowon.medium.com/unicodeμ-utf-8-κ°λ¨ν-μ΄ν΄νκΈ°-b6aa3f7edf96
https://pickykang.tistory.com/13
<Do it! 첫 μ½λ© with μλ°> μ λκ· μ .