본문 바로가기

Information Security/Encoding

UNICODE 1. UNICODE란? 유니코드(Unicode)는 16비트의 단일한 값으로 전세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 유니코드 협회(Unicode Consortium)가 제정하며, 최신판은 2008년 4월에 공개된 유니코드 5.1이다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다. 유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 유니코드가 다양한 문자 집합들을 통합하는 데 성공하면서 유니코드는 컴퓨터 소프트웨어의 국제화와 지역.. 더보기
Base64 1. Base64 인코딩이란? PEM(Privacy Enhancement for Internet Electronic Main) 명세서에서 처음 소개되었다.(RFC 1113, RFC 1421) 후에 MIME(Multipurpose Internet Mail Extensions) 명세서에서 다시 소개했다. (RFC 1341) Wireshark 등 툴에서 자동으로 디코딩한다. 2. 용도 - MIME(SMTP를 확장하여 오디오, 비디오, 이미지, 응용PG, 기타 데이터 파일을 주고받을 수 있도록 기능이 확장된 프로토콜)에 주로 사용된다. 3. 알고리즘 생각보다 간단하다. 우리가 한문자를 표현할때는 8bits(1byte)를 사용한다. 이를 Base64에서는 6bits를 한 글자로 표현하는 것이다. 8과 6의 최소공.. 더보기
URL Encoding 1. URL Encode/Decode란? URL로 사용하기 적합하지 문자를 %뒤에 문자의 hex코드를 붙여서 url을 변경하는 것이다. ex) likethebeginning.tistory.com like ======= 'l' -> 6C, 'i' -> 69, 'k' -> 6B, 'e' -> 65 the ======= 't' -> 74, 'h' -> 68, 'e' -> 65 beginning ===='b' -> 62, 'e' -> 65, 'g' -> 67, i -> 69 , 'n' -> 6E, 'n' -> 6E, 'i' -> 69, 'n' -> 6E, 'g'-> 67 .tistory ======= '.' -> 2E, 't' -> 74, 'i' -> 69, 's' -> 73, 't' -> 74, 'o' -> .. 더보기