utf-8 과 charset 에 대한 이해


컴퓨터에서

데이터를 부호화하는 것을 인코딩(encoding)이라하고

부호화된 데이터를 부호화되기 전으로 되돌리는 것을 디코딩(decoding)이라 한다.



문자, 기호, 숫자 데이터를 부호화하는 것도 인코딩이고

부호화된 문자, 기호, 숫자 데이터를 부호화되기 전으로 되돌리는 것도 디코딩이다.


지구상에는 수많은 문자와 기호가 있다. 전세계 문자와 기호를 원할하게 인코딩하는 방식이 utf-8 이다. 


위 설명으로 utf-8문자 인코딩 방식 중 하나라는 것을 이해했으리라.


예전에는 영어문자만을 위한 ASCII가 쓰였으나 ANSI, ISO-8859-1로 발전하여

현재는 전세계 문자와 기호를 인코딩하는데  utf-8 이 사용되고 있다.


그래서 html문서 작성시 head부분에 이 html문서의 문자셋(=문자집합 : character set : charset)이 utf-8로 인코딩함을 표시 한다. 


웹페이지 작성시 <meta>태그를 이용하여 아래와 같은 방법으로 charset이 utf-8을 나타낸다.

<!DOCTYPE html>
<html>
	<head>
		<meta http-equiv="content-type" content="text/html; charset=UTF-8" />
	</head>
	<body>
		<p>utf-8 과 charset에 대한 이해</p>
	</body>
</html>
utf-8로 인코딩하지 않으면 html문서를 브라우저에서 구현할때 글자가 깨져보이는 현상이 발생할 수 있다. 



  Comments,     Trackbacks