HTML 을 파싱하다보면 HTML이 euc-kr로 되어 있는 경우도 있고, utf-8로 되어 있는 경우도 있다. 개인적으로 보통 linux terminal에서 작업을 하는데 linux terminal 이 보통 utf-8로 되어 있다. 이에 따라 eucKR로 encoing된 html 파일을 받아 내용을 확인해보게 되면 한글이 잔뜩 깨져 있는 것을 볼 수 있다. [euc-kr로 인코딩된 파일을 utf-8 환경에서 열었을 경우] 이에 따라 원활한 작업을 위해서는 euc-kr 파일을 utf-8 인코딩으로 변경해주어야 할 필요가 있다. linux 에서는 iconv 명령어를 이용해 쉽게 변경할 수 있다. iconv 사용법$ iconv -f "현재인코딩포맷" -t "바꿀인코딩포맷" "원본파일이름" > "저장할파일이름..