컴퓨터 엑셀 워드 포토숍 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Previous Post Java/자바] 한글 확장 완성형; MS949 / cp949 인코딩(Encoding) 문제...Java/자바] 일본어 Shift-JIS 파일을, 유니코드(UTF-8)로 변환 프로그램일본어 Shift-JIS / EUC-JP 텍스트 파일 예제; Japanese Text Fi...도스용 V3.EXE 실행 배치파일; 도스창에서 백신III 실행 DOS BATeuc-kr(한글 완성형)문서 파일을, UTF-8 유니코드로 변환 방법; ANSI to U...Java/자바] 숫자(정수;int) 배열, 순서 거꾸로 뒤집기/역전시키기; Reverse ...Java/자바] 문자열 배열 요소 순서, 거꾸로(역순으로) 변환; Reverse Strin...Java/자바] 문자열 거꾸로 뒤집기; 글자 순서 반대로 Reverse StringVIM (VI, GVIM) 빔 에디터, 종료 명령어, 빠져 나오는 법; Exit QuitJava/자바] 배열 요소 추가 / 배열 크기 늘리기; Array Resize; Dynam...

Java/자바] 한글 euc-kr (MS949) 파일을, 유니코드(UTF-8)로 변환 프로그램

Saturday, November 25, 2006

현재 운영체제(OS)의 언어에 상관없이, "한글 확장완성형" 인코딩의 파일을 "유니코드(UTF-8)"로 변환하는 프로그램입니다.



한국어(EUC)를 유니코드(UTF-8)로 변환


소스 파일명: Foo.java
import java.io.*;

public class Foo {
  public static void main(String[] args) {

    if (args.length == 0) {                   // args.length 는 옵션 개수
      System.err.println("Input Filename...");
      System.exit(1);                         // 읽을 파일명을 주지 않았을 때는 종료
    }

    String outFilename = args[0] + ".uni";    // 출력 파일명 만들기, uni 라는 확장자를 붙여서


    try {
      ////////////////////////////////////////////////////////////////
      BufferedReader in = new BufferedReader(
                                             new InputStreamReader(
                                                                   new FileInputStream(args[0]),
                                                                   "MS949"
                                                                   )
                                             );

      BufferedWriter out = new BufferedWriter(
                                              new OutputStreamWriter(
                                                                     new FileOutputStream(outFilename),
                                                                     "UTF-8"
                                                                     )
                                              );


      String s;

      while ((s = in.readLine()) != null) {
        out.write(s); out.newLine();
      }

      in.close(); out.close();
      ////////////////////////////////////////////////////////////////
    } catch (IOException e) {
        System.err.println(e); // 에러가 있다면 메시지 출력
        System.exit(1);
    }

  }
}



컴파일 한 후,
euc-kr.txt 라는 이름의 한글 파일을 옵션으로 지정하고 실행한 장면:
D:\Z>javac Foo.java

D:\Z>java Foo euc-kr.txt

D:\Z>


이제 하드의 "현재 디렉토리"에 euc-kr.txt.uni 라는 유니코드(UTF-8)파일이 생성됩니다. 원본인 euc-kr.txt 와 내용은 똑같고, 인코딩만 다릅니다.




현재 운영체제 기본 인코딩의 텍스트 파일을 유니코드(UTF-8)로 변환: ▶▶ 자바,Java] 유니코드(UTF-8)변환, KS완성형 파일을 유니코드로 바꾸기


자바에서는 MS949 라는 인코딩을 사용해야만 "똠방각하" 등이 표현됩니다: ▶▶ Java/자바] 한글 확장 완성형; MS949 / cp949 인코딩(Encoding) 문제 해결; 차이 점


☞ 자바(Java)

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Categories
Previous Posts
Monthly Archives
Top