컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Saturday, November 25, 2006

Java/자바] 일본어 Shift-JIS 파일을, 유니코드(UTF-8)로 변환 프로그램


일본어 Shift-JIS 인코딩의 텍스트 파일을, "UTF-8 유니코드"로 변환하는 간단한 프로그램입니다.

명령행 옵션으로 일본어 파일명을 입력해 주면, 그 파일명의 끝에 .uni 라는 확장자를 덧붙여 유니코드 파일을 새로이 생성합니다.

즉, 유니코드(UTF-8)로 "Save As (새 이름으로 저장)"가 되는 것입니다.


Shift-JIS 인코딩(Encoding) 파일을, UTF-8로 변환(Conversion) 저장


소스 파일명: Foo.java
※ 아래 박스 클릭 후, 키보드 화살표 키로 좌우 스크롤 가능함
import java.io.*;

public class Foo {
  public static void main(String[] args) {

    if (args.length == 0) {                   // args.length 는 옵션 개수
      System.err.println("Input Filename...");
      System.exit(1);                         // 읽을 파일명을 주지 않았을 때는 종료
    }

    String outFilename = args[0] + ".uni";    // 출력 파일명 만들기, uni 라는 확장자를 붙여서


    try {
      ////////////////////////////////////////////////////////////////
      BufferedReader in = new BufferedReader(
                                             new InputStreamReader(
                                                                   new FileInputStream(args[0]),
                                                                   "Shift-JIS"
                                                                   )
                                             );

      BufferedWriter out = new BufferedWriter(
                                              new OutputStreamWriter(
                                                                     new FileOutputStream(outFilename),
                                                                     "UTF-8"
                                                                     )
                                              );


      String s;

      while ((s = in.readLine()) != null) {
        out.write(s); out.newLine();
      }

      in.close(); out.close();
      ////////////////////////////////////////////////////////////////
    } catch (IOException e) {
        System.err.println(e); // 에러가 있다면 메시지 출력
        System.exit(1);
    }

  }
}



컴파일 및 실행하기:
D:\Z>javac Foo.java

D:\Z>java Foo Shift-JIS.txt

D:\Z>


Shift-JIS.txt 라는 샘플 파일을 명령행 옵션으로 붙여 실행하면, "Shift-JIS.txt.uni" 라는 새 이름의 유니코드(UTF-8) 파일이 "현재 디렉토리"에 만들어집니다. (▶▶ 일본어 Shift-JIS / EUC-JP 텍스트 파일 샘플; Japanese Text File Example 참고)




tag: java
자바 | Java

0 Comments:

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top