컴퓨터 엑셀 워드 포토샵 구글어스 WINDOWS JAVASCRIPT JAVA C++

 
Wednesday, December 13, 2006

텍스트 브라우저, 리눅스/윈도우용; Text Browse LYNX


리눅스에는 lynx 라는 명령어가 있는데, 이것이 바로 "텍스트 브라우저(Text Only Browse)"입니다. 그림은 전혀 나오지 않고 글자만으로 웹서핑(?)을 하는 것입니다.

윈도우에서도 Cygwin(시그윈)을 설치할 때, 설치 패키지 선택에서 lynx 를 추가 선택하면, 사용할 수 있습니다.


lynx 의 용도


* 검색엔진은, lynx 처럼 텍스트만 볼 수 있습니다. 따라서 자신의 사이트가 검색엔진의 입장에서는 어떻게 보이는지 테스트할 때 사용할 수 있습니다.

* 사이트의 링크 구조 등을 분석할 때도 쓸 수 있습니다.

* 아래 예제와 같이 -dump 옵션을 사용하면, 웹페이지의 글자들을 텍스트 모드 화면에 출력할 수 있습니다.


lynx 로, 야후 코리아 메인 페이지 텍스트를, 화면에 출력한 결과:


D:\Z>lynx -dump http://kr.yahoo.com/

   [1]야후!를 시작페이지로l[2]인터넷 익스플로러7 다운로드 [3]야후! 툴바
   긴급 공지 사항

     * [4]거기
     * [5]야미
     * [6]이미지
     * [7]지식
     * [8]사전
     * [9]뉴스
     * [10]쇼핑

   검색 : ____________________ [b_sch1024.gif]-Submit

   [11]찾기

   IFRAME: [12]about:blank

   IFRAME: [13]ACIframe

   [14]인기검색어
          [15]이하늘 옛
          · [16]햄버거 마술
          · [17]골든글러브 수상자
          · [18]미스 프랑스

   [19]좁은 폭 페이지로

색상:

    1. [20]파랑
    2. [21]살구
    3. [22]보라
    4. [23]초록
    5. [24]카키
    6. [25]실버

   [26]변경
          [27]거기
          [28]게임
          [29]금융
          [30]꾸러기
          [31]모바일 문자
          [32]부동산
          [33]여행
          [34]영
          [35]운세
          [36]자동차
          [37]재미존
          [38]지도
          [39]클럽
          [40]틴
          [41]VOD



lynx -dump http://kr.yahoo.com/ > out.txt

이렇게 재지향(Redirection)을 하면, 웹페이지의 텍스트를 파일로 저장할 수 있습니다.


그런데 한글이 깨지는 경우가 많습니다. 특히 UTF-8일 경우에는 더욱 그렇더군요.


☞ 리눅스(Linux)/유닉스(Unix)/시그윈(Cygwin)

1 Comments:
At July 20, 2014 at 1:27 PM, Blogger  BlueBreeze said...

데비안/우분투 기본 브라우즈 변경 http://bluebreeze.co.kr/692

 

Post a Comment

<< Home RSS 2.0 feed

구글 Google 에서 제공하는 무료 블로그 서비스인 블로거 Blogger 의 인터넷 주소는 www.blogger.com 입니다. Blogger 에 블로그를 만들면, blogspot.com 이라는 주소에 블로그가 생성됩니다.
블로그를 직접 방문하지 않고도 최신 게시물을 구독하려면 RSS 2.0 feed 주소를 리더기에 등록하시면 됩니다.
Previous Posts
Monthly Archives
Top