Monday, March 04, 2013

하드디스크 SMART 상태, 명령프롬프트에서 상세히 출력 프로그램; HDD 수명 체크 S.M.A.R.T. Monitoring Tools

하드디스크의 남은 수명을 예측하거나 에러 여부 등을 알기 위해서는 스마트(S.M.A.R.T.) 정보가 필요합니다. "Self-Monitoring, Analysis and Reporting Technology"의 약자입니다.

GUI가 아닌 커맨드라인 즉 CMD 명령프롬프트에서 하드의 스마트 정보를 보는 "S.M.A.R.T. Monitoring Tools"라는 프로그램이 있더군요. 무료이고 출력 정보도 대단히 상세합니다.

옵션이 많지만

smartctl.exe -x c:

이렇게 실행하면 다음과 같이 출력됩니다.

첫부분은 하드의 물리적 스펙이고, "Raw_Read_Error_Rate..." 항목부터 본격적인 스마트 정보입니다.

D:\X>smartctl.exe -x c:

smartctl 6.1 2013-03-16 r3800 [i686-w64-mingw32-xp-sp3] (sf-6.1-2)
Copyright (C) 2002-13, Bruce Allen, Christian Franke,

Model Family:     Western Digital Caviar Black
Device Model:     WDC WD1002FAEX-00Y9A0
Serial Number:    WD-WCAW********
LU WWN Device Id: 5 0014ee 205fd9b53
Firmware Version: 05.01D05
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jun 14 14:35:50 2013
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM level is:     254 (maximum performance), recommended: 128
APM feature is:   Unavailable
Rd look-ahead is: Enabled
Write cache is:   Enabled
ATA Security is:  Disabled, frozen [SEC2]

SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (16800) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 173) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x3035) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     POSR-K   200   200   051    -    6
  3 Spin_Up_Time            POS--K   173   173   021    -    4308
  4 Start_Stop_Count        -O--CK   099   099   000    -    1761
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
  9 Power_On_Hours          -O--CK   091   091   000    -    7077
 10 Spin_Retry_Count        -O--CK   100   100   000    -    0
 11 Calibration_Retry_Count -O--CK   100   100   000    -    0
 12 Power_Cycle_Count       -O--CK   099   099   000    -    1759
192 Power-Off_Retract_Count -O--CK   200   200   000    -    14
193 Load_Cycle_Count        -O--CK   200   200   000    -    1746
194 Temperature_Celsius     -O---K   104   099   000    -    43
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    0
198 Offline_Uncorrectable   ----CK   100   253   000    -    0
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
200 Multi_Zone_Error_Rate   ---R--   100   253   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
Address    Access  R/W   Size  Description
0x00       GPL,SL  R/O      1  Log Directory
0x01           SL  R/O      1  Summary SMART error log
0x02           SL  R/O      5  Comprehensive SMART error log
0x03       GPL     R/O      6  Ext. Comprehensive SMART error log
0x06           SL  R/O      1  SMART self-test log
0x07       GPL     R/O      1  Extended self-test log
0x09           SL  R/W      1  Selective self-test log
0x10       GPL     R/O      1  NCQ Command Error log
0x11       GPL     R/O      1  SATA Phy Event Counters
0x80-0x9f  GPL,SL  R/W     16  Host vendor specific log
0xa0-0xa7  GPL,SL  VS      16  Device vendor specific log
0xa8-0xb5  GPL,SL  VS       1  Device vendor specific log
0xb6       GPL     VS       1  Device vendor specific log
0xb7       GPL,SL  VS       1  Device vendor specific log
0xbd       GPL,SL  VS       1  Device vendor specific log
0xc0       GPL,SL  VS       1  Device vendor specific log
0xc1       GPL     VS      24  Device vendor specific log
0xe0       GPL,SL  R/W      1  SCT Command/Status
0xe1       GPL,SL  R/W      1  SCT Data Transfer

SMART Extended Comprehensive Error Log Version: 1 (6 sectors)
Device Error Count: 1
        CR     = Command Register
        FEATR  = Features Register
        COUNT  = Count (was: Sector Count) Register
        LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
        LH     = LBA High (was: Cylinder High) Register    ]   LBA
        LM     = LBA Mid (was: Cylinder Low) Register      ] Register
        LL     = LBA Low (was: Sector Number) Register     ]
        DV     = Device (was: Device/Head) Register
        DC     = Device Control Register
        ER     = Error register
        ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 [0] occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  -- -- -- == -- == == == -- -- -- -- --
  04 -- 51 00 01 00 00 00 00 00 37 00 00  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  b0 00 d6 00 01 00 00 00 c2 4f be 00 00     00:00:46.851  SMART WRITE LOG
  b0 00 d5 00 20 00 00 00 c2 4f bf 00 00     00:00:46.379  SMART READ LOG
  b0 00 d6 00 01 00 00 00 c2 4f be 00 00     00:00:46.371  SMART WRITE LOG
  b0 00 d5 00 01 00 00 00 c2 4f bf 00 00     00:00:45.871  SMART READ LOG
  b0 00 d6 00 01 00 00 00 c2 4f be 00 00     00:00:45.861  SMART WRITE LOG

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1075         -
# 2  Short offline       Completed without error       00%      1075         -
# 3  Short offline       Completed without error       00%       806         -

SMART Selective self-test log data structure revision number 1
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

SCT Status Version:                  3
SCT Version (vendor specific):       258 (0x0102)
SCT Support Level:                   1
Device State:                        Active (0)
Current Temperature:                    43 Celsius
Power Cycle Min/Max Temperature:     29/43 Celsius
Lifetime    Min/Max Temperature:     29/48 Celsius
Under/Over Temperature Limit Count:   0/0
SCT Temperature History Version:     2
Temperature Sampling Period:         1 minute
Temperature Logging Interval:        1 minute
Min/Max recommended Temperature:      0/60 Celsius
Min/Max Temperature Limit:           -41/85 Celsius
Temperature History Size (Index):    478 (7)

Index    Estimated Time   Temperature Celsius
   8    2013-06-14 06:38    44  *************************
 ...    ..( 10 skipped).    ..  *************************
  19    2013-06-14 06:49    44  *************************
  20    2013-06-14 06:50    43  ************************
 ...    ..( 53 skipped).    ..  ************************
  74    2013-06-14 07:44    43  ************************
  75    2013-06-14 07:45     ?  -
  76    2013-06-14 07:46    29  **********
  77    2013-06-14 07:47    29  **********
  78    2013-06-14 07:48    30  ***********
  79    2013-06-14 07:49    31  ************
  80    2013-06-14 07:50    31  ************
  81    2013-06-14 07:51    32  *************
  82    2013-06-14 07:52    32  *************
  83    2013-06-14 07:53    33  **************
  84    2013-06-14 07:54    33  **************
  85    2013-06-14 07:55    34  ***************
  86    2013-06-14 07:56    34  ***************
  87    2013-06-14 07:57    35  ****************
 ...    ..(  2 skipped).    ..  ****************
  90    2013-06-14 08:00    35  ****************
  91    2013-06-14 08:01    36  *****************
  92    2013-06-14 08:02    36  *****************
  93    2013-06-14 08:03    37  ******************
  94    2013-06-14 08:04    37  ******************
  95    2013-06-14 08:05    37  ******************
  96    2013-06-14 08:06    38  *******************
 ...    ..(  2 skipped).    ..  *******************
  99    2013-06-14 08:09    38  *******************
 100    2013-06-14 08:10    39  ********************
 ...    ..(  4 skipped).    ..  ********************
 105    2013-06-14 08:15    39  ********************
 106    2013-06-14 08:16    40  *********************
 ...    ..( 15 skipped).    ..  *********************
 122    2013-06-14 08:32    40  *********************
 123    2013-06-14 08:33    41  **********************
 ...    ..( 18 skipped).    ..  **********************
 142    2013-06-14 08:52    41  **********************
 143    2013-06-14 08:53    42  ***********************
 ...    ..(142 skipped).    ..  ***********************
 286    2013-06-14 11:16    42  ***********************
 287    2013-06-14 11:17    43  ************************
 ...    ..( 19 skipped).    ..  ************************
 307    2013-06-14 11:37    43  ************************
 308    2013-06-14 11:38    39  ********************
 309    2013-06-14 11:39    39  ********************
 310    2013-06-14 11:40    40  *********************
 ...    ..( 11 skipped).    ..  *********************
 322    2013-06-14 11:52    40  *********************
 323    2013-06-14 11:53    41  **********************
 ...    ..(  8 skipped).    ..  **********************
 332    2013-06-14 12:02    41  **********************
 333    2013-06-14 12:03    42  ***********************
 ...    ..( 43 skipped).    ..  ***********************
 377    2013-06-14 12:47    42  ***********************
 378    2013-06-14 12:48    43  ************************
 ...    ..( 39 skipped).    ..  ************************
 418    2013-06-14 13:28    43  ************************
 419    2013-06-14 13:29    44  *************************
 ...    ..( 65 skipped).    ..  *************************
   7    2013-06-14 14:35    44  *************************

SCT Error Recovery Control command not supported

Device Statistics (GP Log 0x04) not supported

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x0001  2            0  Command failed due to ICRC error
0x0002  2            0  R_ERR response for data FIS
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0005  2            0  R_ERR response for non-data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS
0x000a  2            1  Device-to-host register FISes sent due to a COMRESET
0x000b  2            0  CRC errors within host-to-device FIS
0x8000  4        13895  Vendor specific

하드 정보를 이렇게 디테일하게 출력하는 프로그램은 제 경험상 처음인 듯싶습니다. 공개가 아닌 유료 프로그램들도 이렇게 자세하게 나오지는 않았습니다.

하드 섭씨 온도의 시간별 그래프까지 나오는군요.

S.M.A.R.T. Monitoring Tools 의 윈도우용 6.1-2 버전 설치파일은 "smartmontools-6.1-2.win32-setup.exe" 라는 파일명으로 되어 있습니다. 64비트 윈도우용도 포함되어 있고, 리눅스 버전도 받을 수 있습니다.

S.M.A.R.T. Monitoring Tools 다운로드:

설치 프로그램에서 "Extract files only (파일을 풀기만 하기)"를 선택하면, USB메모리 등에 넣어서 다닐 수 있는 포터블(Portable) 버전이 됩니다.

그렇지만 설치된 파일들 중에서 smartctl.exe 라는 파일 하나만 있어도 잘 실행되더군요.

※ 이 글은 2013-06-14일에 작성된 것입니다.

스마트 정보만 간단하게 출력하려면
smartctl -A -f brief c:
이런 옵션을 사용하면 됩니다. -A 는 반드시 대문자여야 합니다.

다음과 같이 나옵니다.

D:\Z>smartctl -A -f brief c:
smartctl 6.1 2013-03-16 r3800 [i686-w64-mingw32-xp-sp3] (sf-6.1-2)
Copyright (C) 2002-13, Bruce Allen, Christian Franke,

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
  1 Raw_Read_Error_Rate     POSR-K   200   200   051    -    6
  3 Spin_Up_Time            POS--K   173   173   021    -    4308
  4 Start_Stop_Count        -O--CK   099   099   000    -    1762
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
  9 Power_On_Hours          -O--CK   091   091   000    -    7080
 10 Spin_Retry_Count        -O--CK   100   100   000    -    0
 11 Calibration_Retry_Count -O--CK   100   100   000    -    0
 12 Power_Cycle_Count       -O--CK   099   099   000    -    1760
192 Power-Off_Retract_Count -O--CK   200   200   000    -    14
193 Load_Cycle_Count        -O--CK   200   200   000    -    1747
194 Temperature_Celsius     -O---K   104   099   000    -    43
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    0
198 Offline_Uncorrectable   ----CK   100   253   000    -    0
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
200 Multi_Zone_Error_Rate   ---R--   100   253   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

