Smartmontools: erinevus redaktsioonide vahel

Allikas: Kuutõrvaja
Mine navigeerimisribaleMine otsikasti
Imre (arutelu | kaastöö)
Jj (arutelu | kaastöö)
 
(ei näidata 2 kasutaja 55 vahepealset redaktsiooni)
2. rida: 2. rida:


Kaasaegsed kõvakettad sisaldavad vahendeid nende seisundi jälgimiseks ning testimiseks. Tarkvara Smartmontools abil saab neid vahendeid kasutada. Tundub, et Smartmontools reeglina töötab hästi igasuguste IDA ja SATA ketastega.
Kaasaegsed kõvakettad sisaldavad vahendeid nende seisundi jälgimiseks ning testimiseks. Tarkvara Smartmontools abil saab neid vahendeid kasutada. Tundub, et Smartmontools reeglina töötab hästi igasuguste IDA ja SATA ketastega.
S.M.A.R.T on Self Monitoring Analysis And Reporting Technology ehk enesejälgimis-, analüüsi- ja teavitamistehnoloogia. SMART-i toetavad kõik uuemad kõvakettad ja see lubab varakult kõvaketta vigade kohta infot saada.


===Tarkvara paigaldamine===
===Tarkvara paigaldamine===
Smartmontools on portitud kõigile levinuimaile operatsioonisüsteemile


Kõige sobivam oleks Smartmontools paigaldada operatsioonisüsteemi paketihalduse vahendite abil, nt öeldes Debiani puhul
Kõige sobivam oleks Smartmontools paigaldada operatsioonisüsteemi paketihalduse vahendite abil, nt öeldes Debiani puhul
9. rida: 13. rida:
   # apt-get install smartmontools
   # apt-get install smartmontools


FreeBSD's asub tarkvara portsude kataloogis /usr/ports/sysutils/smartmontools
FreeBSD's asub ta portsude kataloogis /usr/ports/sysutils/smartmontools


===Kasutamine===
===Kasutamine===


IDE kõvaketta oleku ja SMART info vaatamiseks tuleb öelda esmalt
Kõvaketta oleku vaatamiseks tuleb öelda


  # smartctl -s on /dev/hda
# '''smartctl -a /dev/ad1'''
 
smartctl 5.40 2010-10-16 r3189 [FreeBSD 8.1-RELEASE amd64] (local build)
FreeBSD's näiteks
  Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
 
  # /usr/local/sbin/smartctl -a /dev/da0
 
  === START OF INFORMATION SECTION ===
  === START OF INFORMATION SECTION ===
  Model Family:    Seagate Barracuda 7200.9 family
  Model Family:    HP 1TB SATA disk GB1000EAFJL
  Device Model:    ST3160811AS
  Device Model:    GB1000EAFJL
  Serial Number:    5PT0HAHX
  Serial Number:    9QJ28SY7
  Firmware Version: 3.AAE
  Firmware Version: HPG6
  User Capacity:    160,041,885,696 bytes
  User Capacity:    1,000,204,886,016 bytes
  Device is:        In smartctl database [for details use: -P show]
  Device is:        In smartctl database [for details use: -P show]
  ATA Version is:  7
  ATA Version is:  7
  ATA Standard is:  Exact ATA specification draft version not indicated
  ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 4a
  Local Time is:    Fri Jan 23 14:01:38 2009 EET
  Local Time is:    Mon Oct 25 12:57:25 2010 EEST
  SMART support is: Available - device has SMART capability.
  SMART support is: Available - device has SMART capability.
  SMART support is: Disabled
  SMART support is: Enabled
 
Jne...käsk väljastab mitme ekraani jagu infot. Tähelepanu tasuks sealt pöörata eriti järgnevale tabelile
 
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x000f  072  063  044    Pre-fail  Always      -      73543954
  3 Spin_Up_Time            0x0003  099  098  000    Pre-fail  Always      -      0
  4 Start_Stop_Count        0x0032  100  100  020    Old_age  Always      -      96
  5 Reallocated_Sector_Ct  0x0033  100  100  036    Pre-fail  Always      -      0
  7 Seek_Error_Rate        0x000f  076  075  030    Pre-fail  Always      -      26085343809
  9 Power_On_Hours          0x0032  087  087  000    Old_age  Always      -      11581
  10 Spin_Retry_Count        0x0013  100  100  097    Pre-fail  Always      -      0
  12 Power_Cycle_Count      0x0032  100  037  020    Old_age  Always      -      64
184 End-to-End_Error        0x0033  100  100  003    Pre-fail  Always      -      0
187 Reported_Uncorrect      0x0032  097  097  000    Old_age  Always      -      3
188 Command_Timeout        0x0032  096  096  000    Old_age  Always      -      17180131335
189 High_Fly_Writes        0x003a  100  100  000    Old_age  Always      -      0
190 Airflow_Temperature_Cel 0x0022  060  053  045    Old_age  Always      -      40 (Min/Max  18/42)
194 Temperature_Celsius    0x0022  040  047  000    Old_age  Always      -      40 (0 17 0 0)
195 Hardware_ECC_Recovered  0x001a  033  010  000    Old_age  Always      -      73543954
196 Reallocated_Event_Count 0x0033  100  100  036    Pre-fail  Always      -      0
197 Current_Pending_Sector  0x0012  100  100  000    Old_age  Always      -      3
198 Offline_Uncorrectable  0x0010  100  100  000    Old_age  Offline      -      0
199 UDMA_CRC_Error_Count    0x003e  200  200  000    Old_age  Always      -      0
 
Esimesena tasuks siit tabelist vaadelda mis väärtusi omavad '''Reallocated_Sector_Ct''' ja '''Offline_Uncorrectable'''  Esimene neist tähendab, et mingi sektor on osutunud vigaseks (bad sector) ja parandatud ehk reallocated ümber varusektorile, et kasutada seda viga saanud asemel. Enamusel tänapäeva ketastel on varu sektoreid sellise liigutuse tarvis. Seega paar viga ei pruugi olla veel katastroof. Peamine, et ei ületaks THRESH või WORST väärust ning ei kasvaks liiga kiirelt. Viimasel juhul tuleks ketas kiiremas korras käigust võtta ning kõik sealne info varundada. Offline_Uncorrectable tähendab mitu korda on kõvaketta tarkvara üritanud sektorit parandada kuid selle käigus läbi kukkunud. Uuema tarkvaraga kettaid saab sundida neid sektoreid uuesti üle vaatama ja parandama käsuga.
   
   
# smartctl -t offline /dev/hda
Current_Pending_Sectors ja Offline_Uncorrectable attributes näitab numbrit mitu sektorit on osutnud loetamatuks, kuid ketta tarkvara pole neid veel asendanud varusektoritega, sest on tõenäoline, et info muutub loetavaks hiljem või info läheb ülekirjutamisele. Kui kumbagi neist ei juhtu siis ketas asendab sektorid varusektoriga. Ehk nad võivad liigituda nii normaalseks, töötavaks, sektoriks kui vigaseks.
Samuti tuleks hoida silma peal SMART error logil, ega seal vigu pole esinenud.
Kui teatatakse
  SMART Disabled. Use option -s with argument 'on' to enable it.
  SMART Disabled. Use option -s with argument 'on' to enable it.


Kui teatatakse viimast teadet on soovitatav SMART soovitatud meetodil lubada
Oleks soovitatav lisada käsule SMARTi lubamine.
 
  # smartctl -s on -a /dev/sda
 
Seda, et kas kõvaketas üldse toetab SMARTI saab kontrollida
 
# smartctl -i /dev/sda


ning seejärel
Smardi eelnevate errorite logi vaatamiseks


  # smartctl -a /dev/hda
# '''smartctl -l error /dev/ada0'''
smartctl 5.41 2011-06-09 r3365 [FreeBSD 9.0-RC1 amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
No Errors Logged


SATA kõvaketta oleku vaatamiseks tuleb öelda
Kettatüübi täpsemaks määratlemiseks tuleb anda -d võti ja selle järele ata, scsi, 3ware, hpt, cciss.


  # smartctl -s on -d ata /dev/sda
Lühikese kettatesti tegemiseks
  # smartctl -a -d ata /dev/sda


Täismahus test
# smartctl -t short /dev/sda


  #smartctl -t long -s on /dev/ad12
Täismahus testi tegemiseks tuleb sisestada käsk
 
  # '''smartctl -t long /dev/ad1'''
  smartctl 5.39 2009-12-09 r2995 [FreeBSD 7.2-STABLE amd64] (local build)
  smartctl 5.39 2009-12-09 r2995 [FreeBSD 7.2-STABLE amd64] (local build)
  Copyright (C) 2002-9 by Bruce Allen, http://smartmontools.sourceforge.net
  Copyright (C) 2002-9 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.
   
   
  === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
  === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
65. rida: 112. rida:
  Use smartctl -X to abort test.
  Use smartctl -X to abort test.


Võimalik on startida ka smartmontool deemonina ,et pidevalt olla
Mis käivitab viidatud kõvaketta sisemised teksti (self-test), test võib aega võtta mitmeid tunde sest ketta tarkvara loeb aegamööda läbi kõik ketta sektorid. Arvuti enda CPUd see test ei koorma.
kursis ketaste seisukorraga. FreeBSD's asub näiteseadistusfail
Tulemusi on näha self-test logis '-l selftest' võtme abil, kui test on oma töö lõpetanud.
 
# '''smartctl -l selftest /dev/ad1'''
smartctl 5.40 2010-10-16 r3189 [FreeBSD 8.1-RELEASE amd64] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 90%    11581        -
 
Käsk
 
# '''smartctl --smart=on --offlineauto=on --saveauto=on /dev/hda'''
 
Lubab SMARTi kettal /dev/hda, lubab automaatse offline testimise iga nelja tunni järel ja
SMART atribuutide automaatse salvestamise.
 
===Smartd===
 
Võimalik on startida ka smartmontool deemonina (smatd) ,et pidevalt olla
kursis ketaste seisukorraga.  
 
Debian
 
*Tuleb muuta /etc/default/smartmontools faili.
*Konfiguratsioon asub: /etc/smartd.conf
*Startimiseks/stopimiseks: /etc/init.d/smartmontools start | stop
 
FreeBSD
 
*Faili /etc/rc.conf tuleb lisada  smartd_enable=”YES"
*Konfiguratsioonifail asub: /usr/local/etc/smartd.conf.sample mis tuleks nimetada ümber smartd.conf'iks
*Käivitamiseks ja seiskamiseks käsk: /usr/local/etc/rc.d/smartd.sh start | stop
*deemoni binaarfail /usr/local/sbin/smartd
 
Näiteseadistus, montoorime serveri ketast nimega sda:
 
/dev/sda -a -d sat -m user@domain.tld


/usr/local/etc/smartd.conf.sample mis tuleks
The -a option will do most of the basic monitoring for you, the -d specifies the device type (in my case a SATA disk) and the -m is to tell smartd to email me any issues it may find regarding this disk.
nimetada ümber smartd.conf'iks ja deemoni binaarfail /usr/local/sbin/smartd


Et teenus starditaks juba boodil tuleb anda käsk
A very silent check.  Only report SMART health status if it fails But send an email in this case


  echo 'smartd_enable="YES"' >> /etc/rc.conf
  /dev/hda -H -C 0 -U 0 -m admin@example.com


===Kasulikud lisamaterjalid===
===Kasulikud lisamaterjalid===


* http://smartmontools.sourceforge.net/man/smartctl.8.html
* http://nongnu.uib.no/hddtemp/hddtemp.db
* http://nongnu.uib.no/hddtemp/hddtemp.db
* http://en.wikipedia.org/wiki/S.M.A.R.T. Mis on smart ja selle parameetrid
* http://smartmontools.sourceforge.net/badblockhowto.html
* http://www.technutopia.com/forum/showthread.php?t=1266
* http://hdrecover.sourceforge.net/
* http://gsmartcontrol.berlios.de/home/index.php/en/Home graafiline liides
* http://www.cyberciti.biz/tips/monitoring-hard-disk-health-with-smartd-under-linux-or-unix-operating-systems.html
* http://sourceforge.net/apps/trac/smartmontools/wiki/Supported_RAID-Controllers FreeBSD smartmontools ja raidikaardid
* http://hwraid.le-vert.net/wiki/DebianPackages

Viimane redaktsioon: 2. oktoober 2012, kell 09:04

Sissejuhatus

Kaasaegsed kõvakettad sisaldavad vahendeid nende seisundi jälgimiseks ning testimiseks. Tarkvara Smartmontools abil saab neid vahendeid kasutada. Tundub, et Smartmontools reeglina töötab hästi igasuguste IDA ja SATA ketastega.

S.M.A.R.T on Self Monitoring Analysis And Reporting Technology ehk enesejälgimis-, analüüsi- ja teavitamistehnoloogia. SMART-i toetavad kõik uuemad kõvakettad ja see lubab varakult kõvaketta vigade kohta infot saada.

Tarkvara paigaldamine

Smartmontools on portitud kõigile levinuimaile operatsioonisüsteemile

Kõige sobivam oleks Smartmontools paigaldada operatsioonisüsteemi paketihalduse vahendite abil, nt öeldes Debiani puhul

 # apt-get install smartmontools

FreeBSD's asub ta portsude kataloogis /usr/ports/sysutils/smartmontools

Kasutamine

Kõvaketta oleku vaatamiseks tuleb öelda

# smartctl -a /dev/ad1
smartctl 5.40 2010-10-16 r3189 [FreeBSD 8.1-RELEASE amd64] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     HP 1TB SATA disk GB1000EAFJL
Device Model:     GB1000EAFJL
Serial Number:    9QJ28SY7
Firmware Version: HPG6
User Capacity:    1,000,204,886,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 4a
Local Time is:    Mon Oct 25 12:57:25 2010 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Jne...käsk väljastab mitme ekraani jagu infot. Tähelepanu tasuks sealt pöörata eriti järgnevale tabelile

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   072   063   044    Pre-fail  Always       -       73543954
  3 Spin_Up_Time            0x0003   099   098   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       96
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   076   075   030    Pre-fail  Always       -       26085343809
  9 Power_On_Hours          0x0032   087   087   000    Old_age   Always       -       11581
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       64
184 End-to-End_Error        0x0033   100   100   003    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   097   097   000    Old_age   Always       -       3
188 Command_Timeout         0x0032   096   096   000    Old_age   Always       -       17180131335
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   060   053   045    Old_age   Always       -       40 (Min/Max  18/42) 
194 Temperature_Celsius     0x0022   040   047   000    Old_age   Always       -       40 (0 17 0 0)
195 Hardware_ECC_Recovered  0x001a   033   010   000    Old_age   Always       -       73543954
196 Reallocated_Event_Count 0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

Esimesena tasuks siit tabelist vaadelda mis väärtusi omavad Reallocated_Sector_Ct ja Offline_Uncorrectable Esimene neist tähendab, et mingi sektor on osutunud vigaseks (bad sector) ja parandatud ehk reallocated ümber varusektorile, et kasutada seda viga saanud asemel. Enamusel tänapäeva ketastel on varu sektoreid sellise liigutuse tarvis. Seega paar viga ei pruugi olla veel katastroof. Peamine, et ei ületaks THRESH või WORST väärust ning ei kasvaks liiga kiirelt. Viimasel juhul tuleks ketas kiiremas korras käigust võtta ning kõik sealne info varundada. Offline_Uncorrectable tähendab mitu korda on kõvaketta tarkvara üritanud sektorit parandada kuid selle käigus läbi kukkunud. Uuema tarkvaraga kettaid saab sundida neid sektoreid uuesti üle vaatama ja parandama käsuga.

# smartctl -t offline /dev/hda

Current_Pending_Sectors ja Offline_Uncorrectable attributes näitab numbrit mitu sektorit on osutnud loetamatuks, kuid ketta tarkvara pole neid veel asendanud varusektoritega, sest on tõenäoline, et info muutub loetavaks hiljem või info läheb ülekirjutamisele. Kui kumbagi neist ei juhtu siis ketas asendab sektorid varusektoriga. Ehk nad võivad liigituda nii normaalseks, töötavaks, sektoriks kui vigaseks.

Samuti tuleks hoida silma peal SMART error logil, ega seal vigu pole esinenud.

Kui teatatakse

SMART Disabled. Use option -s with argument 'on' to enable it.

Oleks soovitatav lisada käsule SMARTi lubamine.

 # smartctl -s on -a /dev/sda

Seda, et kas kõvaketas üldse toetab SMARTI saab kontrollida

# smartctl -i /dev/sda

Smardi eelnevate errorite logi vaatamiseks

# smartctl -l error /dev/ada0
smartctl 5.41 2011-06-09 r3365 [FreeBSD 9.0-RC1 amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
No Errors Logged

Kettatüübi täpsemaks määratlemiseks tuleb anda -d võti ja selle järele ata, scsi, 3ware, hpt, cciss.

Lühikese kettatesti tegemiseks

# smartctl -t short /dev/sda

Täismahus testi tegemiseks tuleb sisestada käsk

# smartctl -t long /dev/ad1
smartctl 5.39 2009-12-09 r2995 [FreeBSD 7.2-STABLE amd64] (local build)
Copyright (C) 2002-9 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 100 minutes for test to complete.
Test will complete after Fri Mar 19 17:54:17 2010

Use smartctl -X to abort test.

Mis käivitab viidatud kõvaketta sisemised teksti (self-test), test võib aega võtta mitmeid tunde sest ketta tarkvara loeb aegamööda läbi kõik ketta sektorid. Arvuti enda CPUd see test ei koorma. Tulemusi on näha self-test logis '-l selftest' võtme abil, kui test on oma töö lõpetanud.

# smartctl -l selftest /dev/ad1
smartctl 5.40 2010-10-16 r3189 [FreeBSD 8.1-RELEASE amd64] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 90%     11581         -

Käsk

# smartctl --smart=on --offlineauto=on --saveauto=on /dev/hda

Lubab SMARTi kettal /dev/hda, lubab automaatse offline testimise iga nelja tunni järel ja SMART atribuutide automaatse salvestamise.

Smartd

Võimalik on startida ka smartmontool deemonina (smatd) ,et pidevalt olla kursis ketaste seisukorraga.

Debian

  • Tuleb muuta /etc/default/smartmontools faili.
  • Konfiguratsioon asub: /etc/smartd.conf
  • Startimiseks/stopimiseks: /etc/init.d/smartmontools start | stop

FreeBSD

  • Faili /etc/rc.conf tuleb lisada smartd_enable=”YES"
  • Konfiguratsioonifail asub: /usr/local/etc/smartd.conf.sample mis tuleks nimetada ümber smartd.conf'iks
  • Käivitamiseks ja seiskamiseks käsk: /usr/local/etc/rc.d/smartd.sh start | stop
  • deemoni binaarfail /usr/local/sbin/smartd

Näiteseadistus, montoorime serveri ketast nimega sda:

/dev/sda -a -d sat -m user@domain.tld

The -a option will do most of the basic monitoring for you, the -d specifies the device type (in my case a SATA disk) and the -m is to tell smartd to email me any issues it may find regarding this disk.

A very silent check. Only report SMART health status if it fails But send an email in this case

/dev/hda -H -C 0 -U 0 -m admin@example.com

Kasulikud lisamaterjalid