Oct. 21st, 2020

techquisitor: (sis)

Долго не мог понять, что за чудеса с железом. Энное количество дисков показывались в нулевом экспандере, нулевом слоте.
Выглядело всё примерно таким образом:

# sas2ircu 0 display | egrep "Enclosure|Slot|Drive Type"
  Slot                                    : 3
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD
  Enclosure #                             : 0
  Slot #                                  : 0
  Drive Type                              : SATA_HDD


В какой-то момент понял, что проблему надо решать, иначе вылетевшие диски в таких хранилках невозможно пометить для ЦОДовских дежурных. Команда locate уходила в пустоту. После некоторых изысканий наткнулся на эту цитату:

"After quite some research, it seems that the PMC-Sierra based SAS expanders list all device slot numbers as 0, and this is allowed by the SAS specification, as the other diagnostic pages and the smp discovery protocol don't claim the device has valid slot numbers. So the problem is caused by a rather buggy SAS implementation in the LSI SAS controllers, which enforce the use of slot numbers even when they don't exist, instead of using disk ids, which are unique, or another mechanism (such as sas addresses). I don't know if this is merely a user interface deficiency in tools (such as storcli) or it goes deeper. At least the disovery problems in the Perc H700 are due to a buggy implementation of sas topology discovery, which is specified by the SAS standard and does not use slot numbers. HBA drivers from LSI seem to have similar problems."

Разобрали сервер, сняли экспандер на время — оно. Контроллер был тоже от LSI, но пассивный и от шасси Supermicro. Причём соседний сервер точно таким же железом отдавал информацию через sas2iru совершенно верно.

Век живи — век учись. Я как-то даже не знал, что спецификация SAS такое допускает.

Profile

techquisitor: (Default)
techquisitor

June 2024

S M T W T F S
      1
2345678
9101112131415
161718192021 22
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 17th, 2025 06:57 am
Powered by Dreamwidth Studios