среда, 28 июня 2017 г.

Get-StorageJob показывает задание в статусе "Suspeneded"

При работе с Storage Spaces Direct столкнулись с ситуацией, что Storage Job ушли в состояние "Suspended" и никакие действия не приводили к их реанимации. В том числе, с перемещением дисков и пула на один физический узел.
Проблема возникла для конкретного виртуалного диска.

Выглядело этот следующим образом:

Проблемный виртуальный диск находился в статусе "Health Status" - Warning и "Operational Status" - Degraded.
Всё физическое оборудование работало корректно.
Ни оптимизация хранилища, ни Repair-VirtualDisk проблему не решали (Repair вообще зависал в статусе "Starting").
 
 
 При этом, SCVMM не в состоянии обновить данные Storage Provider, ошибки следующего формата (см. ниже).

Также, невозможен перевод узлов в режим "обслуживания" (Maintenance). 
 
В ветке WMI ROOT\MICROSOFT\WINDOWS\STORAGE\Providers_v2\ в классе SPACES_StorageJob (или аналогичном классе MSFT) находились те самые подвисшие задачи, с прикольным сроком начала.
 
 
Пробовали разные варианты,  в итоге помогло полное удаление виртуального диска и создание его заново.

2 комментария:

  1. Ответы
    1. Привет,
      Когда мы начинали строить и тестировать это решение - думаю, что большой базы знаний не было даже у производителя.
      Могу только дать следующие рекомендации по предотвращению\устранению:
      Откройте кейс в поддержке Microsoft (возможно есть другое решение);
      Максимально обновите все узлы (в старых версиях ОС может быть приличное кол-во багов, влияющих на стабильность);
      Тоже самое касается SCVMM;

      Удалить

Уважаемый коллега, Ваш комментарий пройдёт модерацию, чтобы избежать спам-атак в ленте. Спасибо за понимание.