# Методики расчета отчетов Доступности

# Методики расчета показателей доступности

# Методика расчета доступности одной КЕ по расчетному статусу КЕ

Для расчета доступности за период, SA (Service Availability), строится функция проблемного состояния КЕ от времени fProblem(t), принимающая одно из 4-х значений:

  • Значение 0 – в конкретный момент времени на КЕ не зафиксированы проблемы, соответствующие фильтру.
  • Значение 1 – в конкретный момент времени на КЕ зафиксирована проблема (-ы), соответствующие фильтру.
  • Значение N – КЕ находится в необслуживаемом состоянии.
  • Значение S – КЕ находится в согласованном сервисном режиме.

Чтобы построить функцию fProblem(t) необходимо:

  1. Взять все проблемы, относящиеся к выбранной КЕ на исследуемом промежутке. Под проблемой понимается состояние синтетического триггера, не равное OK или Выключен. Возможны следующие случаи:
    • Проблемные состояния СТ, начавшиеся до начала рассматриваемого периода, но закончившиеся уже на нем – их начало считается с момента начала рассматриваемого периода.
    • Проблемные состояния СТ, начавшиеся на рассматриваемом периоде, но закончившиеся за его пределами – их окончание считается на момент конца рассматриваемого периода.
    • Проблемные состояния СТ, начавшиеся до начала рассматриваемого периода и закончившиеся за его пределами – их начало и окончание равнозначны началу и концу рассматриваемого периода.
  2. Отфильтровать проблемы согласно пользовательскому фильтру (название СТ, тэги, приоритет, продолжительность).
  3. Наложить проблемы на временной ряд. В результате, на участках, на которых фиксируются проблемы, установить значение 1, а на участках без проблем – 0.
  4. Если требуется учет сервисного режима, внести в функцию участки, на которых КЕ находилась в сервисном режиме. Переопределить функцию на этих участках (значение функции S).
  5. Очистить функцию проблемного состояния от участков, на которых КЕ не обслуживалась согласно SLA. Участкам, на которых КЕ не обслуживалась согласно SLA, присвоить значение функции N.
  6. Найти участки дребезга – когда длительность участка со значением функции 1 меньше RTO, указанного пользователем. На этих участках проставить значение функции fProblem(t) = 0.
# Пример влияния RTO на расчет функции fProblem(t)

Изображение

В результате данных операций, в общем случае, мы должны получить следующие показатели:

  • timeNonWorking – нерабочее время КЕ на исследуемом периоде. Значение функции равно N.
  • timeWorkingProblem – время, в которое КЕ находилась в состоянии, не удовлетворяющем SLA. Значение функции равно 1.
  • timeWorkingService – время согласованного простоя, когда в рабочее время КЕ находилась в сервисном режиме. Значение функции равно S.
  • timeWorkingOK – время, в которое наша КЕ удовлетворяла SLA. Функция fProblem(t) находилась в состоянии 0.

Расчет доступности за период SA осуществляется по формуле SA = timeWorkingOK / ( timeWorkingOK + timeWorkingProblem ) * 100%.
А недоступность КЕ – по формуле 100% – SA.

# Пример возможного распределения интервалов времени при расчете SA для одной КЕ

Изображение

# Методика расчета доступности ИС (группы КЕ) по расчетным статусам КЕ

Для группового расчета доступности за период, SAG (Service Availability Group), строится функция проблемного состояния КЕ от времени fProblem(t) для каждой КЕ, входящей в группу. Далее, результаты вычисления функции fProblem(t) для каждой КЕ накладываются друг на друга, исходя из следующих правил (операции коммутативны):

fProblem1 fProblem2 fGroupProblem
0 0 0
0 1 1
0 N 0
0 S 0
1 1 1
1 S 1
1 N 1
N N N
N S S
S S S

⚠️ Нерабочее время задаётся для всей группы и, при расчете, учитывается для каждой КЕ.

В результате получаем функцию fGroupProblem(t), из которой можно получить следующие 3 показателя:

  • timeGroupService – время, когда fGroupProblem(t) = S;
  • timeGroupOK – время, когда fGroupProblem(t) = 0;
  • timeGroupProblem – время, когда fGroupProblem(t) = 1;

Таким образом, доступность группы КЕ рассчитывается по формуле SAG = timeGroupOK / ( timeGroupOK + timeGroupProblem ) * 100%.
А недоступность группы – по формуле 100% – SAG.

# Пример возможного распределения интервалов времени при расчете SAG для группы КЕ

Изображение

# Методика расчета доступности сложных ИС по расчетной доступности ИС

Доступность сложной информационной системы, SAMg (Service Availability Multigroup), рассчитывается как средневзвешенный показатель доступности всех входящих в нее ИС (групп КЕ).

  1. Для расчета необходимо определить весовой коэффициент для каждой ИС, ki = vi / ∑vi, где vi – вес информационной системы, заданный пользователем.
  2. Рассчитать SAG по всем ИС за выбранный период.

Таким образом, доступность сложной ИС вычисляется по формуле SAMg = ∑( ki * SAGi ) Недоступность сложной ИС – по формуле 100% – SAMg

# Методики расчета показателей влияния (Факторный анализ)

# Методика факторного анализа для расчета доступности одной КЕ по расчетному статусу КЕ

Факторный анализ позволяет определить, какие факторы-проблемы повлияли на расчет доступности за отчетный период, и сравнить степень этого влияния с остальным факторами-проблемами.

Допущения методики:

  • В методике определения доступности по расчетному статусу КЕ, в отличие от методики по Здоровью, невозможно определить вес той или иной проблемы, если они произошли одновременно. Таким образом, единственным вычисляемым параметром является длительность проблем.
  • В случае, если одновременно произошли две и более проблемы, то за проблемный период длительность каждой умножается на коэффициент 1/N, где N – количество одновременно произошедших проблем.
  • Для работы с факторным анализом предполагается схлопывание проблем в группы (например, по ID синтетического триггера, источнику и т.д.). Базово, методика должна проставить метрику влияния (процент от общей длительности) каждой проблеме, входящей в расчет.

Методика расчета:

  1. Необходимо взять функцию fProblem(t), построенную при расчете SA.
  2. Для каждого участка, где итоговая функция fProblem(t) = 1, составить список проблем КЕ, на основании которых данному участку было присвоено значение. При составлении списка необходимо учитывать и проблемы, которые начинались или заканчивались за пределами участка функции.
  3. Проставить проблеме метрику влияния. Она равняется длительности проблемы на участке, умноженной на вес. В случае, если на участке, в области свой длительности, проблема была единственной, то ей устанавливается вес 1, в случае множественных проблем – 1/N, где N – количество одновременно произошедших проблем.
  4. При расчете следует учесть следующие моменты:
    • В общем случае, на одном и том же участке, на разных интервалах, вес проблемы может меняться – из-за появления новых проблем.
    • Одна и та же проблема может присутствовать на разных участках fProblem(t) = 1. Например, если проблема началась в пятницу, а закончилась во вторник, но в выходные КЕ не обслуживается согласно SLA.
  5. В итоге должен быть сформирован список проблем, которые участвовали в расчете функции fProblem(t). При этом, у каждой проблемы должна быть посчитана метрика влияния на SA.
  6. Необходимо обязательно верифицировать расчет. Сумма метрик влияния всех проблем должна равняться timeWorkingProblem.
  7. На экран выводится относительное значение влияния в процентах. Для этого метрика влияния делится на timeWorkingProblem и умножается на 100%.

# Методика факторного анализа для расчета доступности ИС (группы КЕ) по расчетному статусу КЕ

Факторный анализ позволяет определить, какие факторы-КЕ повлияли на расчет доступности за отчетный период, и сравнить степень этого влияния с остальным факторами-КЕ.

Допущения методики:

  • Для группового расчета первичными факторами выступают сами КЕ, а не проблемы, как для факторного анализа доступности одиночной КЕ.
  • Методикой предусмотрен переход от факторов-КЕ к факторам-проблемам. Но для этого необходимо сделать факторный анализ по каждой КЕ, входящей в расчет.
  • В методике определения доступности по расчетному статусу КЕ в отличие от методики по здоровью невозможно определить вес того или иного КЕ, если проблемы, связанные с ними произошли одновременно. Таким образом, единственным параметром будет длительность проблемного статуса КЕ.

Методика расчета:

  1. Необходимо взять функции fProblem(t) по каждой КЕ, входящей в расчет.
  2. По каждой КЕ рассчитать весовые коэффициенты участков, где fProblem(t) = 1.
    1. Для этого необходимо определить, какие еще КЕ на том или ином участке имели значение функции fProblem(t) = 1.
    2. На интервалах весовой коэффициент равен 1/N, где N – количество КЕ, одновременно находившихся в проблемном состоянии. Если в проблемном состоянии находилась только данная КЕ, то вес 1.
    3. В результате должны получить список интервалов с разными весами (на одном участке может быть несколько интервалов).
  3. Рассчитать метрику влияния каждой КЕ, как сумму произведений длительности всех полученных интервалов на их весовые коэффициенты.
  4. Верифицировать полученный расчет. Сумма метрик влияния должна равняться timeGroupProblem.
  5. На экран выводится относительное значение влияния в процентах. Для этого метрика влияния делится на timeGroupProblem и умножается на 100%.
  6. Для перехода от факторов-КЕ к факторам-проблемам необходимо:
    1. Провести факторный анализ по доступности каждой КЕ, входящей в расчет. В результате получается список проблем каждой КЕ и их относительное влияние на эти КЕ.
    2. Составить общий список всех проблем.
    3. Для каждой проблемы определить ее относительное влияние на групповой расчет. Для этого необходимо умножить ее относительное влияние на КЕ на относительное влияние самой КЕ. В случае, если проблема встречалась на нескольких КЕ, то необходимо просуммировать полученные произведения относительных влияний.

# Методика факторного анализа для расчета доступности сложной ИС (группы КЕ) по расчетной доступности ИС

Факторный анализ для группы ИС позволяет определить, как сильно за отчетный период группа КЕ повлияла на сложную ИС в целом.

Для группового расчета первичными факторами выступают расчетные доступности включенных ИС, а не сами КЕ, как для факторного анализа доступности ИС (группы КЕ).

Методика расчета:

  1. Необходимо взять время нахождения ИС в проблемном статусе – timeGroupProblem, по каждой ИС, входящей в расчет.
  2. Для каждой ИС рассчитать весовые коэффициенты ki = vi / ∑vi, где vi – вес информационной системы, заданный пользователем.
  3. Перемножить эти показатели.
  4. На экран выводится относительное значение влияния в процентах. Для этого метрика влияния делится на timeMultigroupProblem и умножается на 100%.
  5. Таким образом, влияние i-той информационной системы на сложную ИС рассчитывается по формуле ki * timeGroupProblemi * 100% / timeMultigroupProblem.

# Методика расчета параметров MTBF и MTRS

MTBF - Средняя наработка на отказ

MTRS - Среднее время восстановления сервиса

Изображение

Изображение

Изображение