Математическая морфология.

Электронный математический и медико-биологический журнал. - Т. 14. -

Вып. 2. - 2015. - URL:

http://www.smolensk.ru/user/sgma/MMORPH/TITL.HTM

http://www.smolensk.ru/user/sgma/MMORPH/N-46-html/TITL-46.htm

http://www.smolensk.ru/user/sgma/MMORPH/N-46-html/cont.htm

 

УДК 51-74

 

Статистические модели отказов

 

Ó 2015 г. Лямец Л. Л.*, Якименко И. В.*, Канищев О. А.**

 

(lamets.doc)

 

Объектом исследования являются статистические модели отказов технических изделий, алгоритмы и методики их исполнения. Цель работы – обоснование возможности применения математико-статистических методов для построения моделей отказов технических изделий при наличии малых выборок. В процессе работы был проведен анализ  действующей нормативно-правовой базы прогнозирования безотказности и обработки статистических данных об отказах изделий любых видов техники на различных стадиях жизненного цикла и литературных источников, в которых описаны применяемые математико-статистические методы. В результате исследования была получены следующие результаты: дано описание метода анализа выживаемости,  его адаптация и применение для  анализов отказов технических изделий при наличии малых выборок; приведены количественные характеристики, используемые в методах анализа выживаемости и методики  их вычисления; описана методика построения таблицы времен жизни (безотказной работы) и приведен практический пример вычислений; дано описание моментного метода Каплана-Мейера и его применения для анализов отказов технических изделий; описана методика построения модели  отказов на основе статистического распределения имеющихся экспериментальных данных, приведен практический пример вычислений по указанной методике.

Ключевые слова: статистические модели, математико-статистические методы, модели отказов технических изделий, анализ малых выборок, анализ выживаемости, таблицы времен жизни, моментный метод Каплана-Мейера.

 

Решение задач прогнозирования безотказности и обработки статистических данных об отказах изделий любых видов техники на различных стадиях жизненного цикла определяется национальным стандартом Российской Федерации ГОСТ Р 27.004-2009 [1]. Указанный национальный стандарт устанавливает основные теоретические модели отказов и определяет математические выражения для вычисления характеристик основных аппроксимирующих распределений.

Национальный стандарт также определяет основные виды теоретических статистических распределений, используемых для построения моделей отказов: экспоненциальное, Вейбулла, гамма, логарифмически-нормальное, нормальное. Кроме перечисленных теоретических распределений при решении отдельных задач национальным стандартом рекомендуется применять также и другие распределения, число которых составляет несколько десятков. На основе теоретических распределений выводятся математические выражения для вычисления вероятностных (математических) показателей надежности и безотказной работы. Фактически речь идет о вычислении количественных характеристик надежности и безотказной работы на основе некоторых теоретических модельных представлений. Вопросы практического определения и обоснования математических моделей закона распределения отказов на основе имеющихся опытных данных, обоснование практической применимости вероятностных (математических) показателей для количественного описания надежности и безотказной работы технических изделий остаются за рамками данного национального стандарта.

Вместе с тем выбор и обоснование теоретического закона распределения отказов имеет большое значение при исследованиях и практических оценках надежности. Определение количественных характеристик безотказной работы по одной и той же исходной статистической информации, но при различных предположениях о статистическом законе распределения отказов может привести к существенно отличающимся результатам [2].

Первичным материалом для обоснования теоретического закона распределения отказов являются результаты спланированных испытаний опытных образцов. Полученные опытные данные дают основу для построения эмпирического распределения отказов. Для этой цели можно использовать эмпирическое кумулятивное распределение или эмпирическую плотность распределения. В простейшем практическом применении эмпирическое распределение позволяет визуально оценить степень его соответствия выбранному теоретическому распределению, но для более строгих выводов этого не достаточно. Необходимо проверить статистическую гипотезу о предполагаемом теоретическом распределении более точными методами. Такими методами, применяемыми для проверки согласованности эмпирических данных с гипотезой о предполагаемом теоретическом законе распределения, являются критерии согласия [3].

Критерии согласия позволяют выявить значимое отличие анализируемого эмпирического распределения от выбранного теоретического распределения и обоснованно утверждать о том, что найденное расхождение между этими распределениями существенно и выбранное в качестве модели теоретическое распределение принципиально не согласуется с эмпирическими данными. В случае, когда значимое отличие не выявлено, то этот результат указывает на то, что расхождение между эмпирическим и теоретическим распределениями  вызвано случайными обстоятельствами и не выходит за пределы статистической ошибки, связанной, например, с малым объемом выборочных опытных испытаний. В этом случае выбранное теоретическое распределение может обоснованно служить адекватной моделью исследуемого эмпирического распределения.

Следовательно, задача практической реализации критерия согласия состоит в том, чтобы вычислить характеристики эмпирического распределения, соответствующие характеристикам выбранного теоретического распределения, выявить и количественно оценить различие между теоретическим и эмпирическим распределениями и, исходя из полученного результата сделать выводы о согласии теоретического распределения с эмпирическим, полученным на основе выборочных данных. На практике применяются критерии Пирсона, Колмогорова-Смирнова и другие критерии согласия [3].

Для практической реализации критериев согласия необходимо иметь в распоряжении выборочные экспериментальные данные достаточно большого объема. Выборочные данные или выборка условно считается малой, если ее объем меньше 30 единиц наблюдений. Следовательно, для корректной реализации критериев согласия при заданной ошибке первого рода и обозначенной чувствительности критерия необходимо иметь выборки достаточно большого объема. Практически это условие, как правило, трудно обеспечить.

Следует отметить, что кроме проверки гипотезы о предполагаемом теоретическом законе распределения, статистический анализ опытных данных является основой для определения статистических показателей надежности и безотказной работы.

В реальных условиях описанное выше корректное обоснование математических моделей и вычисление на их основе вероятностных (математических) показателей надежности и безотказной работы трудновыполнимо по причине больших ресурсных затрат. Поэтому на практике более рациональным действием является применение методов статистического анализа экспериментальных данных, которые позволяют вычислить статистические показатели надежности и безотказной работы на основе анализа выборок малого объема.

Для вычисления количественных характеристик надежности и безотказной работы могут быть использованы статистические методы анализа первичных данных, объединенные под общим названием «Анализ выживаемости» [4, 5].

Первоначально разработанные методы анализа выживаемости были ориентированы для проведения медико-биологических исследований с учетом их специфики. В настоящее время практически апробированные методы анализа выживаемости успешно применяются для статистического анализа в технических областях, в том числе они могут быть применимы и к анализу надежности и безотказной работы технических изделий.

С формальной стороны при использовании методов анализа выживаемости исследуемой переменной является время, которое прошло от начала наблюдения до наступления критического события. Определение сущности критического события дается в каждом конкретном случае с учетом специфики предметной области. Например, при анализе надежности и безотказной работы критическим событием может быть отказ работы технического изделия.

Особенность методов анализа выживаемости состоит в том, что они предназначены для анализа цензурированных первичных данных. Исходные данные могут быть цензурированными справа (наблюдение завершилось до наступления критического события), цензурированными слева или цензурированными как справа, так и слева [6, 7, 8]. В дальнейшем в целях конкретизации предлагаемых методов анализа изложение будет касаться данных наблюдений, цензурированных справа.

По своей сути цензурирование при анализе надежности и безотказной работы имеет место в том случае, когда имеется лишь некоторая информация о времени работы технического изделия, но точное время безотказной работы не всегда может быть известно.

Цензурированные данные представляют собой результат наблюдения за исследуемым техническим объектом (единицей наблюдения) до наступления некоторого критического события. Цензурированные данные дают возможность описывать поведение исследуемой единицы наблюдения с учетом того, что наблюдение в точности до наступления отказа не всегда возможно. Наблюдение за объектом может стать невозможным до наступления отказа. В таких случаях следует говорить только о том, что время до наступления отказа не меньше времени окончания наблюдения. Время наступления отказа является цензурированным. В практике количественной оценки надежности и безотказной работы технических изделий цензурирование является ключевой аналитической проблемой, для решения которой разработаны специальные методы анализа экспериментальных данных.

Можно выделить две основные причины возникновения цензурированных данных:

- критическое событие для наблюдаемого технического объекта в течение периода наблюдения не наступило;

- технический объект выбыл из-под наблюдения в исправном состоянии до окончания периода наблюдения (потерян из виду), и критическое событие за время наблюдения зафиксировано не было.

Для применения методов анализа выживаемости необходимо, чтобы организация исследования удовлетворяла следующим условиям.

1. Время начала и завершения наблюдения должно быть точно известно для каждой единицы наблюдения.

2. Для каждой единицы наблюдения должны быть точно установлены:

-  факт и время наступления критического события, если оно произошло в течение периода наблюдения;

- факт выбытия единицы наблюдения до окончания периода наблюдения;

- факт не наступления критического события в течение периода наблюдения.

3. Единицы наблюдения должны представлять собой  выборочную статистическую совокупность (выборку), которая должна отвечать требованиям репрезентативности. Методы отбора единиц наблюдения в выборочную совокупность определяются в соответствии предметной областью проводимых наблюдений и возможностью практической реализации механизмов отбора.

Особенности цензурированных данных должны быть учтены при разработке протоколов наблюдений, проводимых с целью анализа надежности и безотказной работы технических изделий.

Практический пример табличного представления эмпирических данных при наличии цензурированных измерений приведен ниже в таблице 1. В данном примере предполагается, что период наблюдения T одинаков для всех единиц наблюдения и определяется целями и задачами испытаний.

В приведенном примере для объекта A критическое событие наступило до окончания периода наблюдения T. Время наступления критического события является нецензурированным.

Для объектов B и C время их наблюдения в исправном состоянии является цензурированным справа. Объект B оставался исправным до полного окончания установленного периода наблюдения T, критическое событие не наступило. Объект C выбыл из-под наблюдения в исправном состоянии раньше окончания периода наблюдения T, критическое событие также не наступило.

Методы анализа выживаемости позволяют использовать все имеющиеся экспериментальные данные, то есть анализировать как цензурированные, так и нецензурированные наблюдения и не терять с трудом собранную информацию о времени, в течение которого объект оставался в исправном состоянии.

Основными количественными характеристиками, которые вычисляются по экспериментальным данным методами анализа выживаемости, являются функция выживаемости  и функция интенсивности рисков .

Функция выживаемости  применительно к анализу надежности и безотказной работы определяет вероятность единицы наблюдения находиться в исправном состоянии в любые моменты времени в течение периода наблюдения T. Эту вероятность также называют выживаемостью. Функцией выживаемости можно в вероятностных категориях описывать поведение самых разнообразных объектов и в тех случаях, когда в качестве критического события может выступать любое формально определенное событие.

 

Таблица 1

Пример представления результатов наблюдения при наличии

цензурированных данных

Единицы наблюдения (объекты)

Время

начала

наблюдения

Время

окончания наблюдения

Время

наблюдения объекта в исправном состоянии

 

Результаты наблюдения

А

Объект A наблюдали от временного отсчета  до момента  в течение времени  до регистрации факта наступления критического события. Время  меньше, чем период наблюдения T и является нецензурированным.

B

Объект B наблюдали от временного отсчета  до момента  в течение времени  до окончания установленного периода наблюдения. Критическое событие не наступило. Время  является цензурированным, и можно утверждать, что оно не меньше, чем T (отмечено звездочкой).

C

Объект C наблюдали от временного отсчета  до момента  в течение времени . Объект C выбыл из-под наблюдения в исправном состоянии. Время  меньше периода наблюдения T и является цензурированным (отмечено звездочкой).

 

Для изучаемой статистической совокупности выживаемостью  называется вероятность «прожить» или оставаться в исправном состоянии более времени t с момента начала наблюдения. Формальная запись имеет вид

                                       (1)

 

Типичный вид графика теоретической функции выживаемости показан на рис. 1.

 

 

Рис. 1. Типичный вид графика теоретической функции выживаемости

 

В точке , соответствующей началу наблюдения, выживаемость равна 1. По мере увеличения времени наблюдения выживаемость уменьшается и стремится к нулю. Момент времени  до которого доживает или сохраняет свою работоспособность 50% единиц наблюдения исследуемой статистической совокупности, называется медианой выживаемости. Формально .

Исследование генеральной статистической совокупности сплошным методом в практических условиях не представляется возможным в силу больших ресурсных затрат, поэтому обычно исследование проводят выборочным методом. Из генеральной совокупности при помощи научно и практически обоснованных методов, зависящих от предметной области исследования, формируется репрезентативная выборочная совокупность или выборка. Анализ выборочной совокупности позволяет получить оценки генеральных показателей и характеристик, описанных в вероятностных категориях.

Оценку кривой выживаемости по исследуемой выборочной совокупности при отсутствии цензурированных данных можно вычислить по формуле:

                                                                                    (2)

где  – число единиц наблюдения «переживших» момент времени t; N – объем изучаемой выборочной статистической совокупности.

Типичная эмпирическая кривая выживаемости, показанная на рис. 2, имеет ступенчатый вид.

 

 

Рис. 2. Вид эмпирической функции выживаемости

 

Кроме функции выживаемости, важное практическое значение имеет функция интенсивности рисков . Формальное определение этой функции имеет вид:

                                                (3)

Функция интенсивности рисков  определяет моментный потенциал на единицу времени для критического события (отказа), которое может произойти, при условии, что единица наблюдения будет работоспособна до времени t. Так как  числитель выражения (3), по сути, является условной вероятностью, то функцию интенсивности рисков также называют условной долей критических событий (отказов).

Если функция выживаемости определяет вероятность того, что критическое событие не произойдет в определенный момент времени t, то функция интенсивности рисков направлена на количественное описание вероятности того, что событие  произойдет в этот момент времени. Поэтому, чем больше значение функции выживаемости для конкретного t, тем меньше для него функция интенсивности рисков  и наоборот.

Функция выживаемости  и функция интенсивности рисков  взаимосвязаны и могут быть аналитически выражены одна через другую. Их аналитическая взаимосвязь определяется выражениями:

Приведенные выражения носят теоретический характер и определяют основную идеологию построения методов практического анализа реальных эмпирических данных.

При количественном описании безотказной работы важно оценить вероятность того, что единица наблюдения работала больше времени t после начала наблюдения. Эта важная количественная характеристика, как было указано выше, называется функцией выживаемости.

Практический способ описания функции выживаемости состоит в построении таблицы времен жизни (таблицы безотказной работы) единиц наблюдения в изучаемой выборочной совокупности. Это достаточно известный метод анализа данных о выживаемости. Например, он традиционно используется в страховании, где такие таблицы называются таблицами дожития.

Более простым является построение интервальных  вариационных рядов с  равными по величине интервалами. Как было указано выше исходя из объема выборки N  оптимальное число интервалов можно, например, определить по формуле Стерджесса

,

 

где N объем выборки.

Ширина каждого  интервала будет равна .

По экспериментальным данным для каждого интервала вычисляется следующие абсолютные показатели:

- число единиц наблюдения , которые в начале рассматриваемого интервала с номером i были работоспособны (число в начале);

- число единиц наблюдения , которые отказали в интервале с номером i (число отказавших) - нецензурированные данные;

- число единиц наблюдения  изъятых из наблюдения в интервале с номером i (число изъятых) – цензурированные данные;

- число изучаемых единиц наблюдения  – это число единиц наблюдения, которые были работоспособны в начале рассматриваемого временного интервала с номером i, минус половина от числа изъятых, т.е. ,

.

Число изучаемых единиц наблюдения  также можно вычислить по формуле

                                              (4)

В формуле (4) при вычислении числа изучаемых единиц наблюдения  суммирование  проводится   по всем   интервалам,  предшествующим  интервалу с номером i. Очевидно, что для первого интервала  и , следовательно, .

Для понимания таблиц времен жизни важно помнить, в каждом временном интервале для единицы наблюдения регистрируется либо наступление критического события или отказ (нецензурированные наблюдения), либо изъятие (цензурированное наблюдение).

На основании указанных выше абсолютных показателей для каждого интервала вычисляются следующие относительные показатели (доли).

1. Доля отказавших единиц наблюдения  - это отношение числа единиц наблюдения , отказавших в соответствующем интервале с номером i, к числу единиц наблюдения , изучаемых на этом интервале, т.е. .

2. Доля не отказавших в изучаемом интервале единиц наблюдения  равна единице минус доля отказавших единиц наблюдения , т.е. .

3. Кумулятивная доля не отказавших  объектов  - это кумулятивная доля объектов, которые не отказали к началу соответствующего временного интервала с номером i.  По сути,  кумулятивная доля не отказавших  объектов  и является эмпирической оценкой функции выживаемости , то есть это вероятность того, что единица наблюдения «переживет» определенный временной интервал.

К началу первого временного интервала, являющегося временем начала наблюдения, ни одна единица наблюдения еще не могла отказать. Нижние индексы абсолютных и относительных показателей, относящиеся к началу первого временного интервала (началу наблюдения) можно обозначить через 0. Очевидно, что , , ,  и, соответственно, .   Для всех остальных интервалов  равна произведению долей не отказавших объектов по всем предыдущим интервалам. Формальная запись эмпирической оценки функции выживаемости имеет вид:

                                                   (5)

Стандартная ошибка эмпирической оценки функции выживания вычисляется по формуле

                                                    (6)

Для первого интервала стандартная ошибка эмпирической оценки функции выживания .

Для последующих интервалов при выполнении вычислений по формуле (6) суммирование производится по всем предыдущим интервалам.

На основе  можно вычислить эмпирическую оценку  плотности вероятности отказа  в каждом интервале. Эмпирическая оценка плотности вероятности отказа временного интервала с номером i вычисляется как разность между функцией выживаемости на данном интервале и функцией выживаемости на следующем интервале, которая делится на ширину этого интервала. Для вычисления можно использовать следующие формулы:

   или 

Стандартная ошибка эмпирической функции плотности вероятности определяется выражением:

                                         (7)

В случае, когда  для вычисляемого интервала , то стандартная ошибка эмпирической функции плотности вероятности не вычисляется и ее значение принимается равным нулю.

В целях сглаживания эмпирических характеристик в случаях, когда в действительности для некоторого i-того интервала    и , в расчетах для этого интервала значение  принимают равным 0,5.

Важной количественной характеристикой является эмпирическая интенсивность отказов, или эмпирическая функция мгновенного риска . Эта функция является прогностической характеристикой, описывающей надежность работы единицы наблюдения. Формально функция мгновенного риска равна вероятности того, что единица наблюдения откажет в следующем интервале, при условии, что  в предыдущем интервале она была в рабочем состоянии. Эмпирическая оценка функции мгновенного риска   вычисляется по формуле:

                                             (8)

Стандартная ошибка оценки функции мгновенного риска определяется выражением:

                                          (9)

В случае, когда  для вычисляемого интервала , то стандартная ошибка функции мгновенного риска не вычисляется и ее значение принимается равным нулю.

Для количественной характеристики эмпирической оценки функции выживания используется медиана выживаемости . Это точка на временной оси, в которой кумулятивная функция выживаемости наиболее близка 0,5. Для вычисления медианы необходимо найти временной интервал, в котором значение функции  наиболее близко к значению , но больше или равно этому значению. Такой интервал будем называть медианным.

Эмпирическая оценка медианы выживаемости может быть вычислена способом линейной интерполяции по формуле

                                                   (10)

где  и   - соответственно нижняя и верхняя границы медианного интервала, а   и   - значения кумулятивной функции выживаемости соответственно в медианном интервале (интервал с номером i) и интервале, следующим за ним (интервал с номером i+1).

Стандартная ошибка медианы вычисляется по формуле

                                                         (11)

где  -  значение эмпирической функции плотности вероятности в медианном интервале, а  -  число изучаемых единиц наблюдения в медианном интервале.

Ниже в таблице 2 приведен пример вычислений указанных выше  вероятностных показателей таблицы времен жизни для выборки объемом  единиц наблюдения. Период наблюдения объектов составлял   часов и разбивался на десять интервалов. Число интервалов в данном случае не оптимизировалось по формуле Стерждесса и определялось целями исследования.

 

 


Таблица 2

Границы

интервалов

 

0 - 50

50

9

0

50

50

0,18

0,82

1

0

0,0036

0,001087

0,003956

0,001312

50 - 100

50

5

2

41

40

0,125

0,875

0,82

0,054332

0,00205

0,000868

0,002667

0,00119

100 - 150

50

5

1

34

33,5

0,149254

0,850746

0,7175

0,064021

0,002142

0,000904

0,003226

0,001438

150 - 200

50

3

4

28

26

0,115385

0,884615

0,61041

0,070127

0,001409

0,000782

0,002449

0,001411

200 - 250

50

2

2

21

20

0,1

0,9

0,539978

0,072878

0,00108

0,000739

0,002105

0,001487

250 - 300

50

2

1

17

16,5

0,121212

0,878788

0,485981

0,074928

0,001178

0,000802

0,002581

0,001821

300 - 350

50

2

2

14

13

0,153846

0,846154

0,427074

0,076553

0,001314

0,000887

0,003333

0,002349

350 - 400

50

1

2

10

9

0,111111

0,888889

0,36137

0,077603

0,000803

0,000777

0,002353

0,002349

400 - 450

50

1

2

7

6

0,166667

0,833333

0,321218

0,078685

0,001071

0,001012

0,003636

0,003621

500 - 550

50

1

3

4

2,5

0,4

0,6

0,267682

0,08178

0,002141

0,001783

0,01

0,009682

 

 

 


Медианный интервал является пятым по счету () и имеет границы:  часов и  . Значение эмпирической оценки функции выживаемости в медианном интервале равно . В последующем интервале значение эмпирической оценки функции выживаемости равно .

Эмпирическая оценка медианы выживаемости:

.

Стандартная ошибка медианы:

.

Приведенные в таблице вычисления позволяют построить приведенные ниже графики эмпирических функций выживаемости, риска и плотности вероятности отказов. Показанные в примере вычисления и полученные в результате количественные характеристики дают основу для описания исследуемой выборки в форме индуктивных выводов (от частного к общему) и позволяют  построить обоснованные математические модели. Предложенный метод анализа также позволяет сравнивать количественные характеристики, полученные для двух и более  исследуемых выборочных совокупностей с целью выявления значимых статистических различий и формулировки обоснованных выводов о надежности работы исследуемых единиц наблюдения. Очевидно, что описанный метод анализа предполагает использование выборочных совокупностей достаточного объема. Простейшим индикатором статистической точности может служить величина стандартных ошибок вычисляемых статистических характеристик и показателей.

 

 

Рис. 3. Графики эмпирических функций выживаемости, риска и плотности вероятности отказов, построенные по экспериментальным данным

(таблица 2)

 

При построении функции выживаемости описанным выше методом таблиц времени жизни (интервальным методом) выбор и обоснование наиболее подходящего разбиения периода наблюдения T на интервалы – непростая, но очень важная задача. При отсутствии первичных знаний о поведении во времени исследуемых единиц наблюдения и теоретических представлений о возможных моделях их отказов обоснованное определение корректных интервалов группировки не всегда представляется возможным. В таких случаях для построения эмпирической оценки функции выживаемости  может быть использован метод Каплана-Мейера или моментный метод.

Принципиальное отличие указанного метода от метода таблиц времени жизни (интервального метода) состоит в том, что этот метод  не предполагает разбиения периода наблюдения T на некоторое число временных интервалов заданной ширины . Следовательно, полученные по методу Каплана-Мейера оценки функции выживаемости не зависят от разбиения времени наблюдения на интервалы, то есть от группировки первичных результатов наблюдения. В этом и заключается одно из преимуществ метода Каплана-Мейера по сравнению с интервальным методом построения таблиц времени жизни.

Практическая реализация метода Каплана-Мейера и анализ первичных результатов выполняются объективно проще, а качество полученных количественных оценок не уступает оценкам, полученным при помощи интервального метода.

Как было показано выше, оценку функции выживаемости по исследуемой выборочной совокупности при отсутствии цензурированных данных можно вычислить по формуле (2). В тех случаях, когда имеют место цензурированные данные (а в практических исследованиях это бывает почти всегда), мы не сможем воспользоваться этой формулой.

В моментном методе Каплана-Мейера при наличии цензурированных данных поступают следующим образом. За период наблюдения T регистрируют моменты времени , в которые произошел отказ  хотя бы одной единицы наблюдения из выборочной совокупности. Число таких моментов времени за период наблюдения T может быть . Для каждого экспериментально зарегистрированного момента времени  по имеющимся данным может быть вычислена эмпирическая вероятность  «пережить» этот момент. Эмпирической оценкой вероятности  будет являться отношение числа единиц наблюдения, «переживших» момент времени , к числу единиц, наблюдавшихся к этому моменту времени. Формальная запись доли единиц наблюдения, переживших момент времени , имеет вид

                                                                        (12)

где  - число единиц наблюдения, «переживших» момент времени ;

 - число единиц, наблюдавшихся к моменту времени .

Очевидно, что число единиц наблюдения , «переживших» момент времени , равно разности числа единиц , наблюдавшихся к моменту времени  и числа единиц , отказавших в момент времени , то есть .

Следовательно, можно записать

                                   (13)

Важно отметить, что в моменты времени  и в промежутках между ними может происходить изъятие единиц наблюдения из проводимого исследования, то есть могут иметь место цензурированные наблюдения. Количество цензурированных наблюдений в интервале  от момента времени  (включительно) до момента времени  (исключительно) будем обозначать . Количество единиц, наблюдающихся к очередному моменту времени  равно разности количества  единиц, наблюдавшихся  к предыдущему  моменту времени    и суммы, состоящей из  количества единиц , отказавших в предыдущий момент времени , и количества цензурированных наблюдений  в интервале .  Формальная запись для вычисления  имеет вид:

                                                   (14)

С теоретической точки зрения согласно правилу умножения вероятностей, вероятность пережить некоторый момент времени  для каждой единицы наблюдения из выборочной совокупности будет равна произведению этих оценок от нулевого момента времени  (начало наблюдения) до момента времени, для которого производится вычисление.

Математическая модель, положенная в основу моментного метода, имеет следующее формальное описание

 

                                                    (15)

Доля единиц наблюдения, переживших момент времени , и оценка функции выживаемости  вычисляются для всех эмпирически зафиксированных моментов времени . По этим же значениям строится график эмпирической функции выживаемости .

Очевидно, что для момента времени , с которого начинается наблюдение, можно записать следующие начальные условия

,            

Следовательно,  по   формулам   (13)   и   (15)   имеем   и .

При вычислении функции выживаемости , в  принципе,  кроме моментов времени, в которые произошел отказ  хотя бы одной единицы наблюдения, можно также фиксировать моменты времени, в которые происходит изъятие из проводимого исследования хотя бы одной единицы наблюдения. Но для этих моментов времени  и  .

Использовании в вычислительной процедуре, проводимой по формуле (15), моментов времени, в которые происходит изъятие из проводимого исследования хотя бы одной единицы наблюдения, приводит к умножению на единицу, что не изменяет результата вычислений оценки функции выживания . Поэтому для упрощения вычислительных процедур используются только моменты времени, в которые произошел отказ  хотя бы одной единицы наблюдения.

Рассмотрим пример вычислений функции выживания моментным методом Каплана-Мейера.

Исходные данные для вычислений представлены в таблице 3.

 

Таблица 3

п/п

Время

Отказ или изъятие

1

2

отказ

2

6

отказ

3

7

отказ

4

7

отказ

5

7

изъятие (цензурирование)

6

8

отказ

7

9

отказ

8

11

изъятие (цензурирование)

9

12

отказ

10

12

изъятие (цензурирование)

 

Вычисления представлены в таблице 4.

Таблица 4

2

0

10

1

9

0,9

0,9

6

0

9

1

8

0,89

0,8

7

0

8

2

6

0,75

0,6

8

1

5

1

4

0,8

0,48

9

0

4

1

3

0,75

0,36

12

1

2

1

1

0,5

0,18

На приведенном ниже графике показана эмпирическая функция выживаемости, вычисленная моментным методом Каплана-Мейера.

Рис. 4. Эмпирическая функция выживаемости, вычисленная моментным методом Каплана-Мейера по экспериментальным данным (таблица 4)

 

При наличии возможности провести достаточно большое количество экспериментальных наблюдений можно поставить задачу обоснования модели статистического распределения экспериментальных данных. При положительном решении указанной задачи для практического использования  обосновывается математическая модель, в которой содержатся количественное описание типичного проявления описываемого явления и его вариации. Количественные характеристики типичности и вариации, полученные путем индуктивного анализа (от частных случаев  к общим выводам), позволяют привести исследуемую реальность к условиям вероятностной определенности, когда количественные характеристики статистической модели рассматриваются как неслучайные величины. Этот результат является особенно важным для решения практических задач количественного описания случайных величин и прогнозирования случайных процессов.

Для построения и обоснование модели статистического распределения экспериментальных данных необходимо сформировать репрезентативную выборочную совокупность (выборку). Основными условиями, позволяющими обеспечить  репрезентативность, являются:

- объем выборки, позволяющий делать обоснованные статистические выводы при заданных ошибках первого и второго рода, определяющих специфичность и чувствительность используемых статистических методов;

- обеспечение случайности отбора, то есть каждая единица наблюдения из генеральной совокупности должна иметь равные шансы попасть в формируемую выборку.

Сформированная выборка объемом N единиц наблюдения содержит информацию о времени наработки до отказа отобранных единиц наблюдения.

Для изучения результатов выборочных статистических  исследований значения , содержащиеся в выборке,  следует упорядочить, т.е. расположить по возрастанию   .

Порученный ряд называется ранжированным. В ранжированном ряду могут содержаться одинаковые значения. Содержащиеся в ранжированном ряду различные значения называются вариантами. Одна варианта может обозначать несколько значений, содержащихся в выборке. Например, три значения 12, 12 и 12, содержащиеся в анализируемой выборке, образуют варианту 12. В данном примере варианте 12 соответствует частота 3. Количество вариант всегда меньше или равно числу значений в изучаемой выборочной совокупности. Расположенные в ранжированном порядке варианты и соответствующие им частоты образуют вариационный ряд.

Для удобства  исследования  вариационного ряда используют метод группировки. Группировка в интервалы эмпирических значений, содержащихся в вариационном ряду, позволяет построить интервальный вариационный ряд.

Для построения таблицы безотказной работы период наблюдения T разбивается на некоторое число временных интервалов. При разбиении периода наблюдения T на равные по ширине интервалы оптимальное число интервалов можно определить, например, по формуле Стерджесса

.

При построении таких вариационных рядов величины интервалов  определяются по следующей формуле

,

где n – число интервалов, а  и  соответственно наибольшее и наименьшее значения в выборке.

В случае, когда проверяется гипотеза об экспоненциальном законе распределения анализируемых данных наработки до отказа, целесообразно в качестве наименьшего значения выбрать момент начала наблюдения, т.е. .

В данном случае величины интервалов  определяются по формуле .

Вычисленное значение величины интервалов  позволяет определить границы интервалов. Для этого от значения  на оси времени последовательно откладываются отрезки шириной .

В интервальном вариационном ряду интервалы могут быть открытыми и закрытыми. Открытые интервалы – это интервалы, у которых указана только одна граница. Закрытыми называются интервалы, у которых обозначены обе границы.

При построении интервального вариационного ряда последний интервал удобно сделать  открытым, обозначив для него только нижнюю границу.  Все предшествующие интервалы являются закрытыми.

После определения интервалов в каждом из них  подсчитывается количество выборочных значений. Число выборочных значений попавших в интервал называется частотой интервала. Совокупность интервалов и соответствующих им частот образуют интервальный вариационный ряд. Сумма всех частот статистического ряда определяет численность всей выборочной совокупности или ее объем.

При построении интервального статистического ряда необходимо определить, куда следует относить значения, соответствующие границам интервалов. Например, можно определить, что для любого интервала значение нижней границы интервала включается в интервал, а верхняя граница – исключается из данного интервала и входит в следующий интервал. Интервальный вариационный ряд целесообразно представить в табличной форме.

Для наглядности проводимого статистического анализа интервальный вариационный  ряд может быть графически представлен гистограммой. Построенная гистограмма также позволяет визуально оценить характер статистического распределения и выдвинуть гипотезу о возможной теоретической модели изучаемого распределения.

Ниже в таблице 5 представлен пример экспериментальных данных, полученных по результатам экспериментального исследования выборочной совокупности объемом N=100.

Таблица 5

1,7

16,1

47

80,5

160,2

7,8

29,9

63,7

116

264,1

2

16,3

47,7

81,3

174,7

7,8

31

63,7

116,9

270,3

3,4

19,1

49,4

87,7

180,5

9,3

31,9

65,2

119,8

281,8

3,5

20,9

50

96,9

188,9

9,4

34

70,4

127

283

3,6

22,6

50,7

98,4

190,1

12,1

34,7

70,6

131,7

306,2

4,2

26,5

52,6

101,7

208,1

12,4

36

71,6

132,1

307,4

4,6

27,2

57,6

103,1

211,8

12,6

39,9

72,1

135,4

349,9

5,6

28

57,8

106,5

221,7

13

42,2

73,1

136,1

421,1

7,3

28,8

61,3

109,3

260,9

13,6

42,6

73,7

148,4

431,6

7,5

29,2

63,1

111,1

263,5

13,8

44,6

75,1

159,2

569,9

 

В таблице 6 представлен интервальный вариационный  ряд, построенный по исходным данным. Количество интервалов в данном случае определялось в постановочной части исследования, то есть оптимизация числа интервалов по формуле Стерджесса не проводилась.

Таблица 6

Интервалы

Границы

интервалов

Наблюдаемые

абсолютные частоты

Нижняя граница

Верхняя граница

1

0

100

65

2

100

200

20

3

200

300

9

4

300

400

3

5

400

500

2

6

500 и более

 

1

 

На рис. 5 показана частотная гистограмма, графически иллюстрирующая интервальный вариационный ряд.

Рис. 5. Частотная гистограмма вариационного интервального ряда, построенного по  таблице 6

 

Для теоретического описания распределения отказов во времени в качестве математической модели широко применяется экспоненциальное распределение. Плотность вероятности экспоненциального закона распределения имеет вид

,

где    - параметр экспоненциального закона распределения. Ниже на рисунке 6 показаны графики функции плотности экспоненциального распределения в зависимости от параметра .

 

Рис. 6. Графики функции плотности экспоненциального распределения в зависимости от параметра

 

Очевидно, что характер огибающей частотной гистограммы на рис. 5 согласуется с графиком плотности вероятности экспоненциального закона распределения.

Параметр  связан с математическим ожиданием M следующим соотношением .

Оценкой неизвестного математического ожидания в исследуемом статистическом распределении времен отказов может служить выборочное среднее значение , которое можно вычислить на основании данных, приведенных в таблице 5.

Следовательно, можно вычислить выборочную точечную оценку неизвестного параметра .

Для проверки предположения о распределении значений времени отказов по экспоненциальному закону сформулируем следующие статистические гипотезы:

- нулевая гипотеза Н0 – распределение значений времени отказов значимо не отличается от экспоненциального распределения с параметром ;

- альтернативная гипотеза Н1 – распределение значений времени отказов значимо отличается от экспоненциального распределения с параметром .

Для проверки статистической гипотезы Н0 можно воспользоваться критерием согласия  (Пирсона). Для корректного применения указанного критерия необходимо перестроить полученный ранее интервальный вариационный ряд в таблице 6 таким образом, чтобы в интервалах содержалось не менее 5 значений. Для выполнения этого условия объединим четвертый, пятый и шестой интервалы. Анализируемый интервальный вариационный ряд примет вид

 

Таблица 7

Интервалы

Границы

интервалов

Наблюдаемые

абсолютные частоты

Нижняя граница

Верхняя граница

1

0

100

65

2

100

200

20

3

200

300

9

4

300 и более

 

6

 

По математической модели плотности экспоненциального  распределения

вычислим ожидаемые частоты попадания в  обозначенные в таблице 7 интервалы по формуле

где:  - объем выборки,  - ожидаемая частота в j-том интервале,  и  - соответственно нижняя и верхняя границы  j-того интервала.

При проведении вычислений ожидаемых частот в последнем (четвертом) интервале верхним пределом интегрирования является . Интервальный статистический ряд, содержащий наблюдаемые  и ожидаемые частоты, показан в таблице 8.

Вычислим статистику  по формуле

.

 

где j – номер интервала,     k – количество интервалов,    - наблюдаемая частота в j-том интервале,    - ожидаемая частота в j-том интервале.

 

Таблица 8

Интервалы

Границы

интервалов

Наблюдаемые

абсолютные частоты

Ожидаемые

абсолютные частоты

Нижняя граница

Верхняя граница

1

0

100

65

63,2

2

100

200

20

23,3

3

200

300

9

8,6

4

300 и более

 

6

4,9

 

Результаты вычислений статистики :

.

Для проверки статистической гипотезы Н0 будем использовать уровень значимости (вероятность ошибки первого рода) .

Вычислим число степеней свободы  (degrees of freedom).

,

где  - число интервалов в интервальном вариационном ряду (таблица 8),  - количество параметров в модели статистического распределения (экспоненциальный закон распределения полностью определяется одним параметром ).

При уровне значимости   и  количестве степеней свободы  критическое значение статистики  .

Так как  , то нет оснований отвергать нулевую гипотезу и, следовательно, можно считать, что анализируемое распределение значимо не отличается от экспоненциального распределения с параметром  . Наблюдаемое  в таблице 8 расхождение между наблюдаемыми в эксперименте частотами и ожидаемыми (теоретическими) частотами, вычисленными по математической модели, не выходит за границы статистической ошибки выборки.

Проведенный анализ позволяет полагать, что анализируемое статистическое распределение, представленное интервальным вариационным рядом в таблице 8, согласуется с теоретическим  экспоненциальным распределением с параметром  , то есть в качестве математической модели анализируемого статистического распределения можно использовать экспоненциальное распределение

.

Обоснованная  статистическими методами анализа модель отказов, описываемая экспоненциальным распределением, дает возможность для вычисления требуемых характеристик надежности и осуществления прогнозирования.

В рамках приведенного выше изложения проведен краткий анализ нормативно-правовой базы, определяющей методы  прогнозирования безотказности и обработки статистических данных об отказах технических изделий. Рассмотрены практические особенности реализации статистических методов построения и обоснования  моделей отказов технических изделий, алгоритмы и методики их практического исполнения. Особое внимание уделено возможности применения математико-статистических методов для построения моделей отказов технических изделий при наличии малых выборок.

В представленной работе дано описание метода анализа выживаемости и  его применение для  анализов отказов технических изделий. На практических примерах показана методика построения таблицы времен жизни (безотказной работы) и реализация моментного метода Каплана-Мейера при наличии малых выборок.

В заключительной части  работы описана и на практическом примере показана методика построения экспоненциальной модели  отказов на основе статистического распределения имеющихся экспериментальных данных.

 

Литература

 

1. Национальный стандарт Российской Федерации ГОСТ Р 27.004-2009.

2. Надежность технических систем и техногенный риск. Электронное учебное пособие. http://www.obzh.ru/nad/index.html

3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. – М.: ФИЗМАТЛИТ, 2006. – 816 с.

4. С.Н. Лапач, А.В. Чубенко, П.Н. Бабич. Статистика в науке и бизнесе. – К.: МОРИОН, 2002. – 640 с.

5. С. Гланц. Медико-биологическая статистика (пер. с англ.), «Практика», Москва, 1999, 459 с.

6. Рябинин И.А. Надежность и безопасность структурно-сложных систем. – СПб.: Политехника, 2000.

7. Северцев Н.А. Надежность сложных систем в эксплуатации и обработке. – М.: Высшая школа, 1989.

8. Скрипник В.М., Назин А.Е. Оценка надежности технических систем по цензурированным выборкам. – Минск: Наука и техника, 1981.

 

Statistical models of failures

 

Lamets L. L., Yakymenko I. V, Kanistshev O. A.

 

The object of investigation are statistical models bounce technical articles, algorithms and methods of their implementation. The aim of this work is the possibility of application of mathematical and statistical techniques for modelling bounce technical products in the presence of small samples. In an analysis of the current legal framework of reliability prediction and statistical data processing failures of any type of machinery products at various stages of the life cycle, and literary sources, which describe the mathematical-statistical methods. As a result of the study was obtained the following results:  a description of the method of analysis of survival, adaptation, and application for analyses bounce technical products if you have small samples; shows the quantity used in survival analysis methods and techniques to calculate them; explains how to construct a table of life and provides a practical example of calculations; description of the Kaplan-Meier method of couple-stress and its application to failure analysis of engineering products; explains how to build a model failure based on statistical distribution of available experimental data, is a practical example of this technique.

Key words: statistical models, mathematical-statistical methods, models bounce technical products, analysis of small samples, analysis of survival, table of times life, the Kaplan-Meier method.

 

*Филиал ФГБОУ ВПО «Национальный исследовательский университет «МЭИ» в г. Смоленске

**ФГУП СПО «Аналитприбор»

Поступила в редакцию 30.03.2015.