Fema анализ. Анализ FMEA: пример и применение

При экспоненциальном законе распределения времени восстановления и времени между отказами для расчета показателей надежности систем с восстановлением используют математический аппарат марковских случайных процессов. В этом случае функционирование систем описывается процессом смены состояний. Система изображается в виде графа, называемого графом переходов из состояния в состояние.

Случайный процесс в какой либо физической системе S , называется марковским , если он обладает следующим свойством: для любого момента t 0 вероятность состояния системы в будущем (t > t 0 ) зависит только от состояния в настоящем

(t = t 0 ) и не зависит от того, когда и каким образом система пришла в это состояние (иначе: при фиксированном настоящем будущее не зависит от предыстории процесса - прошлого).

t < t 0

t > t 0

Для марковского процесса «будущее» зависит от «прошлого» только через «настоящее», т. е. будущее протекание процесса зависит только от тех прошедших событий, которые повлияли на состояние процесса в настоящий момент.

Марковский процесс, как процесс без последействия, не означает полной независимости от прошлого, поскольку оно проявляется в настоящем.

При использовании метода, в общем случае, для системы S , необходимо иметь математическую модель в виде множества состояний системы S 1 , S 2 , … , S n , в которых она может находиться при отказах и восстановлениях элементов.

При составлении модели введены допущения:

Отказавшие элементы системы (или сам рассматриваемый объект) немедленно восстанавливаются (начало восстановления совпадает с моментом отказа);

Отсутствуют ограничения на число восстановлений;

Если все потоки событий, переводящих систему (объект) из состояния в состояние, являются пуассоновскими (простейшими), то случайный процесс переходов будет марковским процессом с непрерывным временем и дискретными состояниями S 1 , S 2 , … , S n .

Основные правила составления модели:

1. Математическую модель изображают в виде графа состояний, в которой

а) кружки (вершины графа S 1 , S 2 , … , S n ) – возможные состояния системы S , возникающие при отказах элементов;

б) стрелки – возможные направления переходов из одного состояния S i в другое S j .

Над/под стрелками указываются интенсивности переходов.

Примеры графа:

S0 – работоспособное состояние;

S1 – состояние отказа.

«Петлей» обозначаются задержки в том или ином состоянии S0 и S1 соответствующие:

Исправное состояние продолжается;

Состояние отказа продолжается.

Граф состояний отражает конечное (дискретное) число возможных состояний системы S 1 , S 2 , … , S n . Каждая из вершин графа соответствует одному из состояний.

2. Для описания случайного процесса перехода состояний (отказ/ восстановление) применяют вероятности состояний

P1(t), P2(t), … , P i (t), … , Pn(t) ,

где P i (t) – вероятность нахождения системы в момент t в i -м состоянии.

Очевидно, что для любого t

(нормировочное условие, поскольку иных состояний, кроме S 1 , S 2 , … , S n нет).

3. По графу состояний составляется система обыкновенных дифференциальных уравнений первого порядка (уравнений Колмогорова-Чепмена).

Рассмотрим элемент установки или саму установку без резервирования, которые могут находится в двух состояниях: S 0 -безотказное (работоспособное), S 1 - состояние отказа (восстановления).

Определим соответствующие вероятности состояний элемента Р 0 (t ): P 1 (t ) в произвольный момент времени t при различных начальных условиях. Эту задачу решим при условии, как ужу отмечалось, что поток отказов простейший с λ = const и восстановлений μ = const , закон распределения времени между отказами и времени восстановления – экспоненциальный.

Для любого момента времени сумма вероятностей P 0 (t ) + P 1 (t ) = 1 – вероятность достоверного события. Зафиксируем момент времени t и найдем вероятность P (t + ∆ t ) того, что в момент времени t + ∆ t элемент находится в работе. Это событие возможно при выполнении двух условий.

    В момент времени t элемент находился в состоянии S 0 и за время t не произошло отказа. Вероятность работы элемента определяется по правилу умножения вероятностей независимых событий. Вероятность того, что в момент t элемент был и состоянии S 0 , равна P 0 (t ). Вероятность того, что за время t он не отказал, равна е -λ∆ t . С точностью до величины высшего порядка малости можно записать

Поэтому вероятность этой гипотезы равна произведению P 0 (t ) (1- λ t ).

2. В момент времени t элемент находится в состоянииS 1 (в состоянии восстановления), за время t восстановление закончилось и элемент перешел в состояниеS 0 . Эту вероятность также определим по правилу умножения вероятностей независимых событий. Вероятность того, что в момент времени t элемент находился в состоянииS 1 , равна Р 1 (t ). Вероятность того, что восстановление закончилось, определим через вероятность противоположного события, т.е.

1 – е -μ∆ t = μ· t

Следовательно, вероятность второй гипотезы равна P 1 (t ) ·μ· t /

Вероятность рабочего состояния системы в момент времени (t + ∆ t ) определяется вероятностью суммы независимых несовместимых событий при выполнении обеих гипотиз:

P 0 (t +∆ t )= P 0 (t ) (1- λ t )+ P 1 (t ) ·μ t

Разделив полученное выражение на t и взяв предел при t → 0 , получим уравнение для первого состояния

dP 0 (t )/ dt =- λP 0 (t )+ μP 1 (t )

Проводя аналогичные рассуждения для второго состояния элемента – состояния отказа (восстановления), можно получить второе уравнение состояния

dP 1 (t )/ dt =- μP 1 (t )+λ P 0 (t )

Таким образом, для описания вероятностей состояния элемента получена система двух дифференциальных уравнений, граф состояний которого показан на рис.2

dP 0 (t )/ dt = - λ P 0 (t )+ μP 1 (t )

dP 1 (t )/ dt = λ P 0 (t ) - μP 1 (t )

Если имеется направленный граф состояний, то систему дифференциальных уравнений для вероятностей состояний Р К (к = 0, 1, 2,…) можно сразу написать, пользуясь следующим правилом: в левой части каждого уравнения стоит производная dP К (t )/ dt , а в правой – столько составляющих, сколько ребер связано непосредственно с данным состоянием; если ребро оканчивается в данном состоянии, то составляющая имеет знак плюс, если начинается из данного состояния, то составляющая имеет знак минус. Каждая составляющая равна произведению интенсивности потока событий переводящего элемент или систему по данному ребру в другое состояние, на вероятность того состояния, из которого начинается ребро.

Систему дифференциальных уравнений можно использовать для определения ВБР электрических систем, функции и коэффициента готовности, вероятности нахождения в ремонте (восстановлении) нескольких элементов системы, среднего времени пребывания системы в любом состоянии, интенсивности отказов системы с учетом начальных условий (состояний элементов).

При начальных условиях Р 0 (0)=1; Р 1 (0)=0 и (Р 0 1 =1), решение системы уравнений, описывающих состояние одного элемента имеет вид

P 0 (t ) = μ / (λ+ μ )+ λ/(λ+ μ )* e ^ -(λ+ μ ) t

Вероятность состояния отказа P 1 (t )=1- P 0 (t )= λ/(λ+ μ )- λ/ (λ+ μ )* e ^ -(λ+ μ ) t

Если в начальный момент времени элемент находился в состоянии отказа (восстановления), т.е. Р 0 (0)=0, Р 1 (0)=1 , то

P 0 (t) = μ/ (λ +μ)+ μ/(λ +μ)*e^ -(λ +μ)t

P 1 (t) = λ /(λ +μ)- μ/ (λ +μ)*e^ -(λ +μ)t


Обычно в расчетах показателей надежности для достаточно длительных интервалов времени (t ≥ (7-8) t в ) без большой погрешности вероятности состояний можно определять по установившимся средним вероятностям -

Р 0 (∞) = К Г = Р 0 и

Р 1 (∞) = К П 1 .

Для стационарного состояния (t →∞) P i (t) = P i = const составляется система алгебраических уравнений с нулевыми левыми частями, поскольку в этом случае dP i (t)/dt = 0. Тогда система алгебраических уравнений имеет вид:

Так как Кг есть вероятность того, что система окажется работоспособной в момент t при t , то из полученной системы уравнений определяетсяP 0 = Кг .,т.е вероятность работы элемента равна стационарному коэффициенту готовности, а вероятность отказа – коэффициенту вынужденного простоя:

lim P 0 (t ) = Кг = μ /(λ+ μ ) = T /(T + t в )

lim P 1 (t ) = Кп = λ /(λ+ μ ) = t в /(T + t в )

т.е., получился тот же результат, что и при анализе предельных состояний с помощью дифференциальных уравнений.

Метод дифференциальных уравнений может быть использован для расчета показателей надежности и невосстанавливаемых объектов (систем).

В этом случае неработоспособные состояния системы являются «поглощающими» и интенсивности μ выхода из этих состояний исключаются.

Для невосстанавливаемого объекта граф состояний имеет вид:

Система дифференциальных уравнений:

При начальных условиях: P 0 (0) = 1; P 1 (0) = 0 , используя преобразование Лапласа вероятности нахождения в работоспособном состоянии, т. е. ВБР к наработке t составит .

Анализ вида и последствий отказа - АВПО (Failure Mode and Effects Analysis - FMEA) применяется для качественной оценки надежности и безопасности технических систем. Анализ вида и последствий отказа представляет собой метод, позволяющий идентифицировать тяжесть последствий видов потенциальных отказов и обеспечить меры по снижению рисков. Существенной чертой этого метода является рассмотрение каждой системы в целом и каждой составной ее части (элемента) на предмет того, каким образом он может стать неисправным (вид и причина отказа) и как этот отказ воздействует на технологическую систему (последствия отказа). Термин «система» здесь понимается как совокупность взаимосвязанных или взаимодействующих элементов (ГОСТ Р 51901.12-2007 ) и используется для описания аппаратных (технических) средств, программного обеспечения (и их сочетания) или процесса. В общем случае АВПО применяют к отдельным видам отказов и их последствиям для системы в целом.

Рекомендуется проводить АВПО на ранних стадиях разработки системы (объекта, продукции), когда устранение или уменьшение количества и (или) видов отказов и их последствий является экономически более эффективным. Вместе с тем принципы АВПО могут применяться на всех стадиях жизненного цикла системы. Каждый вид отказа рассматривают как независимый. Таким образом, эта процедура не подходит для рассмотрения зависимых отказов или отказов, являющихся следствием последовательности нескольких событий.

Анализ вида и последствий отказа является методом анализа индуктивного типа, по схеме «снизу-вверх», с помощью которого систематически, на основе последовательного рассмотрения одного элемента за другим, анализируются все возможные виды отказов или аварийные ситуации и выявляются их результирующие воздействия на систему. Отдельные аварийные ситуации и виды отказов элементов выявляются и анализируются для того, чтобы определить их воздействие на другие элементы и систему в целом. Метод АВПО можно выполнить более детально, чем анализ с помощью дерева отказов, поскольку при этом необходимо рассматривать все возможные виды отказов или аварийные ситуации для каждого элемента системы. Например, реле может отказать по следующим причинам: контакты не разомкнулись; запаздывание в замыкании контактов; короткое замыкание контактов на корпус, источник питания, между контактами и в цепях управления; дребезжание контактов; неустойчивый электрический контакт; контактная дуга; разрыв обмотки и пр.

Примерами общих видов отказов могут являться:

  • ? отказ в процессе функционирования;
  • ? отказ, связанный с несрабатыванием в установленное время;
  • ? отказ, связанный с непрекращением работы в установленное время;
  • ? преждевременное включение и др.

Дополнительно для каждой категории оборудования должен быть составлен перечень необходимых проверок. Например, для резервуаров и другого емкостного оборудования такой перечень может включать:

  • ? технологические параметры: объем, расход, температуру, давление и т.д.;
  • ? вспомогательные системы: нагрева, охлаждения, электропитания, подачи, автоматического регулирования и т.д.;
  • ? особые состояния оборудования: ввод в действие, обслуживание во время работы, вывод из действия, смену катализатора и т.д.;
  • ? изменения условий или состояния оборудования: чрезмерное отклонение величины давления, гидроудар, осадок, вибрация, пожар, механическое повреждение, коррозия, разрыв, утечка, износ, взрыв и др.;
  • ? характеристики контрольно-измерительных приборов и средств автоматики: чувствительность, настройка, запаздывание и т.д.

Метод предусматривает рассмотрение всех видов отказов по каждому элементу. Анализу подлежат причины и последствия отказа (локальные -для элемента и общие-для системы), методы обнаружения и условия компенсации отказа (например, резервирование элементов или мониторинг объекта). Оценкой значимости влияния последствий отказа на функционирование объекта является тяжесть отказа. Пример классификации по категории тяжести последствий при выполнении одного из типов АВПО (в качественной форме) приведен в табл. 5.3 (ГОСТ Р 51901.12-2007).

Таблица 5.3

Классификация по тяжести отказов

Окончание

Карта проверки по результатам АВПО представляет собой изложение самого метода АВПО, а ее форма подобна используемой при выполнении других качественных методов, в том числе экспертных оценок, с отличием в большей степени детализации. Метод АВПО ориентирован на аппаратуру и механические системы, прост для понимания, не требует применения математического аппарата. Такой анализ позволяет установить необходимость внесения изменений в конструкцию и оценить их влияние на надежность системы. К недостаткам метода следует отнести значительные затраты времени на реализацию, а также то, что он не учитывает сочетания отказов и человеческого фактора.

Изучается каждый основной компонент системы с целью определения путей его перехода в аварийное состояние. Анализ является преимущественно качественным и проводится по принципу «снизу вверх» при условии появления аварийных состояний «одно за раз».

Анализ видов, последствий и критичности отказов существенно более детален, чем анализ с помощью «дерева неисправностей», так как выявляются все возможные виды отказов или аварийные ситуации для каждого элемента системы.

Например, реле может отказать по следующим причинам:

– контакты не разомкнулись или не сомкнулись;

– запаздывание в замыкании или размыкании контактов;

– короткое замыкание контактов на корпус, источник питания, между контактами и в цепях управления;

– дребезг контактов (неустойчивый контакт);

– контактная дуга, генерирование помех;

– разрыв обмотки;

– короткое замыкание обмотки;

– низкое или высокое сопротивление обмотки;

– перегрев обмотки.

Для каждого вида отказа анализируются последствия, намечаются методы устранения или компенсации отказов и составляется перечень необходимых проверок.

Например, для баков, емкостей, трубопроводов этот перечень может быть следующим:

– переменные параметры (расход, количество, температура, давление, насыщение и т. д.);

– системы (нагрева, охлаждения, электропитания, управления и т. д.);

– особые состояния (обслуживание, включение, выключение, замена содержимого и т. д.);

– изменение условий или состояния (слишком большие, слишком малые, гидроудар, осадок, несмешиваемость, вибрация, разрыв, утечка и т. д.).

Используемые при анализе формы документов подобны применяемым при выполнении предварительного анализа опасностей, но в значительной степени детализированы.

Анализ критичности предусматривает классификацию каждого элемента в соответствии со степенью его влияния на выполнение общей задачи системой. Устанавливаются категории критичности для различных видов отказов:

Метод не дает количественной оценки возможных последствий или ущерба, но позволяет ответить на следующие вопросы:

– какой из элементов должен быть подвергнут детальному анализу с целью исключения опасностей, приводящих к возникновению аварий;

– какой элемент требует особого внимания в процессе производства;

– каковы нормативы входного контроля;

– где следует вводить специальные процедуры, правила безопасности и другие защитные мероприятия;

– как наиболее эффективно затратить средства для предотвращения
аварий.

7.3.3. Анализ диаграммы всех возможных
последствий несрабатывания или аварии системы
(«дерево неисправностей»)

Данный метод анализа представляет собой совокупность приемов количественного и качественного характера для распознавания условий и факторов, которые могут привести к нежелательному событию («вершинному событию»). Учтенные условия и факторы выстраивают в графическую цепь. Начиная с вершины, выявляются причины или аварийные состояния следующих, более низких функциональных уровней системы. Анализируются многие факторы, включая взаимодействия людей и физические явления.

Внимание концентрируется на тех воздействиях неисправности или аварии, которые имеют непосредственное отношение к вершине событий. Метод особенно полезен для анализа систем с множеством областей контакта и взаимодействий.

Представление события в виде графической схемы приводит к тому, что можно без особого труда понять поведение системы и поведение включенных в него факторов. В связи с громоздкостью «деревьев» их обработка может потребовать применения компьютерных систем. Из-за громоздкости за­трудняется также проверка «дерева неисправностей».

В первую очередь метод используется при оценке риска для оценки вероятностей или частот неисправностей и аварий. В п 7.4 дано более детальное изложение метода.

7.3.4. Анализ диаграммы возможных последствий события
(«дерево событий»)

«Дерево событий» (ДС) – алгоритм рассмотрения событий, исходящих от основного события (аварийной ситуации). ДС используется для определения и анализа последовательности (вариантов) развития аварии, включающей сложные взаимодействия между техническими системами обеспечения безопасности. Вероятность каждого сценария развития аварийной ситуации рассчитывается путем умножения вероятности основного события на вероятность конечного события. При его построении используется прямая логика. Все значения вероятности безотказной работы P очень малы. «Дерево» не дает численных решений.

Пример 7.1. Допустим, путем выполнения предварительного анализа опасностей (ПАО) было выявлено, что критической частью реактора, т. е. подсистемой, с которой начинается риск, является система охлаждения реактора; таким образом, анализ начинается с просмотра последовательности возможных событий с момента разрушения трубопровода холодильной установки, называемого инициирующим событием, вероятность которого равна P(A) (рис. 7.1), т. е. авария начинается с разрушения (поломки) трубопровода – событие A .
Далее анализируются возможные варианты развития событий (B , C , D и E ), которые могут последовать за разрушением трубопровода. На рис. 7.1 изображено «дерево исходных событий», отображающее все возможные альтернативы.
На первой ветви рассматривается состояние электрического питания. Если питание есть, следующей подвергается анализу аварийная система охлаждения активной зоны реактора (АСОР). Отказ АСОР приводит к расплавлению топлива и к различным, в зависимости от целостности конструкции, утечкам радиоактивных продуктов.

Для анализа с использованием двоичной системы, в которой элементы либо выполняют свои функции, либо отказывают, число потенциальных отказов равно 2N – 1, где N – число рассматриваемых элементов. На практике исходное «дерево» можно упростить с помощью инженерной логики и свести к более простому дереву, изображенному в нижней части рис. 7.1.

В первую очередь представляет интерес вопрос о наличии электрического питания. Вопрос заключается в том, какова вероятность P B отказа электропитания и какое действие этот отказ оказывает на другие системы защиты. Если нет электрического питания, фактически никакие действия, предусмотренные на случай аварии с использованием для охлаждения активной зоны реактора распылителей, не могут производиться. В результате упрощенное «дерево событий» не содержит выбора в случае отсутствия электрического питания, и может произойти большая утечка, вероятность которой равна P A (P B ).

В случае, если отказ в подаче электрической энергии зависит от поломки трубопровода системы охлаждения реактора, вероятность P B следует подсчитывать как условную вероятность для учета этой зависимости. Если электрическое питание имеется, следующие варианты при анализе зависят от состояния АСОР. Она может работать или не работать, и ее отказ с вероятностью P C 1 ведет к последовательности событий, изображенной на рис. 7.1.

Рис. 7.1. «Дерево событий»

Следует обратить внимание на то, что для рассматриваемой системы возможны различные варианты развития аварии. Если система удаления радиоактивных материалов работоспособна, радиоактивные утечки меньше, чем в случае ее отказа. Конечно, отказ в общем случае ведет к последовательности событий с меньшей вероятностью, чем в случае работоспособности.

Рис. 7.2. Гистограмма вероятностей для различных величин утечек

Рассмотрев все варианты «дерева», можно получить спектр возможных утечек и соответствующие вероятности для различных последовательностей развития аварии (рис. 7.2). Верхняя линия «дерева» является основным вариантом аварии реактора. При данной последовательности предполагается, что трубопровод разрушается, а все системы обеспечения безопасности сохраняют работоспособность.

Методология FMEA, примеры

FMEA (Failure Mode and Effects Analysis) – это анализ видов и последствий отказов. Изначально разработанный и опубликованный военно-промышленным комплексом США (в форме стандарта MIL-STD-1629), анализ видов и последствий отказов является сегодня таким популярным, поскольку в некоторых отраслях промышленности разработаны и опубликованы специализированные стандарты, посвященные FMEA.

Несколько примеров таких стандартов:

  • MIL-STD-1629. Разработан в США и является родоначальником всех современных стандартов FMEA.
  • SAE-ARP-5580 – доработанный MIL-STD-1629, дополненный библиотекой некоторых элементов для автомобильной промышленности. Используется во многих отраслях.
  • SAE J1739 - стандарт FMEA, описывающий Анализ Видов и Последствий потенциальных Отказов при проектировании (Potential Failure Mode and Effects Analysis in Design, DFMEA) и Анализ Видов и Последствий потенциальных Отказов в производственных и сборочных процессах (Potential Failure Mode and Effects Analysis in Manufacturing and Assembly Processes, PFMEA). Стандарт помогает определить и снизить риск, предоставляя соответствующие условия, требования, рейтинговые диаграммы и рабочие листы. Как стандарт этот документ содержит требования и рекомендации, направляющие пользователя в ходе выполнения FMEA.
  • AIAG FMEA-3 – специализированный стандарт, используемый в автомобильной индустрии.
  • Внутренние FMEA-стандарты крупных компаний-автопроизводителей.
  • Исторически развивавшиеся во многих компаниях и отраслях процедуры, схожие с анализом видов и последствий отказов. Возможно, на сегодня это и есть «стандарты» FMEA наиболее широкого охвата.

Все стандарты анализа видов и последствий отказов (опубликованные или развившиеся исторически), в целом, очень схожи между собой. Приведённое ниже общее описание даёт общее представление о FMEA как методологии. Оно намеренно выполнено на не слишком глубоком уровне и охватывает большинство используемых в настоящее время подходов к FMEA.

Прежде всего, должны быть чётко определены границы анализируемой системы. Система может представлять собой техническое устройство, процесс или что угодно ещё, подлежащее FME-анализу.

Далее идентифицируются виды возможных отказов, их последствия и возможные причины возникновения. В зависимости от размера, природы и сложности системы определение видов возможных отказов может быть выполнено для всей системы в целом или для каждой её подсистемы индивидуально. В последнем случае последствия отказов на уровне подсистемы будут проявляться, как виды отказов на уровень выше. Идентификация видов и последствий отказов должна быть выполнена методом «снизу-вверх», до достижения верхнего уровня системы. Для характеристики видов и последствий отказов, определённых на верхнем уровне системы, используются такие параметры, как интенсивность, критичность отказов, вероятность возникновения и т.п. Эти параметры могут быть или рассчитаны «снизу-вверх» с нижних уровней системы, или явно заданы на её верхнем уровне. Эти параметры могут носить как количественный, так и качественный характер. В результате для каждого элемента системы верхнего уровня рассчитывается своя уникальная мера, вычисляемая из этих параметров по соответствующему алгоритму. В большинстве случаев эту меру называют «коэффициентом приоритетности риска», «критичностью», «уровнем риска» или другим подобным образом. Способы использования такой меры и методики её вычисления могут быть уникальными в каждом конкретном случае и являются хорошей отправной точкой для того, чтобы многообразие современных подходов к проведению анализа видов и последствий отказов (FMEA).

Пример применения FMEA в ВПК

Назначение параметра «Критичность» - демонстрация того, что требования к безопасности системы полностью выполнены (в простейшем случае это означает, что все показатели критичности находятся ниже заранее определенного уровня.

Аббревиатура FMECA (Failure Mode, Effects and Criticality Analysis) обозначает «Анализ видов, последствий и критичности отказов».

Основными показателями, используемыми для расчета значения Критичности, являются:

  • интенсивность отказов (определенная с помощью расчёта наработок на отказ - MTBF),
  • вероятность отказа (в процентах от показателя интенсивности отказов),
  • время наработки.

Таким образом, очевидно, что параметр критичности имеет реальное точное значение для каждой конкретной системы (или её компонента).

Существует достаточно широкий спектр доступных каталогов (библиотек), содержащих вероятности отказов разных видов для различных электронных компонентов:

  • FMD 97
  • MIL-HDBK-338B
  • NPRD3

Дескриптор библиотеки по конкретному компоненту, в общем случае, выглядит следующим образом:

Поскольку для расчета параметра критичности отказа необходимо знать значения показателя интенсивности отказов, в военно-промышленном комплексе перед применением методологии FME[C]A выполняют расчет наработок на отказ по методике MTBF, результаты которого и использует FME[C]A. Для элементов системы, показатель критичности отказа которых превышает установленные требованиями безопасности допуски, должен проводиться также соответствующий Анализ дерева отказов (FTA, Fault Tree Analysis) . В большинстве случаев анализ видов, последствий и критичности отказов (FMEA) для потребностей ВПК выполняется одним специалистом (являющимся экспертом по проектированию электронных схем или специалистом по контролю их качества) или очень небольшой группой таких специалистов.

FMEA в автомобилестроении

Для каждого Коэффициента (или Числа) приоритетности риска (Risk Priority Number, RPN) отказа, превышающего предопределенный уровень (часто равный 60 или 125), определяются и проводятся корректирующие действия. Как правило, определяются ответственные за реализацию таких мер, сроки их реализации и способ последующей демонстрации эффективности предпринятых корректирующих действий. После выполнения корректирующих мероприятий проводятся повторная переоценка значения Коэффициента приоритетности риска отказа и его сопоставление с предельной установленной величиной.

Основными показателями, используемыми для расчета значения Коэффициента приоритетности риска, являются:

  • вероятность возникновения отказа,
  • критичность,
  • вероятность обнаружения отказа.

В большинстве случаев Коэффициент приоритетности риска выводится на базе значений указанных выше трех показателей (безразмерные значения которых лежат в границах от 1 до 10), т.е. является расчётной величиной, изменяющейся в подобных же границах. Однако, в случаях наличия фактических (ретроспективных) точных значений интенсивности возникновения отказов для конкретной системы, границы нахождения Коэффициента приоритетности риска могут быть многократно расширены, например:

В большинстве случаев анализ по методологии FMEA в автомобильной промышленности осуществляется внутренней рабочей группой представителей разных подразделений (НИОКР, производственных, сервисных, контроля качества).

Особенности методик анализа FMEA, FMECA и FMEDA

Методы анализа надёжности FMEA (анализ видов и последствий отказов), FMECA (анализ видов, последствий и критичности отказов) и FMEDA (анализ видов, последствий и диагностируемости отказов), хотя и имеют много общего, содержат несколько заметных различий

Тогда как FMEA - методология, позволяющая определить сценарии (способы), по которым продукт (оборудование), устройство противоаварийной защиты (ПАЗ), технологический процесс или система могут выйти из строя (см. стандарт IEC 60812 "Analysis techniques for system reliability - Procedure for failure mode and effects analysis (FMEA)"),

FMECA, в дополнение к FMEA, ранжирует идентифицированные виды отказов в порядке их важности (критичности) посредством вычисления одного из двух показателей - числа приоритетности риска (Risk Priority Number) или критичности (failure criticality) отказа,

а целью FMEDA является вычисление частоты (интенсивности) отказов (failure rate) конечной системы, в качестве которой может рассматриваться устройство или группа устройств, выполняющая более сложную функцию. Методология анализа видов, последствий и диагностируемости отказов FMEDA была сначала разработана для анализа электронных устройств, а впоследствии распространена на механические и электромеханические системы.

Общие понятия и подходы FMEA, FMECA и FMEDA

FMEA, FMECA и FMEDA используют общие базовые понятия компонентов, устройств и их компоновки (взаимодействия). Функция противоаварийной защиты (Safety Instrumented Function, SIF) состоит из нескольких устройств, которые должны обеспечить выполнение необходимой операции по защите машины, оборудования или технологического процесса от последствий опасности, сбоя. Примерами устройств ПАЗ могут служить преобразователь, изолятор, контактная группа и т.п.

Каждое устройство состоит из компонентов. Например, преобразователь может состоять из таких компонентов, как прокладки, болты, мембрана, электронная схема и т.д.

Сборка из устройств может рассматриваться, как одно комбинированное устройство, реализующее функцию ПАЗ. Например, привод-позиционер-клапан - это сборка устройств, которую совокупно можно рассматривать в качестве конечного элемента безопасности ПАЗ. Компоненты, устройства и сборки могут являться частями конечной системы для целей её оценки методами FMEA, FMECA или FMEDA.

Базовая методология, лежащая в основе FMEA, FMECA и FMEDA, может применяться до или во время проектирования, производства или окончательного монтажа конечной системы. Базовая методология рассматривает и анализирует виды отказов каждого компонента, являющегося частью каждого устройства, для оценки шанса отказа всех компонентов.

В случаях выполнения FME-анализа для сборки в дополнение к идентификации видов и последствий отказов должна быть разработана блок-схема (диаграмма) надёжности этой сборки для оценки взаимодействия устройств между собой (см. стандарт IEC 61078:2006 "Analysis techniques for dependability - Reliability block diagram and boolean methods").

Входные данные, результаты и оценки результатов выполнения FMEA, FMECA, FМEDA схематично показаны на картинке (справа). Увеличить картинку.

Общий подход определяет следующие основные шаги FME-анализа:

  • определение конечной системы и её структуры;
  • определение возможных сценариев для выполнения анализа;
  • оценка возможных ситуаций комбинаций сценариев;
  • выполнение FME-анализа;
  • оценка результатов FME-анализа (в т.ч. FMECA, FMEDA).

Применение к результатам анализа видов и последствий отказов (FMEA) методики FMECA даёт возможность оценки связанных с отказами рисков, а методики FMEDA - возможность оценки надёжности.

Для каждого простого устройства разрабатывается таблица FME, которая затем применяется каждого определённого сценария выполнения анализа. Структура таблицы FME может варьироваться для FMEA, FMECA или FMEDA, а также в зависимости от природы конечной анализируемой системы.

Результатом выполнения анализа видов и последствий отказов является отчет, содержащий все выверенные (при необходимости, скорректированные рабочей группой экспертов) FME-таблицы и выводы / суждения / решения, касающиеся конечной системы. Если после выполнения FME-анализа конечная система модифицируется, процедуру FMEA необходимо выполнить повторно.

Различия оценок и результатов FME-, FMEC- и FMED-анализа

Хотя основные шаги при выполнении FME-анализа, в целом, одинаковы для FMEA, FMECA и FMEDA, оценка и результаты различаются.

Результаты выполнения анализа FMECA включают результаты FMEA, а также ранжирование всех видов и последствий отказов. Это ранжирование используется для определения компонентов (или устройств) с более высокой степенью влияния на надёжность конечной (целевой) системы, характеризуемую такими показателями безопасности, таких как средняя вероятность отказа по требованию (PFDavg), средняя опасная частота отказа (PFHavg).), среднее время наработки на отказ (MTTFs) или среднее время до опасного отказа (MTTFd).

Результаты FMECA могут использоваться для качественной или количественной оценки, и в обоих случаях они должны быть представлены матрицей критичности конечной системы, показывающей в графическом виде, какие компоненты (или устройства) оказывают большее / меньшее влияние на надежность конечной (целевой) системы.

Результаты FMEDA включают результаты FMEA и данные о надежности конечной системы. Они могут использоваться для проверки соответствия системы целевому уровню SIL, сертификации SIL или в качестве основания при расчете целевого SIL устройства ПАЗ .

FMEDA предоставляет количественные оценки таких показателей надежности, как:

  • Safe detected failure rate (интенсивность диагностируемых / обнаруживаемых безопасных отказов) - частота (интенсивность) отказов конечной системы, переводящих её рабочее состояние из нормального в безопасное. Система или оператор ПАЗ уведомлены, целевая установка или оборудование защищены;
  • Safe undetected failure rate (интенсивность недиагностируемых / необнаруживаемых безопасных отказов) - частота (интенсивность) отказов конечной системы, переводящих её рабочее состояние из нормального в безопасное. Система или оператор ПАЗ не уведомлены, целевая установка или оборудование защищены;
  • Dangerous detected failure rate (интенсивность диагностируемых / обнаруживаемых опасных отказов) - частота (интенсивность) отказов конечной системы, при которой она будет оставаться в нормальном состоянии, когда возникнет необходимость, но система или оператор ПАЗ уведомлены для устранения проблемы или выполнения технического обслуживания. Целевая установка или оборудование не защищены, но проблема идентифицирована, и есть шанс устранить неисправность до того, как возникнет необходимость;
  • Dangerous undetected failure rate (интенсивность недиагностируемых / необнаруживаемых опасных отказов) - частота (интенсивность) отказов конечной системы, при которой она будет оставаться в нормальном состоянии, когда возникнет необходимость, но система или оператор ПАЗ не уведомлены. Целевая установка или оборудование не защищены, проблема является скрытой, и единственным способом выявления и устранения неисправности является выполнение контрольного теста (проверки). При необходимости оценка FMEDA может выявить, какая часть недиагностируемых опасных отказов может быть идентифицирована с помощью контрольного теста. Другими словами, оценка FMEDA помогает обеспечить показатели Эффективности контрольного теста (Et) или Покрытия контрольного теста (PTC) при выполнении контрольного тестирования (проверки) конечной системы;
  • Annunciation failure rate (интенсивность отказов-оповещений) - частота (интенсивность) отказов конечной системы, которая не повлияет на показатели безопасности при переводе её рабочего состояния из нормального в безопасное состояние;
  • No effect failure rate (интенсивность отказов без последствий) - частота (интенсивность) любых других отказов, которые не приведут к переходу рабочего состояния конечной системы из нормального в безопасное или опасное.

Компания KConsult C.I.S. предлагает профессиональные услуги сертифицированных европейских инженеров-практиков по выполнению анализа FMEA, FMECA, FMEDA, а также внедрению методологии FMEA в повседневную деятельность промышленных предприятий.

Анализ видов и последствий отказов компонентов технической и функциональной структур проектируемой системы является первым этапом проектного исследования надежности и безопасности. Общепринятой международной аббревиатурой для обозначения анализа видов и последствий отказов является FMEA (failure mode and effect analysis). Этот вид анализа относится к классу предварительного качественного и упрощенного количественного анализа на стадии проектирования. Если проводятся количественные оценки, то употребляется термин FMECA (failure mode, effect and criticality analysis – анализ видов, последствий и критичности отказов). Первые опыты проведения FMEA относятся к аэрокосмическим проектам 60-х годов СССР и США. В 80-х годах процедуры FMEA стали внедряться в автомобильной промышленности США в Ford Motor Company. В настоящее время анализ видов и последствий отказов является обязательным этапом проектной оценки надежности и безопасности объектов космической, авиастроительной, атомной, химико-технологической, газо-нефтеперерабатывающих и др. отраслей. В областях, где этот этап не является обязательным, возникают опасные инциденты, приводящие к большим экономическим и экологическим потерям и угрожающие жизни и здоровью людей. Достаточно вспомнить драматические события обрушения публичных московских зданий, построенных по проектам, где дефект лишь одного элемента несущей конструкции (штифта, колонны) привел к катастрофическим последствиям.

Можно выделить три основные цели проведения FMEA

  • выявление потенциально-возможных видов отказов компонентов системы и определение их влияния на систему в целом и возможно окружающую среду
  • классификация видов отказов по уровням критичности или по уровням критичности и частоте возникновения (FMECA)
  • выдача рекомендаций по пересмотру проектных решений с целью компенсации или устранения опасных видов отказов

FMEA является наиболее стандартизованной областью “надежностных” исследований. Процедура проведения и вид входной/выходной документации регламентируется соответствующими стандартами. Международно признанными являются документы:

· MIL-STD-1629 Style FMECAs - руководство по проведению анализа видов и последствий отказов, оценки критичности, выявлению узких мест конструкций с точки зрения ремонтопригодности и живучести. Первоначально был ориентирован на военные применения.

· SAE J1739, AIG-FMEA3, FORD FMEA – пакет документов, регламентирующих проведение анализа видов и последствий отказов для объектов автомобильной промышленности, включая стадии проектирования и изготовления

· SAE ARP5580 – руководство по проведению FMEA как коммерческих, так и военных проектов, объединяющее положения MIL-STD-1629 и автомобильных стандартов. Введено понятие групп эквивалентных отказов, т.е. отказов, порождающих одинаковые последствиями и требующих проведения одинаковых корректирующих действий.


Общим для всех стандартов является то, что они регламентируют лишь последовательность и взаимосвязь этапов анализа, оставляя проектировщику свободу действий при конкретной реализации каждого этапа. Так, допускается произвольная настройка структуры таблиц FMEA, определение шкал частот возникновения отказов и тяжести последствий, введение дополнительных признаков классификации отказов и пр.

Этапы выполнения FMEA:

· построение и анализ функциональной и/или технической структур объекта

· анализ условий эксплуатации объекта

· анализ механизмов отказов элементов, критериев и видов отказов

· классификация (перечень) возможных последствий отказов

· анализ возможных способов предотвращения (уменьшения частоты) выделенных отказов (последствий отказов)

Техническая структура объекта анализа обычно имеет древовидное, иерархическое представление (рис.3). Возможные виды отказов перечисляются для компонентов нижнего уровня (листьев дерева), а их последствия оцениваются с точки зрения влияния на подсистемы следующего уровня (родительские узлы дерева) и объект в целом.

Рис.3. Иерархическое представление объекта анализа

На рис.4. приведен фрагмент таблицы FMEA, содержащий данные анализа видов и последствий отказов оборудования химико-технологического объекта.

Рис.4. Фрагмент таблицы FMEA.

При выполнении количественных оценок проектных решений по FMEA виды отказов компонентов принято характеризовать тремя параметрами: частота возникновения, степень обнаружения, тяжесть последствий. Так как анализ носит предварительный характер, то обычно используют балльные экспертные оценки этих параметров. Например, в ряде документов предлагаются следующие классификации видов отказов по частоте (таблица 2), по степени обнаружения (таблица 3), по тяжести последствий (таблица 4).

Таблица 2. Классификация отказов по частоте.