Posts Tagged with "average PUD"

既に発行済みのブログであっても適宜修正・追加することがあります。
Even in the already published blog, we may modify and add appropriately.

Down rate及びADRの取り下げ

posted by sakurai on July 18, 2019

以前の記事において、

☆(瞬間)ダウン率(Down Rate)

$$ \varphi_{item}(t):=\lim_{dt \to 0}\frac{\Pr\lbrace\mathrm{item\ down\ in\ }(t,t+dt]\ |\ \mathrm{item\ up\ at\ }t\rbrace}{dt}=\frac{q_{item}(t)}{A_{item}(t)} \tag{131.14} $$ 又は、微小ダウン確率形式として、 $$ \varphi_{item}(t)dt=\Pr\lbrace\mathrm{item\ down\ in\ }(t,t+dt]\ |\ \mathrm{item\ up\ at\ } t\rbrace \tag{131.15} $$ 修理系システムで、時刻$t$で稼働している条件において、単位時間あたりに不稼働になる条件付き確率。正確には、時刻$t$から$t+dt$までに不稼働になる条件付き確率を$dt$で割り単位時間あたりとしたもの。conditional failure intensity (条件付き故障強度), Vesely failure rate (Veselyの故障率)。

☆平均ダウン率(Average Down Rate, ADR)

$ADR:=\overline{\varphi_{item}}$の存在を仮定し、$\varphi_{item}(t)A_{item}(t)=q_{item}(t)$、すなわちPUDの両辺を$0$から$T$まで積分すれば、 $$ \int_0^T\overline{\varphi_{item}}A_{item}(t)dt=\int_0^T q_{item}(t)dt \tag{66.16} $$ ここで、$\int_0^T A(t)dt\approx T$を用いれば、 $$ ADR=\overline{\varphi_{item}}\approx\frac{1}{T}\int_0^T q_{item}(t)dt=\frac{1}{T}Q_{item}(T)=\frac{1}{T}\Pr\lbrace\mathrm{item\ down\ at\ }T\rbrace=M_{PMHF} \tag{66.17} $$ これは結果的としてPFHと同じになりますが、FSマイクロではPMHFはADRであると考え、PFHであるとは考えていません。その理由はエンジニアにとって故障率$\lambda$は大変なじみのある値で、それを修理系に拡張したダウン率$\varphi(t)$やその車両寿命における平均値ADRを算出するのが自然ですが、不稼働密度$q(t)$の平均値を算出するのは不合理であるためです。故障確率という意味では、むしろ密度よりもアイテムの車両寿命における不稼働確率$Q(T)$を知りたいところですが、なぜ確率密度の平均値を知りたいのでしょう?

という記述を掲載していましたが、down rate及びADRを取り下げます。なぜなら、down rate$\varphi(t)$が、今回のモデルに限っては、故障率$\lambda$と一致するためです。 $$ \varphi_\text{IF}(t)dt=\Pr\lbrace\mathrm{IF\ down\ in\ }(t,t+dt]\ |\ \mathrm{IF\ up\ at\ } t\rbrace\\ =\frac{\Pr\{\text{IF down in }(t, t+dt]\cap\text{IF up at }t\}}{\Pr\{\text{IF up at }t\}}=\frac{q_\text{IF}(t)}{A_\text{IF}(t)}dt \tag{131.1} $$ ここで、アベイラビリティは、定期診断・修理の場合に限り、 $$ A_\text{IF}(t)=(1-K_\text{IF,MPF})R_\text{IF}(t)+K_\text{IF,MPF}R_\text{IF}(u), \text{ただし}u=t\mod\tau\tag{131.2} $$ $$ q_\text{IF}(t)=(1-K_\text{IF,MPF})f_\text{IF}(t)+K_\text{IF,MPF}f_\text{IF}(u), \text{ただし}u=t\mod\tau\tag{131.3} $$ であり、(131.2)の両辺に$\lambda_\text{IF}$をかければ、(131.3)より、 $$ A_\text{IF}(t)\lambda_\text{IF}=(1-K_\text{IF,MPF})R_\text{IF}(t)\lambda_\text{IF}+K_\text{IF,MPF}R_\text{IF}(u)\lambda_\text{IF}\\ =(1-K_\text{IF,MPF})f_\text{IF}(t)+K_\text{IF,MPF}f_\text{IF}(u)=q_\text{IF}(t)\tag{131.4} $$ よって、(131.1)は、 $$ \require{cancel} \varphi_\text{IF}(t)\cancel{dt}=\frac{q_\text{IF}(t)}{A_\text{IF}(t)}\cancel{dt}=\lambda_\text{IF}\cancel{dt}\tag{131.5} $$ これにより、down rateが定数となってしまうため、ADR(平均down rate)も定数(=故障率)となり、PMHFは故障率そのものということになってしまいます。

従って、PMHFの定義はPFHや$w_{avg}$と同じように、平均PUDとします。PMHFの定義のみの変更であり、式及び論証は変わりません。 $$ M_\text{PMHF}:=\overline{PUD}=\frac{1}{T}\int_0^T q(t)dt=\frac{1}{T}Q(T) $$


左矢前のブログ 次のブログ右矢

PMHF計算の簡便法(2)

posted by sakurai on July 15, 2019

前回の前提を変えてみます。2nd Editionと同じ条件で、IFもSMもリペアラブルとします。

ただ、そう簡単でないのは、DPF1の再計算でも記したように、上記にも関わらず、SPFとなる部分はアンリペアラブルのままという点です。フォールトを起こして一発VSGとなる部分は修理が不可であるため、反対にVSG preventable部分のみがリペアラブルとなります。

そのため、前稿と同様に一括で求めようとしてもうまく行きません。

図%%.1
図129.1 VSG条件表(IFのフォールト)

前項の表と異なるのは、前述のように表129.1のVSG prevention=Yesの右半分のみ、IFがリペアラブルとなるためです。従って前稿と異なり、場合分けで求めます。

IFのフォールトによるVSG

まず前提確率を求めるため、IFのフォールトでVSGとなる、$t$におけるSMの条件を考えます。non preventable(=アンリペアラブル)部分とpreventable(=リペアラブル)部分に縦に分解すると、それぞれ、 $$ \begin{cases} \Pr\{\overline{\text{IF preventable}}\}&=1-K_\text{IF,RF}\\ \\ \Pr\{\text{IF preventable}\cap\text{SM down at }t\}&=K_\text{IF,RF}Q_\text{SM}(t)\tag{129.1} \end{cases} $$ となります。

次に遷移確率を求めるため、微小区間$(t, t+dt]$においてIFのフォールトが起きる場合を考えます。この確率を式で表せば、 $$ \Pr\{\text{IF up at }t\cap\text{IF down in }(t, t+dt]\}\tag{129.2} $$ ですが、同様に縦に分解すれば、リペアラブル、アンリペアラブルの場合のそれぞれの遷移確率は、 $$ \begin{cases} \Pr\{\text{(unrepairable)IF up at }t\cap\text{(unrepairable)IF down in }(t, t+dt]\}&=f_\text{IF}(t)dt\\ \\ \Pr\{\text{(repairable)IF up at }t\cap\text{(repairable)IF down in }(t, t+dt]\}&=q_\text{IF}(t)dt\tag{129.3} \end{cases} $$ となります(表129.1の最下段)。

従ってIFのフォールトによるPUDは、前提確率遷移確率の積となるため、それぞれ $$ \begin{cases} PUD_\text{IF,unrepairable}&=(1-K_\text{IF,RF})f_\text{IF}(t)dt\\ \\ PUD_\text{IF,reairable}&=K_\text{IF,RF}Q_\text{SM}(t)q_\text{IF}(t)dt\tag{129.4} \end{cases} $$ となり、IFのフォールトによる平均PUDは $$ \overline{PUD_\text{IF}}=\frac{1}{T_\text{lifetime}}\int_0^{T_\text{lifetime}} \img[-1.35em]{/images/withinseminar.png} \tag{129.5} $$ この後は積分して平均PUDを求めます。

SMのフォールトによるVSG

図%%.1
図129.2 VSG条件表(SMのフォールト)

まず前提確率を求めるため、SMのフォールトでVSGとなる、$t$におけるIFの条件を考えると、 $$ \Pr\{\text{(repairable)IF down at }t\cap\text{IF preventable}\}=K_\text{IF,RF}Q_\text{IF}(t)\tag{129.6} $$ 次に遷移確率を求めるため、微小区間$(t, t+dt]$においてSMのフォールトが起きる場合を考えます。この事象を式で表せば、 $$ \Pr\{\text{SM up at }t\cap\text{SM down in }(t, t+dt]\}=q_\text{SM}(t)dt\tag{129.7} $$ よってSMのフォールトによるPUDは、前提確率遷移確率の積となるため、 $$ PUD_\text{SM}=\Pr\{\text{(repairable)IF down at }t\cap\text{IF preventable}\}\\ \cdot\Pr\{\text{SM up at }t\cap\text{SM down in }(t, t+dt]\}\\ =K_\text{IF,RF}Q_\text{IF}(t)q_\text{SM}(t)dt\tag{129.8} $$ となり、SMのフォールトによる平均PUDは $$ \overline{PUD_\text{SM}}=\frac{1}{T_\text{lifetime}}\int_0^{T_\text{lifetime}} \img[-1.35em]{/images/withinseminar.png} \tag{129.9} $$ この後は積分して平均PUDを求めます。 前回の記事はこちら。


左矢前のブログ 次のブログ右矢

PMHF計算の簡便法

posted by sakurai on July 11, 2019

記事#103~#108(暫定的に非公開)のように、マルコフ連鎖図を書き、ひとつずつケース分解して求めるのが一番間違いが無い方法ですが、簡便法を試してみます。ここで簡便法というのは、マルコフ連鎖図を書かずに、時刻$t$におけるIFとSMの状態を別個に考え(結局はマルコフ連鎖図と等価ですが)、時刻$t$から$t+dt$の微小時間間隔でのフォールトについて、サブシステムが故障となる場合を考えます。ここでは1st Editionと同じ条件で、IFがアンリペアラブル、SMがリペアラブルとします。

以下のPUDの導出に際して、前提確率遷移確率に分解して求めます。前提確率とは、時刻$t$において、どの状態になっているかの確率であり、遷移確率とは、微小区間$(t,t+dt]$におけるダウン確率です。今回のモデルでは両者は独立であるため、$\cap$条件は確率の積となります。

IFのフォールトによるVSG

まず前提確率を求めるため、IFのフォールトでVSGとなる、$t$におけるSMの条件を考えるのですが、逆に、IFのフォールトによりVSGとならないのは、表127.1で示すように、「SMが稼働していて、かつそれがVSG抑止する場合」のみです。

図%%.1
図127.1 VSG条件表(IFのフォールト)

よって、その条件の否定がVSG条件なので前提確率式で表せば、 $$ \Pr\{\overline{\text{SM up at }t\cap\text{IF preventable}}\}=1-\Pr\{\text{SM up at }t\}\cdot\Pr\{\text{IF preventable}\}\\ =1-A_\text{SM}(t)K_\text{IF,RF}\tag{127.1} $$

次に遷移確率を求めるため、微小区間$(t, t+dt]$においてIFのフォールトが起きる場合を考えます。この事象を遷移確率式で表せば、 $$ \Pr\{\text{(unrepairable)IF up at }t\cap\text{(unrepairable)IF down in }(t, t+dt]\}=f_\text{IF}(t)dt\tag{127.2} $$ となります。

よってIFのフォールトによるPUDは、前提確率遷移確率の積となるため、 $$ PUD_\text{IF}=\Pr\{\text{(unrepairable)IF up at }t\cap\text{(unrepairable)IF down in }(t, t+dt]\}\\ \cdot\Pr\{\overline{(\text{SM up at }t\cap\text{IF preventable})}\}\\ =\left[1-A_\text{SM}(t)K_\text{IF,RF}\right]f_\text{IF}(t)dt\tag{127.3} $$ となり、IFのフォールトによる平均PUDは $$ \overline{PUD_\text{IF}}=\frac{1}{T_\text{lifetime}}\int_0^{T_\text{lifetime}} \img[-1.35em]{/images/withinseminar.png} \tag{127.4} $$ この後は(62.3)につなげて、積分して平均PUDを求めます。この手法のメリットは、いちいちIFのフォールトによるSPFとDPFを分けて考えずに一度で求められる点です。

SMのフォールトによるVSG

まず前提確率を求めるため、SMのフォールトでVSGとなる、$t$におけるIFの条件を考えると、「IFがダウンしているがVSGとなっていないとき」です。なぜなら、SMのフォールトでVSGとなるのは、SMがSPFを起こせない以上DPFの場合に限られ、かつIFのフォールトによりVSGとなってはIFによるSPFが起きてしまうので、IFのダウンかつVSGでないときに限られます。

図%%.1
図127.2 VSG条件表(SMのフォールト)

よって、VSG条件を前提確率式で表せば、 $$ \Pr\{\text{(unrepairable)IF down at }t\cap\text{IF preventable}\}=F_\text{IF}(t)K_\text{IF,RF}\tag{127.5} $$ 次に遷移確率を求めるため、微小区間$(t, t+dt]$においてSMのフォールトが起きる場合を考えます。これを遷移確率式で表せば、 $$ \Pr\{\text{SM up at }t\cap\text{SM down in }(t, t+dt]\}=q_\text{SM}(t)dt\tag{127.6} $$ よってSMのフォールトによるPUDは、前提確率遷移確率の積となるため、 $$ PUD_\text{SM}=\Pr\{\text{(unrepairable)IF down at }t\cap\text{IF preventable}\}\\ \cdot\Pr\{\text{SM up at }t\cap\text{SM down in }(t, t+dt]\}\\ =K_\text{IF,RF}F_\text{IF}(t)q_\text{SM}(t)dt\tag{127.7} $$ となり、SMのフォールトによる平均PUDは $$ \overline{PUD_\text{SM}}=\frac{1}{T_\text{lifetime}}\int_0^{T_\text{lifetime}} \img[-1.35em]{/images/withinseminar.png} \tag{127.8} $$ この後は(65.1)につなげて、積分して平均PUDを求めます。 次回の記事はこちら。

左矢前のブログ 次のブログ右矢

posted by sakurai on July 9, 2019

さて、前稿平均PUD計算は簡易的に、冗長システムの確率の1/2として求めましたが、厳密には、

例えば全ての部品を二重化しておき、片方が壊れてももう片方がそれを引き継ぐことができる

という、スタンバイシステムについて平均PUD計算する必要があります。常に両方が稼働する冗長(2重化)と異なり、主系がフォールトしたときに初めて従系が稼働するものです。

IF、SM1からなるサブシステムがあり、IF、SM1の両方ともアンリペアラブルだとします。それぞれの故障率は、$\lambda_\text{IF}$及び$\lambda_\text{SM}$とします。上記のように、IFもSM1も$t=0$から同時に動作している冗長系ではなく、時刻$t$において主系であるIFがダウンし、即座にスタンバイ系であるSM1が引き続いて動作するものとします。

すると、車両寿命$T_\text{lifetime}$における信頼度は、IFが$T_\text{lifetime}$までにダウンしないか、あるいは、途中の時刻$t$でダウンしたとしても、そこからSM1が$T_\text{lifetime}$までダウンせずに稼働する確率なので、

$$ R_\text{subsystem}(T_\text{lifetime})=\Pr\{\text{IF not failed at }T_\text{lifetime}\}\\ +\int_0^{T_\text{lifetime}}\Pr\{\text{IF fails in }(t + dt]\cap\text{IF not failed at }t\cap\text{SM not failed in }(T_\text{lifetime}-t]\}\\ =R_\text{IF}(T_\text{lifetime})+\int_0^{T_\text{lifetime}}R_\text{SM}(T_\text{lifetime}-t)f_\text{IF}(t)dt\\ =R_\text{IF}(T_\text{lifetime})+\int_0^{T_\text{lifetime}}e^{-\lambda_\text{SM}(T_\text{lifetime}-t)}\lambda_\text{IF}e^{-\lambda_\text{IF}t}dt\\ =R_\text{IF}(T_\text{lifetime})+\lambda_\text{IF}e^{-\lambda_\text{SM}T_\text{lifetime}}\int_0^{T_\text{lifetime}}e^{-(\lambda_\text{IF}-\lambda_\text{SM})t} dt\\ =R_\text{IF}(T_\text{lifetime})+\lambda_\text{IF}e^{-\lambda_\text{SM}T_\text{lifetime}}\left[\frac{e^{-(\lambda_\text{IF}-\lambda_\text{SM})t}}{-(\lambda_\text{IF}-\lambda_\text{SM})}\right]_0^{T_\text{lifetime}}\\ =R_\text{IF}(T_\text{lifetime})+\lambda_\text{IF}e^{-\lambda_\text{SM}T_\text{lifetime}}\left[\frac{1-e^{-(\lambda_\text{IF}-\lambda_\text{SM})T_\text{lifetime}}}{\lambda_\text{IF}-\lambda_\text{SM}}\right]\\ =R_\text{IF}(T_\text{lifetime})+\frac{\lambda_\text{IF}}{\lambda_\text{IF}-\lambda_\text{SM}}(e^{-\lambda_\text{SM}T_\text{lifetime}}-e^{-\lambda_\text{IF}T_\text{lifetime}})\\ =\img[-1.35em]{/images/withinseminar.png}, \text{ただし、}\lambda_\text{IF}\neq\lambda_\text{SM} \tag{126.1} $$

平均PUDを求めるには不信頼度の時間平均が知りたいので、$\lambda t\ll 1$の前提で$R(t)=e^{-\lambda t}\approx1-\lambda t+\frac{1}{2}\lambda^2 t^2$と、2次項までMaclaurin展開し、平均PUDを求めると、 $$ \require{cancel} \overline{PUD}=\frac{1}{T_\text{lifetime}}F_\text{subsystem}(T_\text{lifetime})=\frac{1}{T_\text{lifetime}}\left[1-R_\text{subsystem}(T_\text{lifetime})\right]\\ \approx\frac{1}{\bcancel{T_\text{lifetime}}}\left[\bcancel{1}-(\bcancel{1}-\lambda_\text{IF}\bcancel{T_\text{lifetime}}+\frac{1}{2}{\lambda_\text{IF}}^2 {T_\text{lifetime}}^\bcancel{2})\right]\\ -\frac{1}{\bcancel{T_\text{lifetime}}}\frac{\lambda_\text{IF}}{\lambda_\text{IF}-\lambda_\text{SM}}\left[ (\bcancel{1}-\lambda_\text{SM}\bcancel{T_\text{lifetime}}+\frac{1}{2}{\lambda_\text{SM}}^2 {T_\text{lifetime}}^\bcancel{2})\\ -(\bcancel{1}-\lambda_\text{IF}\bcancel{T_\text{lifetime}}+\frac{1}{2}{\lambda_\text{IF}}^2 {T_\text{lifetime}}^\bcancel{2})\right]\\ =(\lambda_\text{IF}-\frac{1}{2}{\lambda_\text{IF}}^2 T_\text{lifetime})-\frac{\lambda_\text{IF}}{\bcancel{\lambda_\text{IF}-\lambda_\text{SM}}}\left[(\bcancel{\lambda_\text{IF}-\lambda_\text{SM}})-\frac{1}{2}T_\text{lifetime}(\bcancel{\lambda_\text{IF}-\lambda_\text{SM}})(\lambda_\text{IF}+\lambda_\text{SM})\right]\\ =(\bcancel{\lambda_\text{IF}}-\bcancel{\frac{1}{2}{\lambda_\text{IF}}^2 T_\text{lifetime}})-\lambda_\text{IF}\left[\bcancel{1}-\frac{1}{2}T_\text{lifetime}(\bcancel{\lambda_\text{IF}}+\lambda_\text{SM})\right]\\ =\img[-1.35em]{/images/withinseminar.png} \tag{126.2} $$ 以上から、前稿の2重化での簡易計算と完全一致します。


左矢前のブログ 次のブログ右矢

あるWebの記事について(2)

posted by sakurai on July 8, 2019

同じ記事のPMHFについても怪しいところがあります。

まずPMHFそのものは単純で故障する頻度そのものである。ただ実際には1億回あたり1回未満というのはかなり難しい。一般にエレクトロニクス業界で使われている故障頻度には「FIT」(Failure in Time:10億時間あたりに発生する故障回数)と呼ばれるものがあるが、自動車向けのMCUなどではどんなに少ないものでも20FIT(10億時間あたり20回)といわれており、このままでは10^-8/hを満たせない。 ただ、PMHFは、ある特定の回路そのものの故障頻度ではなく、システム全体の故障頻度と見なすこともできる。例えば全ての部品を二重化しておき、片方が壊れてももう片方がそれを引き継ぐことができるとすれば、トータルとしての故障頻度は10FITに減る計算になり、これでASIL DのPFHFの目標をクリアできることになるからだ。

要約すれば、主系とバックアップ系が、それぞれ20FITの故障率を持つ2重化システムがあるとき、「トータルとしての故障頻度」が10FITになるということのようです。

実際には「トータルとしての故障頻度」はDPF(Dual Point Failure)の時であるから、車両寿命を$T_\text{lifetime}$として単純な確率計算では、 $$ \Pr\{\text{DPF}\}=\Pr\{\text{Channel 1 failed}\cap\text{Channel 2 failed}\} =\Pr\{\text{Channel 1 failed}\}\Pr\{\text{Channel 2 failed}\}\\ =(\lambda_\text{IF}T_\text{lifetime})(\lambda_\text{SM}T_\text{lifetime}) =(10\times 10^{-9})^2{T_\text{lifetime}}^2=1\times 10^{-16}{T_\text{lifetime}}^2 $$ となります。

この確率には主系⇒バックアップ系のフェイルオーバーだけでなく、その逆の場合も含まれるので、フェイルオーバーの場合の平均PUDを求めると、この1/2を$T_\text{lifetime}$で割った値となります。 $$ \overline{PUD}=\frac{1}{2}\lambda_\text{IF}\lambda_\text{SM}T_\text{lifetime} $$

この値は、車両寿命がいくら大きくても10FITにはなりません。例えば車両寿命が10万時間の場合の平均PUDは、 $$ \overline{PUD}=\frac{1}{2}\lambda_\text{IF}\lambda_\text{SM}T_\text{lifetime}=0.5\times 10^{-16}\cdot 1\times 10^{5}=0.005[FIT] $$ となります。逆にこれが10FITだとすると、車両寿命は5,708年というあり得ない値となってしまいます。

誤りの原因は2重化の場合の確率計算を引き算にしてしまったところにあります。本来は2重化システムにおいては、主系に故障があっても、バックアップ系が動作するフォールトトレラント性があるため、引き続いてバックアップ系にもフォールトが起きないとシステムの故障とはなりません。従って、確率計算としてはいずれかにフォールトが起こる足し算ではなく、両方にフォールトが起こる掛け算とすべきです。

以前の記事のように、レアイベント近似を用いれば、直列系は確率の足し算、並列系は確率の掛け算となります。従って、直列系であればむしろ、20FIT+20FIT=40FITと増えてしまうので、故障率低減効果がありません。従って表記の記事は2重に(並列系を直列系に、加算を減算に)誤っていることになります。


左矢前のブログ 次のブログ右矢

8.3.1 マイコンの取り扱い他

posted by sakurai on June 28, 2019

8.3.1 マイコンの取り扱い

1st EditionではPart 10が主にISO 26262を半導体に適用する場合のガイドラインであったため、マイコンの取り扱いはPart 10に存在しましたが、2nd Editionになって、Part 10は全般的なガイドラインとなり、Part 11としてISO 26262を半導体に適用する場合のガイドラインが新設されたため、ISO 26262をマイコンに適用する場合の話題がPart 11に移動しました。

8.3.2 PMHF式

PMHF式については説明が追加されました。しかしながら、導出過程や導出前提を明らかにしたものではありません。また、式自体にも疑義があります。弊社ではPMHFを1st Edition発効から8年間に渡って研究しており、その結果としてIEEE最優秀論文賞を得ることができました。この論文は1st Editionの式を対象としていますが、新たに2nd Editonで式が変更されたため、それに基づく論文をIEEEに投稿中です。従って、式の導出を含めた詳細は $\img[-1.35em]{/images/withinseminar.png}$

12 システム開発のガイダンス

1st Editionの思想から拡張されているフォールトトレランス(耐故障性)についてまとめられた節が新設されました。1st Editionの思想は、とにかくフォールトが発生した場合にはFTTI中にシステムを安全状態に持っていけば、それでハザードが回避できるため、OKでした。

ところが、例えば高速道路の追い越し車線を120KM/hで走行中にフォールトを検出し、いくら安全状態だからといって、その場で車両を停止させてしまうと、これはかなり危険な状態であることが容易に想像できます。このような場合は可能な限り左端の路側帯に寄せて停車するか、もしくは次の出口や安全な場所まで走行したいはずです。

本節ではこのような要求に対して解答を与えるものとなっており、基本的なアーキテクチャはIFに対するSM1としてバックアップ系を想定しています。例えば、IFについてASIL-Dを割り当てている時に、当然その平均PUDは10[FIT]未満となりますが、故障したときには安全状態で停止するのではなく、動作し続けることがフォールトトレラントのために必要です。しかしながら、その場合にもASIL-Dを要求するものではありません。例えば、バックアップ系の時速がある速度より遅ければASIL-Bとすることができます。すると、速度は遅くても修理工場まで走行することが可能です。

本節には2とおり例示されており、緊急動作時間(EOTTI)以内に修理するか、上記のようにバックアップ系に切り替われば良いことになります。問題はEOTTIがあまりにも短い場合(例えば1sec未満)は修理工場に行くことができないので、その計算が必要となります。それが12.3.1.1に示されています。

次の図120.1の(2)は前記事にも掲載されている、2nd EditionのPMHF式(図109.3)の$T_\mathrm{service}$を$T_\mathrm{eotti}$と置き、$T_\mathrm{eotti}$について解いた式となっています。

図%%.1
図120.1 PMHF式に基づくEOTTIの導出

一方、次の図120.2の(3)は、ワースト時を想定しているようです。バックアップ系がEOTTI時間走行する状態での故障確率式です。

図%%.2
図120.2 車両寿命間の故障に基づくEOTTIの導出

いずれの式にも問題がありそうなので、次項で説明します。


左矢前のブログ 次のブログ右矢

posted by sakurai on June 4, 2019

1st EditionのPMHF式

以下に1st EditionのPMHF第1式及び第3式を示します。第1式はIFによりSPFもしくはDPFが発生する場合のみを数え上げた式であり、第3式はそれに加えてSM1によるDPFも加えた式です。従って、全ての場合を考えるならば第3式を使うのが正しいと考えます。

図%%.1
図109.1 1st EditionのPMHF第1式

図%%.2
図109.2 1st EditionのPMHF第3式

1st EditionにおいてはIFがアンリペアラブル、SM1がリペアラブルという前提での計算に基づいていると考えらえます。その理由は、この前提で、前項のCTMCから平均PUDを求めると、正確に上2式と一致するためです。

2nd EditionのPMHF式

以下に2nd EditionのPMHF式を示します。

図%%.3
図109.3 2nd EditionのPMHF式

ISO 26262の2nd EditionのPMHF式は、1st Editionとpattern3、4が異なっており、対称性からみて前提が追加されていると考えます。2nd Editionでは1st Editionの前提(pattern 1, 2)に加えて、その反対の状態(pattern 3, 4)つまりIFがリペアラブル、SM1がアンリペアラブルの場合の両側についてPMHFを求めていると推測します。ただし、$T_{\mathrm{lifetime}}$項と$T_{\mathrm{service}}$項がなぜ2倍異なるのかの理由は判明していません。

しかしながら、弊社ではこの前提は誤りではないかと思います。初期状態、つまりフォールトが起きていない状態においては、IF、SM1の両方ともがリペアラブルが正しく、上記の仮定においては故障確率を過大に見積もりすぎています。

例えば、SM1がフォールトし、そのフォールトがSM2により検出され、検出周期の最後でリペアされる場合(pattern 2)を考えます。規格ではこの場合は最初にSM1がフォールトしてしまうと、最終的にはIFのフォールトによりDPFとなる場合のみがカウントされます。なぜなら、どちらかがリペアラブルだと他方はアンリペアラブルだからです。つまりこの場合、SM1がリペアラブルの場合は自動的にIFはアンリペアラブルという前提です。

ところが、実際にはSM1がリペアされた場合は初期状態と同じ状態に戻るため、$\img[-1.35em]{/images/withinseminar.png}$

従って、実際にはDPFは起きませんが、IFのフォールトでDPFとカウントされ、結論として$\img[-1.35em]{/images/withinseminar.png}$

弊社ではこの過剰見積もりに関する論文をRAMS 2020に投稿中であり、そのため、PMHFに関する最新の研究#103~108を一旦非開示としました。2019年10月中に採択の決定が行われる予定であり、その後に開示する予定です。


左矢前のブログ 次のブログ右矢

posted by sakurai on May 19, 2019

米国ロチェスター大学の資料によれば、 ランダムプロセス$\eta_t$において、ステート空間を$i, j=0,1,2,...,\in\mathcal{E}$について、以下の式を満足する場合に、ランダムプロセス$\eta_t$は連続時間マルコフ連鎖(CTMC)となります。 $$ \Pr\{\eta_{(t+s)}\in j\ |\ \eta_t\in i, \eta_u\in x_u, u\lt t\}=\Pr\{\eta_{(t+s)}\in j\ |\ \eta_t\in i\} $$ 遷移する確率が、過去の時刻$u$での状態に依存せず、現在時刻$t$での状態にのみ依存することを表します。

CTMCである$\eta_t$において、ステートiからjへの瞬間遷移確率関数(Instantanous Transition Probability Function)$P_{ij}$の式は以下のようになります。ただし、元の式を「信頼性関係式の定義式の表現」で導入した記法に変更しています。 $$ P_{ij}(t):=\Pr\{\eta_{(t+dt)}\in\mathcal{j}\ |\ \eta_{t}\in\mathcal{i}\}=q_{ij}dt+o(dt)\tag{102.1} $$ $q_{ij}$は遷移率(Transition Rate)です。ランダムプロセス$\eta_t$において、確率変数$X$を無故障稼働時間とします。$\mathcal{M}$を稼働状態のサブセットとし、$\mathcal{P}$を不稼働状態のサブセットとすれば、$X=\inf\{t:\eta_{t}\in\mathcal{P}\}$と示すことができます。

稼働状態$\mathcal{M}$から不稼働状態$\mathcal{P}$への遷移を考えると、(102.1)は、 $$ P_{\mathcal{MP}}(t)=\Pr\{\eta_{(t+dt)}\in\mathcal{P}\ |\ \eta_{t}\in\mathcal{M}\}=q_{\mathcal{MP}}dt+o(dt)\tag{102.2} $$ となりますが、これと前記事の微小ダウン確率形式と比較し、 $$ \Pr\{\eta_{(t+dt)}\in\mathcal{P}\ |\ \eta_{t}\in\mathcal{M}\}=q_{\mathcal{MP}}dt+o(dt)=\varphi(t)dt\tag{102.3} $$ すなわち、単位時間あたりの稼働状態$\mathcal{M}$から不稼働状態$\mathcal{P}$への遷移率$q(t)$は、$o(dt)\approx 0$の場合のダウン率$\varphi(t)$にほかなりません。逆に言えば、ダウン率$\varphi(t)$は稼働状態$\mathcal{M}$から不稼働状態$\mathcal{P}$への、単位時間当たりの遷移率となります。

ここで、条件付き確率の式から(102.3)の両辺に状態確率$\Pr\{\eta_{t}\in\mathcal{M}\}$をかけると$PUD$が求まります。$PUD$について、$0$から$T_{lifetime}$まで$t$で積分し(102.2)を用いれば、 $$ \int_0^{T_{lifetime}}P_{\mathcal{MP}}(t)dt =\int_0^{T_{lifetime}}\Pr\{\eta_{(t+dt)}\in\mathcal{P}\ |\ \eta_{t}\in\mathcal{M}\}\Pr\{\eta_{t}\in\mathcal{M}\}\\ =\int_0^{T_{lifetime}}\Pr\lbrace\eta_{(t+dt)}\in\mathcal{P}\cap \eta_{t}\in\mathcal{M}\rbrace=\int_0^{T_{lifetime}}q(t)dt =Q({T_{lifetime}})\tag{102.4} $$ これより、SPFとなる平均PUDを、前記事の平均PUDを参考にし(102.4)の両辺を$T_{lifetime}$で割って$\overline{\varphi_{\mathrm{SPF}}}$で表せば、 $$ \overline{\varphi_{\mathrm{SPF}}}=\frac{1}{T_{lifetime}}Q({T_{lifetime}})=\frac{1}{T_{lifetime}}\int_0^{T_{lifetime}}\Pr\{\eta_{(t+dt)}\in\mathcal{P}\ |\ \eta_{t}\in\mathcal{M}\}\Pr\{\eta_{t}\in\mathcal{M}\}\\ =\img[-1.35em]{/images/withinseminar.png} \tag{102.5} $$ これにより、CTMCの平均PUDを求める基本式が求まりました。

弊社ではPMHFに関する論文をRAMS 2020に投稿中であり、そのため、最新の研究#103~108を一旦非開示としました。2019年10月中に採択の決定が行われる予定であり、その後に開示する予定です。


左矢前のブログ 次のブログ右矢

Kパラメータは条件付き確率か(3)

posted by sakurai on May 12, 2019

前稿(100.1)において、時刻$t$から$t+dt$において、IFのフォールトがVSG抑止される微小確率を求めると、 $$ \Pr\{\mathrm{IF\ prevented}\cap\mathrm{IF\ failed\ in\ }(t, t+dt]\cap\mathrm{IF\ not\ failed\ before\ }t\}\\ =\Pr\{\mathrm{IF\ prevented}\ |\ \mathrm{IF\ failed\ in\ }(t, t+dt]\cap\mathrm{IF\ not\ failed\ before\ }t\}\\ \cdot\Pr\{\mathrm{IF\ failed\ in\ }(t, t+dt]\ |\ \mathrm{IF\ not\ failed\ before\ }t\}\cdot\Pr\{\mathrm{IF\ not\ failed\ before\ }t\}\\ =K_{\mathrm{FMC,RF}}(t)\lambda_{\mathrm{IF}}R_{\mathrm{IF}}(t)dt \tag{101.1} $$ ここで、 $$ \Pr\{\mathrm{IF\ prevented}\ |\ \mathrm{IF\ failed\ at\ }t\cap\mathrm{IF\ not\ failed\ before\ }t\}=K_{\mathrm{FMC,RF}}(t)\\ \Pr\{\mathrm{IF\ failed\ in\ }(t, t+dt]\ |\ \mathrm{IF\ not\ failed\ before\ }t\}=\lambda_{\mathrm{IF}}dt\\ \Pr\{\mathrm{IF\ not\ failed\ before\ }t\}=R_{\mathrm{IF}}(t) $$ となりましたが、「DCはSMのアーキテクチャにより決定される」ことを前提とし、フォールト発生とフォールト検出は独立な事象と考えれば、同じ確率式は、 $$ \Pr\{\mathrm{IF\ prevented}\cap\mathrm{IF\ failed\ in\ }(t, t+dt]\cap\mathrm{IF\ not\ failed\ before\ }t\}\\ =\Pr\{\mathrm{IF\ preventable}\}\cdot\Pr\{\mathrm{IF\ failed\ in\ }(t, t+dt]\ |\ \mathrm{IF\ not\ failed\ before\ }t\}\\ \cdot\Pr\{\mathrm{IF\ not\ failed\ before\ }t\}=K_{\mathrm{FMC,RF}}\lambda_{\mathrm{IF}}R_{\mathrm{IF}}(t)dt \tag{101.2} $$ ここで、 $$ \Pr\{\mathrm{IF\ preventable}\}=K_{\mathrm{FMC,RF}}\\ \Pr\{\mathrm{IF\ failed\ in\ }(t, t+dt]\ |\ \mathrm{IF\ not\ failed\ before\ }t\}=\lambda_{\mathrm{IF}}dt\\ \Pr\{\mathrm{IF\ not\ failed\ before\ }t\}=R_{\mathrm{IF}}(t) $$ と求められます。従って、(101.1)の$\Pr\{\mathrm{IF\ prevented}\ |\ \mathrm{IF\ failed\ at\ }t\}$という確率的な$t$の関数を、(101.2)の$\Pr\{\mathrm{IF\ preventable}\}$という定数に置き換えることができます。

2nd SMの属性である$K_{\mathrm{FMC,MPF}}$についても同様の議論が成り立ち、Kパラメータは条件付き確率ではなく、アーキテクチャ的に決定している能力(定数)として扱います。結論として、

$$ K_{\mathrm{IF,FMC,RF}}:=\Pr\{\mathrm{IF\ preventable}\}\tag{101.3} $$ $$ K_{\mathrm{IF,FMC,MPF}}:=\Pr\{\mathrm{IF\ detectable}\}\tag{101.4} $$ $$ K_{\mathrm{SM,FMC,MPF}}:=\Pr\{\mathrm{SM\ detectable}\}\tag{101.5} $$


左矢前のブログ 次のブログ右矢

Kパラメータは条件付き確率か(2)

posted by sakurai on May 10, 2019

(99.1)の定義は便利に使用できます。例えば時刻$t$から$t+dt$において、IFのフォールトがVSG抑止される微小確率を求めると、条件付き確率のチェインルールを用いれば、 $$ \Pr\{\mathrm{IF\ prevented}\cap\mathrm{IF\ failed\ in\ }(t, t+dt]\cap\mathrm{IF\ not\ failed\ before\ }t\}\\ =\Pr\{\mathrm{IF\ prevented}\ |\ \mathrm{IF\ failed\ in\ }(t, t+dt]\cap\mathrm{IF\ not\ failed\ before\ }t\}\\ \cdot\Pr\{\mathrm{IF\ failed\ in\ }(t, t+dt]\ |\ \mathrm{IF\ not\ failed\ before\ }t\}\cdot\Pr\{\mathrm{IF\ not\ failed\ before\ }t\}\\ =K_{\mathrm{FMC,RF}}(t)\lambda_{\mathrm{IF}}R_{\mathrm{IF}}(t)dt \tag{100.1} $$ と、IFに関する故障率や信頼度関数で表すことができます。

しかしながら、Kパラメータ、具体的には$K_{\mathrm{FMC,MPF}}$や$K_{\mathrm{FMC,RF}}$が定数だと矛盾が起きます。まず、条件が確率的に作用することにより、例えば1回目にはVSG抑止されたフォールトが、2回目にはVSG抑止されないことが起こりえます。あるいは1回目にはリペアされたフォールトが2回目にはリペアされないことが起こりえます。検出が確率的になされるからといって、同じ故障が検出されたりされなかったりするのは、なんとなく納得がいきません。

次に問題になるのが、このKは定数にはならないことです。例えば、VSG抑止率について考えると、長時間が経ちVSG抑止を長く続けると、VSG抑止されないフォールト確率(不信頼度)は上昇し続けます。明らかに、VSG抑止されるフォールトの確率が高まりそうであるのに、これが一定であるとは感覚に反します。

フォールト検出のたびにサイコロで検出を決めているならそうなりますが、一般的には診断カバレージ(Diagnostic Coverage; DC)はSMのアーキテクチャにより決定され、確率的には検出されないとここでは考えることにします。そうすれば、上記の問題点は解消されます。


左矢前のブログ 次のブログ右矢


ページ: