HN🔥 56
💬 30

Artemis IIの耐障害性(フォールトトレランス)の仕組みを徹底解剖

speckx
約1か月前

ディスカッション (9件)

1
tcp_handshaker
約1か月前

Airbusの場合、CPU自体にもバグがあるからという理由で、異なるCPUを使っていたよね…

2
WorkerBee28474
約1か月前

Orionは2台のVehicle Management Computerを活用していて、それぞれに2つのFlight Control Module(FCM)が搭載されているから、合計4つのFCMがある。でも冗長性はさらに深くて、各FCMは自己診断機能を持つプロセッサペアで構成されている。

一体誰が8個が正解だと決めたんだろう?なんで4個じゃないの?それとも2個?あるいは16個か32個じゃないのはなぜ?

4
y1n0
約1か月前

見てみたいのは障害データだね。それと、同期しているFCMの数の推移を示すグラフと、それが予測とどのくらい一致していたか。要するに、どれだけ過剰設計になっているのかが気になる。

5
_whiteCaps_
約1か月前

システムソフトウェアを作る上で、異種冗長性(Dissimilar Redundancies)って概念がすごく好きだよ(今日までその用語は知らなかったけど)。

いろんなLinuxディストリビューションやいくつかのBSD向けにビルドしてみるといい。奇妙なコンパイルエラーやエッジケースに必ず遭遇するから。単一のプラットフォーム向けに作っていたら気づかないような未定義の挙動や、間違った思い込みを浮き彫りにしてくれることがよくあるんだ。

6
m3kw9
約1か月前

宇宙飛行士に必要なトレーニング量って相当なものだろうな。

7
ranger207
約1か月前

自己診断ペアによって、放射線イベントが原因でCPUが誤った計算をした場合に、そのエラーを即座に検知してシステムが応答する。

ペアのうち、どちらが正しく計算したのか、どうやって判断しているんだろう?

8
methodical
約1か月前

正直なところ、ある程度の冗長性が必要なのは理解できるけど、これだけの冗長性がシステム全体にどれだけの複雑さを付け加えているのか、そしてその複雑さによるリスクの方が、高い冗長性による恩恵を上回ってしまっていないかが気になる。NASAのことだからトレードオフは計算済みだろうけど、その背後にある考え方を見てみたいね。

ここ数年の航空機事故について知ると似たようなことを感じるよ。システムの冗長性と、それによって加わる複雑さが、事故を防ぐどころか間接的な原因になっているように思える時があるから。まあ、冗長性によって防げた事故の数を定量化して直接比較するのは、現実的に難しいんだろうけど。