Вопросы с тегом 'fault-tolerance'

Отказоустойчивость относится к возможности системы изолировать, компенсировать и восстанавливаться после отказа с минимальным воздействием на конечного пользователя. При использовании этого тега - включить теги, указывающие систему и/или технологию, с которой вы работаете (в качестве дополнительных метаданных поддержки).
22

Компиляция приложения для использования в сильно радиоактивных средах

Мы собираем встроенное приложение C/С++, которое развертывается в экранированном устройстве в среде, облученной ионизирующим излучением . Мы используем GCC и кросс-компиляцию для ARM. При развертывании наше приложение генерирует некоторые ошибочные д...
24 апр. '16 в 19:09
3

Акка Актер не заканчивается, если исключено исключение

В настоящее время я пытаюсь начать работу с Akka, и у меня возникла странная проблема. У меня есть следующий код для моего актера: class AkkaWorkerFT extends Actor { def receive = { case Work(n, c) if n < 0 => throw new Exception("Negati...
29 мая '11 в 20:25
3

Почему использование шаблона C++ не рекомендуется в космической/излучаемой среде?

Читая этот вопрос, я понял, например, почему динамическое распределение или исключения не рекомендуются в условиях высокой радиации, например, в космосе или на атомной электростанции. Что касается шаблонов, я не понимаю, почему. Не могли бы вы объяс...
12 июн. '19 в 8:17
3

Надежны ли сообщения Erlang/OTP? Можно ли дублировать сообщения?

Длинная версия: Я новичок в erlang и рассматриваю возможность использования его для масштабируемой архитектуры. Я нашел много сторонников платформы, рекламирующих ее надежность и отказоустойчивость. Однако я изо всех сил пытаюсь понять, как дости...
03 июл. '10 в 19:05
4

Scala + Akka: Как разработать многомашинный высокодоступный кластер

Мы разрабатываем серверную систему в Scala + Akka для игры, которая будет обслуживать клиентов в Android, iPhone и Second Life. Есть части этого сервера, которые должны быть высокодоступными, работающих на нескольких машинах. Если один из этих серве...
11 сент. '10 в 21:10
1

Тестирование с вероятностным отказом компонентов в Akka (Scala)

Я начал использовать Akka с Scala для разработки набора взаимодействующих компонентов в шинной архитектуре. Мне нужно проверить отказоустойчивость системы, и для этого мне было интересно, есть ли способ использовать вероятностную модель отказа (т.е....
10 дек. '11 в 20:11
2

Как я могу имитировать повреждение файловой системы ext3?

Я хотел бы моделировать повреждение файловой системы с целью тестирования того, как наши встроенные системы реагируют на нее, и в конечном итоге они могут быть настолько изящными, насколько это возможно. Мы используем различные типы флэш-памяти с бло...
26 сент. '08 в 15:32
3

Ресурсы о программировании с ошибкой и отказоустойчивости

Мне нравится статья LWN Программное обеспечение только для борьбы с авариями, и я хотел бы узнать больше о сбое и отказоустойчивости программирования. Удивительно сложно гарантировать, что постоянное состояние согласовано в ситуациях сбоя. Здесь я д...
08 мар. '10 в 22:09
1

Hystrix: Пользовательский автоматический выключатель и логика восстановления

Я просто прочитал руководство Hystrix, и я пытаюсь обернуть голову тем, как работает автоматический выключатель по умолчанию и период восстановления, а затем, как настроить их поведение. Очевидно, что если цепь отключена, Hystrix автоматически вызов...
21 нояб. '14 в 16:32
4

Как я могу автоматически восстановить дуплексный канал, если он получил ошибку?

Я разрабатываю клиент/серверное приложение в .NET 3.5 с помощью WCF. В основном, длительное обслуживание клиентов (на нескольких машинах) устанавливает дуплексное соединение с сервером через netTcpBinding. Затем сервер использует контракт обратного в...
15 окт. '08 в 11:51
6

Отказоустойчивая архитектура программного обеспечения

Я ищу хорошие статьи по отказоустойчивым архитектурам программного обеспечения. Могу ли я получить некоторые рекомендации.
04 мар. '09 в 11:55
2

Рекомендации по устранению ошибок и надежности для запланированных задач или служб

Я работал над многими приложениями, которые запускаются как службы Windows или запланированные задачи. Теперь я хочу убедиться, что эти приложения будут отказоустойчивыми и надежными. Например; У меня есть служба, которая работает каждый час. если с...
27 мая '10 в 15:39
1

Нужно ли мне как минимум 3 узла/серверов для кластера Cassandra или 2 хватает?

Конечно, можно запустить одиночный кластер node, но мне нужен некоторый уровень отказоустойчивости. В настоящее время я могу позволить себе арендовать два сервера (оперативная память 8 ГБ, частная VLAN @1GigE), но не 3. Мое понимание состоит в том...
24 февр. '10 в 23:47
1

отказоустойчивость в MPICH/OpenMPI

У меня есть два вопроса - Q1. Есть ли более эффективный способ справиться с ситуацией с ошибками в MPI, кроме контрольной точки/отката? Я вижу, что если node "умирает", программа резко останавливается. Есть ли способ продолжить выполнение после т...
22 мар. '11 в 3:59
1

Как заканчивается нехватка памяти в Erlang?

С философией "пусть он вредит" Erlang, можно было бы ожидать, что вся VM не сработает, если процесс не сможет выделить память, необходимую для продолжения своих операций; действительно, если система имела эвристику, чтобы убить какой-то процесс, чтоб...
20 июн. '12 в 3:01