Вопросы с тегом 'fault-tolerance'

Отказоустойчивость относится к возможности системы изолировать, компенсировать и восстанавливаться после отказа с минимальным воздействием на конечного пользователя. При использовании этого тега - включить теги, указывающие систему и/или технологию, с которой вы работаете (в качестве дополнительных метаданных поддержки).
22
ответов

Компиляция приложения для использования в сильно радиоактивных средах

Мы собираем встроенное приложение C/С++, которое развертывается в экранированном устройстве в среде, облученной ионизирующим излучением . Мы используем GCC и кросс-компиляцию для ARM. При развертывании наше приложение генерирует некоторые ошибочные д...
задан 24 апр. '16 в 22:09
3
ответов

Акка Актер не заканчивается, если исключено исключение

В настоящее время я пытаюсь начать работу с Akka, и у меня возникла странная проблема. У меня есть следующий код для моего актера: class AkkaWorkerFT extends Actor { def receive = { case Work(n, c) if n < 0 => throw new Exception("Negati...
задан 29 мая '11 в 23:25
3
ответов

Надежны ли сообщения Erlang/OTP? Можно ли дублировать сообщения?

Длинная версия: Я новичок в erlang и рассматриваю возможность использования его для масштабируемой архитектуры. Я нашел много сторонников платформы, рекламирующих ее надежность и отказоустойчивость. Однако я изо всех сил пытаюсь понять, как дости...
задан 03 июля '10 в 22:05
4
ответов

Scala + Akka: Как разработать многомашинный высокодоступный кластер

Мы разрабатываем серверную систему в Scala + Akka для игры, которая будет обслуживать клиентов в Android, iPhone и Second Life. Есть части этого сервера, которые должны быть высокодоступными, работающих на нескольких машинах. Если один из этих серве...
задан 12 сент. '10 в 0:10
1
ответ

Тестирование с вероятностным отказом компонентов в Akka (Scala)

Я начал использовать Akka с Scala для разработки набора взаимодействующих компонентов в шинной архитектуре. Мне нужно проверить отказоустойчивость системы, и для этого мне было интересно, есть ли способ использовать вероятностную модель отказа (т.е....
задан 10 дек. '11 в 23:11
2
ответов

Как я могу имитировать повреждение файловой системы ext3?

Я хотел бы моделировать повреждение файловой системы с целью тестирования того, как наши встроенные системы реагируют на нее, и в конечном итоге они могут быть настолько изящными, насколько это возможно. Мы используем различные типы флэш-памяти с бло...
задан 26 сент. '08 в 18:32
3
ответов

Ресурсы о программировании с ошибкой и отказоустойчивости

Мне нравится статья LWN Программное обеспечение только для борьбы с авариями, и я хотел бы узнать больше о сбое и отказоустойчивости программирования. Удивительно сложно гарантировать, что постоянное состояние согласовано в ситуациях сбоя. Здесь я д...
задан 09 марта '10 в 1:09
4
ответов

Как я могу автоматически восстановить дуплексный канал, если он получил ошибку?

Я разрабатываю клиент/серверное приложение в .NET 3.5 с помощью WCF. В основном, длительное обслуживание клиентов (на нескольких машинах) устанавливает дуплексное соединение с сервером через netTcpBinding. Затем сервер использует контракт обратного в...
задан 15 окт. '08 в 14:51
1
ответ

Hystrix: Пользовательский автоматический выключатель и логика восстановления

Я просто прочитал руководство Hystrix, и я пытаюсь обернуть голову тем, как работает автоматический выключатель по умолчанию и период восстановления, а затем, как настроить их поведение. Очевидно, что если цепь отключена, Hystrix автоматически вызов...
задан 21 нояб. '14 в 19:32
6
ответов

Отказоустойчивая архитектура программного обеспечения

Я ищу хорошие статьи по отказоустойчивым архитектурам программного обеспечения. Могу ли я получить некоторые рекомендации.
задан 04 марта '09 в 14:55
2
ответов

Рекомендации по устранению ошибок и надежности для запланированных задач или служб

Я работал над многими приложениями, которые запускаются как службы Windows или запланированные задачи. Теперь я хочу убедиться, что эти приложения будут отказоустойчивыми и надежными. Например; У меня есть служба, которая работает каждый час. если с...
задан 27 мая '10 в 18:39
1
ответ

Нужно ли мне как минимум 3 узла/серверов для кластера Cassandra или 2 хватает?

Конечно, можно запустить одиночный кластер node, но мне нужен некоторый уровень отказоустойчивости. В настоящее время я могу позволить себе арендовать два сервера (оперативная память 8 ГБ, частная VLAN @1GigE), но не 3. Мое понимание состоит в том...
задан 25 февр. '10 в 2:47
1
ответ

отказоустойчивость в MPICH/OpenMPI

У меня есть два вопроса - Q1. Есть ли более эффективный способ справиться с ситуацией с ошибками в MPI, кроме контрольной точки/отката? Я вижу, что если node "умирает", программа резко останавливается. Есть ли способ продолжить выполнение после т...
задан 22 марта '11 в 6:59
1
ответ

Как заканчивается нехватка памяти в Erlang?

С философией "пусть он вредит" Erlang, можно было бы ожидать, что вся VM не сработает, если процесс не сможет выделить память, необходимую для продолжения своих операций; действительно, если система имела эвристику, чтобы убить какой-то процесс, чтоб...
задан 20 июня '12 в 6:01
1
ответ

Шаблоны выполнения Hystrix

Я пытаюсь обернуть голову вокруг Hystrix и после прочтения их документов все еще есть вопрос о его шаблонах использования. Во-первых, я не понимаю, как использовать сценарий Асинхронный по сравнению с их Реактивным выполнением. Единственное разл...
задан 21 нояб. '14 в 19:30