НПО Системы Безопасности
(499)340-94-73 График работы:
ПН-ПТ: 10:00-19:00
СБ-ВС: выходной

Главная » Периодика » Безопасность

01234 ... 48


ЗУБ в работу включается резервное. Отказоустойчивость в системах ESS обеспечивается следующими мерами:

обнаружением неисправностей путем сравнения выходов идентичных синхронно работающих блоков;

введением избыточного кодирования (в частности, использованием кодов т из п) цифровой информации в системе;

применением встроенных схем контроля, которые совместно с диагностическими программами позволяют устранять влияние значительной части неисправностей;

использованием таймера аварий, который разрешает перебор возможных конфигураций системы с целью создания работоспособной структуры. Работоспособность выбранной конфигурации процессора определяется с помощью специальной программы;

введением специального канала обслуживания, по которому производится диагностирование одного процессора другим;

автоматическим и ручным восстановлением процессора при обнаружении неисправностей.

Восстановление работоспособности системы при неисправностях в аппаратной части осуществляется отключением рабочего процессора и запуском резервного. Переход на продолжение программы происходит в три этапа: установка состояния системы (задание начального адреса, состояний регистров ошибки, сброс триггеров остановки и др.); защита данных, хранимых в резервном ЗУ; запуск программ. Ручное восстановление используется в тех случаях, когда автоматическое не обеспечивает приведение системы в работоспособное состояние, например, в случае безуспешной многократной инициализации. Способы обеспечения отказоустойчивости описанных систем характерны для систем малой производительности. Повышение производительности в 10 раз и пятикратное увеличение числа обслуживаемых устройств ввода-вывода за счет сокращения времени обслуживания, поиска неисправностей и восстановления работоспособности достигается в сети мини-ЭВМ ARPANET на основе отказоустойчивых мультипроцессоров PLURIBUS 1281.

Мультипроцессор состоит из модулей, называемых шинами ввода-вывода, процессорными шинами и шинами памяти. В каждую из шин входит арбитр, соединители и функциональная часть. Функциональной частью процессорной шины являются один или два процессора и местная память, шины памяти - ряд блоков памяти, шины ввода-вывода - интерфейсы, устройства псевдопрерываний (УПП), удлинители шин и интерфейсы связи (рис. 2). Срязь между компонентами ширы



выполйяется no общей шине, а связи между шинами - через соединители. Наиболее часто используемые программы хранятся в местной памяти каждой процессорной шины, а редко используемые - в шинах памяти.

АрБитр

Процессор

Процессор

Память

Память 8К

Соединителе шин

Соединитель шин

Соединитель шин

ApSump

Соединитель

Сочинитель

Память

Память

Соединитель шин

Соединитель шин

Синхрони-затор

- УПП

Интерсрейс связи

Рис. 2. Состав модулей PLURIBUS г-.

Удлинитель шин

Интерсрейс

В мультипроцессоре применяется программное диагностирование и информационное резервирование (в частности, дополнительные разряды четности) в обрабатываемых и передаваемых данных. Проверяется четность данных и адресов по всем путям, образованным соединителями, причем дополнительно обнаруживаются также отказы типа «все нули», «все единицы» на общих шинах. Системное диагностирование выполняется с помощью специальных программных тестов. При обнаружении неисправностей программное обеспечение использует избыточность аппаратных средств для образования новой логической конфигурации системы, в которой



отсутствуют отказавшие блоки. Предусмотрены также специальные переключатели, позволяющие отключать отдельные шины. При этом подключение и блокировка трактов доступа производится любым процессором, который может принимать решение о неисправности контролируемого процессора.

Мультипроцессор имеет систему защиты от тяжелых остановов и восстановления работоспособности при отказах в аппаратуре, ошибках в программном обеспечении, построенную на основе операционной системы STAGE. Эта система поддерживает достоверную карту текущего состояния имеющихся программных и аппаратных ресурсов (как своих, так и прикладной операционной системы).

Карта ресурсов составляется на основе многоэтапного испытания и проверки правильности работы системы с помощью ресурсов, проверенных на предшествующих шагах (примитивов операционной системы). Для координации работы различных процессоров при определении конфигурации системы используются три массива соглашений: «следующий», «сглаженный» и «фиксация», в которых каждому из процессоров соответствует свой разряд. Перед началом соглашения запросы посылаются процессорами в массив «следующий», который переносится в «сглаженный» через время, достаточное для определения состояния участвующих процессоров. Состав процессоров, участвующих в работе системы, определяется картой конфигурации. Процессор, модифицирующий информацию о конфигурации, записывает единицу в свой разряд массива «фиксация». Процессоры, согласные с картой конфигурации, сбрасывают свои разряды. Сбрасываются также разряды, соответствующие процессорам, не вошедшим в массив «сглаженный». Перед проведением фиксации все процессоры ждут, чтобы массив «фиксация» совпал с массивом «сглаженный», обеспечивая тем самым возможность принятия согласованной карты конфигурации. Решение о модификации карты конфигурации может быть принято также по большинству процессоров.

При обнаружении отказа процессор устанавливает в единицу свой разряд в массиве «фиксация», блокируя выполнение следующих этапов. При достаточно большом количестве процессоров, обнаруживших отказ, происходит реконфигурация в описанном выше порядке. При несоглашении неисправного процессора с предложенной конфигурацией он зависает в точке обнаружения несоответствия. Однако в дальнейшем он вновь может включиться в работу.

В мультипроцессоре имеется возможность восстановления структур данных и прикладных программ, причем для ради-



01234 ... 48