Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






Особенности процессора POWER 8



Особенности процессора POWER7

Восьмиядерный кристалл площадью 567 мм2 выполнен по проектным нормам 45 нм, что позволило разместить на кристалле 1,2 млрд транзисторов.

Объем кэш-памяти третьего уровня на кристалле составил 32 Мбайт eDRAM. Это был большой шаг вперед по сравнению с предыдущими поколениями процессоров линии POWER, где кэш располагался на отдельном чипе в многокристальном модуле.

Каждый процессор POWER7 мог выполнять 32 потока (с восемью ядрами и четырьмя потоками на ядро), что в 8 раз больше чем у систем на базе процессора POWER6. Кристаллы имели тактовые частоты: 3; 3,3; 3,5; 3,55; 3,8 и 4,1 ГГц.

Каждое ядро процессора POWER7 имело 12 исполнительных блоков. Все ядра поддерживали внеочередное выполнение команд и обеспечивали двоичную совместимость с предыдущими моделями процессоров POWER. Помимо встроенной раздельной кэш-памяти для команд (32 Кбайт) и данных (32 Кбайт) первого уровня (L1) с каждое ядро имело 256 Кбайтную кэш-память второго уровня (L2). Кроме того, на кристалле реализована общая кэш-память третьего уровня (L3) размером 32 Мбайт, которая выполнена на базе так называемой встроенной динамической памяти с произвольным доступом (embedded DRAM). При этом в данной памяти выделены 4-Мбайтные сегменты для каждого ядра процессора. Разумеется, память eDRAM работает медленнее, чем статическая память SRAM, но она расположена ближе к ядрам процессора и использует более широкие пути передачи данных (что существенно снижает задержки). Кроме того, для реализации одной ячейки SRAM (статический триггер) необходимо шесть транзисторов, а ячейка eDRAM состоит всего из одного транзистора и одного конденсатора.

В микросхеме имелся двухканальный контроллер оперативной памяти стандарта DDR3. Пропускная способность памяти поддерживалась на уровне 100 Гб/с, в режиме SMP – 360 Гб/с.

Особенности процессора Power7+

Восьмиядерный процессор IBM Power7+ производится 32 нм техпроцессу. Он имеет 80 Мбайт кеш-памяти третьего уровня (при 32 Мбайт в процессоре Power7). Наращивание объема памяти обеспечивает существенный рост производительности.

Процессор использует память eDRAM (embedded DRAM- встроенная динамическая память). Если сравнить SRAM с новой памятью, то получится разница по числу транзисторов на бит более чем в два раза. В процессоре Power7+ содержится 2,1 млрд транзисторов, используя память SRAM, их потребовалось бы 5,4 млрд.

Следующей особенностью процессора является то, что он имеет дополнительные акселераторы для ускорения шифрования данных и выполнения других задач обеспечения безопасности. В кристалле реализована функция, генератор «действительно случайных чисел». Этот генератор способен защитить от взлома, совершаемого методом прогнозирования следующего «случайного» числа в последовательности.



Также в платформе Power7+ реализован двойной процессорный модуль, благодаря которому можно установить два процессора в один сокет (разъем).

Особенности процессора POWER 8

В августе 2013 г. фирма IBM представила процессор POWER 8. Этот процессор имеет 12 ядер. Каждое ядро способно обрабатывать по восемь потоков команд одновременно благодаря технологии SMT (Simultaneous Multithreading). В процессорах POWER 7/7+ ядра обрабатывали только четыре потока команд. Процессор является самым производительным из моделей компании IBM, выпущенных к настоящему времени, произведён по 22 нм техпроцессу и занимает площадь 650 кв. мм.

Каждое ядро имеет:

16 исполнительных блоков;

64 Кбайта кеша данных плюс кеш для команд объёмом 32 Кбайта;

кеш L2 объёмом 512 Кбайт

Процессор также имеет:

общий кеш L3 типа eDRAM размером в 96 Мбайт;

кеш 4-го уровня eDRAM объемом 128 Мбайт, который располагается за пределами кристалла процессора.

19. Общая структура кластеров високой продуктивности

На практике термин "кластер" имеет множество определений. Некоторые специалисты относят к кластерам мультипроцессорные вычислительные системы класса NUMA (и аналогичные), массово-параллельные вычислительные системы, а порой и симметричнее мультипроцессорные вычислительные системы. К тому же одни ставят во главу угла отказоустойчивость, другие - масштабируемость, третьи - управляемость, четвертые - максимальную производительность.



Однако, наиболее простое, доходчивое и понятное определение кластера базируется на аппаратной особенности его реализации, некогда сформулированное компанией Digital Equipment Corporation. Итак, кластер - это разновидность параллельной или распределенной вычислительной системы, которая состоит из нескольких связанных между собой полноценных вычислительных систем (вычислительных узлов) и используется как единый, унифицированный вычислительный ресурс. Под понятием "полноценная вычислительная система" понимается завершенная вычислительная система, обладающая всем, что требуется для ее функционирования, включая процессоры, оперативную память, подсистему ввода-вывода, а также операционную систему, приложения и т.д. В качестве вычислительных узлов в настоящее время используются Blade-серверы. Как правило, в пределах одного кластера используются одинаковые вычислительные узлы..

Узлы кластера соединяются между собой (внутрикластерное, или межузловое соединение) с помощью либо стандартных сетевых соединений, либо посредством нестандартных (фирменных) технологий. Внутрикластерные соединения позволяют ядрам независимо от внешней сетевой среды обмениваться информацией.

В кластерах имеется отдельная управляющая вычислительная система. Ее функции – управление кластером как единым целым. Управляющая вычислительная система соединяется с вычислительными узлами кластера специальн сетью.

Кластеры являются слабосвязанными системами.

В кластерах высокой производительности обязательно присутствует управляющая вычислительная система, в качестве которой, как правило, используется мультипроцессорная вычислительная система со специализированной операционной системой. Возможно включение в конфигурацию управляющей вычислительной системы специализированных компьютеров, например, файл-сервера, сервера визуализации. Как правило, предоставлена возможность удаленного доступа к кластеру через Internet.

Управляющая вычислительная система создает для пользователя так называемый единый образ вычислительной системы, т.е. для пользователя кластер — это большая вычислительная система (единый ресурс), в которой выполняется множество приложений, хотя в действительности они могут выполняться только на части узлов.

Управляющая вычислительная система принимает задания от пользователей, планирует их выполнение на вычислительных узлах, обеспечивает ввод-вывод данных. Для этих целей в ее составе, как правило, имеются необходимые подсистемы. Она соединяется с вычислительными узлами специальными сетями.

Каждый вычислительный узел – это полноценная вычислительная система с необходимым набором средств и со своей копией операционной системы. Состав и мощность вычислительных узлов могут быть разными в рамках одного кластера, однако чаще строятся однородные кластеры.

Вычислительные узлы в кластере соединяются:

между собой - высокопроизводительной коммуникационной сетью первого ранга для максимально быстрого обмена данными при выполнении различных потоков одного процесса;

с управляющей вычислительной системой:

коммуникационной сетью второго ранга. Ее производительность, как правило, в несколько раз меньше производительности коммуникационной сети первого ранга;

коммуникационной сетью третьего ранга (диагностической сетью). Производительность этой сети может быть значительно меньше производительности сети второго ранга.

Выбор конкретной коммуникационной среды каждого ранга определяется многими факторами: особенностями класса решаемых задач, доступным финансированием, необходимостью последующего расширения кластера и т.п.

Кластер высокой производительности — это сложный программно-аппаратный комплекс, и задача построения кластера не ограничивается объединением большого количества узлов в один сегмент. Для того чтобы кластер высокой производительности быстро и правильно выполнял задачу, все комплектующие должны быть тщательно подобраны друг к другу с учетом требований программного обеспечения, так как производительность кластерного программного обеспечения сильно зависит от структуры кластера, характеристик входящих в состав узлов процессоров, коммуникационной подсистемы между процессорами и оперативной памятью, от производительности сети, соединяющей вычислительные узлы.

Использование тех или иных компонентов сильно зависит от задачи, для которой строится кластер высокой производительности. Для некоторых хорошо распараллеливаемых задач (таких, как рендеринг независимых сюжетов в видеофрагменте) основной фактор быстродействия — мощные процессоры, а производительность сети не играет основной роли. В то же время для задач гидро- и аэродинамики, расчета крэш-тестов и ряда других важна производительность системной сети, иначе увеличение числа вычислительных узлов в кластере высокой производительности будет мало влиять на скорость решения задачи.

 

24. Преимущества и недостаткм аналитических методов исследования

Процесс функцио­нирования компьютерных систем - это процесс выполнения совокупностью устройств некоторого набора программ (алгоритмов). В теории компьютерных систем вычисли­тельные процессы в системах изучаются, в основном, во времен­ном аспекте с целью определения различных характеристик процесса функционирования систем, а именно:

доли времени, в течение ко­торого устройства простаивают;

коэффициентов загрузки отдельных компонентов системы;

времени получения каких-то результатов, производимых соответствующей программой;

произво­дительности, определяемой числом задач, решаемых в единицу времени, и т. п.

Для компьютерных систем типично наличие элемента случайности в процессе ее работы. Изучение процессов, связанных с обслуживанием какого-либо вида запросов, с учетом случайного характера поступления запро­сов и их обслуживания, проводится в рамках теории массового обслуживания.

Моделирование - это процесс представления объекта исследо­ваний адекватной ему моделью и проведения экспериментов с мо­делью с целью получения информации об объекте исследования. При моделировании модель выступает и как средство, и как объект исследований.

Моделирование является косвенным мето­дом выявления свойств объекта в том смысле, что исследование производится не над самим объектом, а над представляющей объект системой — моделью. Отличительная особенность моделиро­вания как метода исследования заключается в возможности иссле­дования таких объектов, прямой эксперимент с которыми трудно­ выполним, экономически невыгоден или вообще невозможен.

При исследовании компьютерных систем используются:

аналитические методы;

методы имитационного моделирования;

экспериментальные методы.

При использовании аналитических методов строится математическая модель объекта, представляющая физи­ческие свойства объекта в виде математических объектов и отно­шений (математических операций над величинами), например в виде дифференциальных или интегральных уравнений. Математи­ческая модель строится на основе понятий, символики и методов некоторой теории, например теории массового обслуживания, определяющей класс математических аналогий, т.е. основопола­гающих математических моделей. При аналитическом подходе требуемые зависимости выводятся из математической модели по­следовательным применением математических правил. Препят­ствием при этом может быть неразрешимость уравнений в анали­тической форме, отсутствие первообразных для подынтегральных функций и т.п., с чем приходится сталкиваться весьма часто. Поэтому лишь при определенных свойствах модели можно получить решение в явной аналитической форме. Несмотря на ограниченные возможности аналитического подхода, решения, полученные в яв­ной аналитической форме, имеют большую познавательную цен­ность и находят результативное применение при решении ши­рокого класса теоретических и прикладных задач.

При аналитическом исследовании компьютерных систем изучаются процессы, являющиеся, в основном, марковскими, либо некоторым образом связанные с марковскими процессами. Поэтому для решения задач теории массового обслуживания используется аппарат теории марковских процессов.

При невозможности (или затруднительности) получения решения уравнений в аналитическом виде, для их решения можно применять численные методы. Результат применения численных методов — таблицы (графики) зависимостей, раскрывающих свойства объекта. Использование численных методов для решения уравнений позволяет решать значительно более широкий круг задач. Негативное свойство использования численных методов решения уравнений - частный характер результатов, не раскрывающий зависимости, а лишь определяющий ее в отдельных априорно назначенных точках.

29. Показатели надёжности невостанавлеваемых сисстем без резервирования

При исследовании надежности технических средств наиболее часто используются следующие показатели:

вероятность безотказной работы - вероятность того, что система не откажет к моменту времени t;

вероятность отказа - вероятность того, что система откажет к моменту времени t;

средняя наработка до отказа - математическое ожидание времени наработки до первого отказа или между очередными отказами.

интенсивность отказов L;

коэффициент готовности КГ – определяется как вероятность того, что в произвольно заданный момент времени, восстанавливаемый объект находится в работоспособном состоянии.

После каждого отказа восстанавливаемой системы следует ее восстановление, которое проводится либо заменой отказавшего элемента на идентичный, работоспособный элемент, либо ремонтом отказавшего элемента. Моменты времени наступления отказов являются случайными. Также случайной является и продолжительность времени восстановления работоспособного состояния объекта, но время восстановления, как правило, значительно меньше времени между отказами.

Во всех исследованиях надежности необходимо указать, какие принимаются допущения о законах распределения времен наработки, восстановления и типах потоков отказов и восстановлений. На практике, в подавляющем большинстве случаев считается, что:

потоки отказов и восстановлений являются простейшими. Простейший поток обладает следующими свойствами:

ординарности (вероятность возникновения двух отказов или восстановлений в течение малого промежутка времени равна нулю);

стационарности (вероятностные характеристики потока не изменяются во времени);

отсутствие последействия (свойство потока, выражающееся в том, что вероятность наступления события не зависит от того, когда произошли предыдущие события, сколько их было, а зависит только от длительности наработки);

интенсивности отказов элементов технических средств во времени не изменяются;

закон распределения наработки на отказ (времени восстановления) показательный.

При принятии таких допущений для расчета показателей надежности целесообразно использовать относительно несложные аналитические выражения, позволяющие, с достаточной для практики точностью, получать значения показателей надежности различных вариантов структур технических средств.

Если потоки отказов и восстановлений отличны от простейших, то необходимо исследование их типов, определение параметров и выбор методов определения показателей надежности. Как правило, получение аналитических результатов очень маловероятно, и, чаще всего, невозможно. Реальный способ определения показателей надежности в таких случаях – это имитационное моделирование, которое является более трудоемким и более долговременным процессом по сравнению с аналитическими методами.

Для сравнения показателей надежности различных вариантов структур технических средств на этапе определения варианта структуры целесообразно использовать допущение о простейших потоках отказов и восстановлений. Это позволит воспользоваться аналитическими формулами (либо готовыми из справочников, либо получить их самостоятельно при отличии исследуемой системы от структур, приведенных в справочниках), которые, хотя и являются более грубыми, но зато приближенные результаты могут быть получены быстро для самых различных видов структур (с резервированием и без). Кроме того, при использовании допущений о простейших потоках отказов и восстановлений создаются наиболее тяжелые условия функционирования систем, и, как следствие, получаемые оценки показателей надежности являются нижней границей. Реальные показатели надежности систем будут, по крайней мере, не хуже, а даже лучше.


Эта страница нарушает авторские права

allrefrs.ru - 2018 год. Все права принадлежат их авторам!