Параллельная Обработка Данных, 04 лекция (от 25 сентября)

Материал из eSyr's wiki.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
[[Параллельная Обработка Данных, 03 лекция (от 18 сентября)|Предыдущая лекция]] | [[Параллельная Обработка Данных, 05 лекция (от 02 октября)|Следующая лекция]]
[[Параллельная Обработка Данных, 03 лекция (от 18 сентября)|Предыдущая лекция]] | [[Параллельная Обработка Данных, 05 лекция (от 02 октября)|Следующая лекция]]
-
Распростарненные ком технологии:
+
===Коммуникационные среды и технологии===
-
*FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров чере мпи обычно удается достичь 6-7
+
==Распространенные коммуникационные технологии==
 +
 
 +
*FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров через MPI обычно удается достичь 6-7
МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
-
*Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках мпая удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у фаст. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клстерах как самое дешевое решение, или ис пользуют как вспомогательную сеть, если есть высокопроизв ком среды.
+
*Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках MPI удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у FastEthernet. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клаcтерах, как самое дешевое решение, или используют как вспомогательную сеть, если есть высокопроизводительные коммуникационые среды.
-
Специализированные ком среды:
+
-
*Myrinet 2000. Пиковая пропускная сопособность 2 гигабита(250 МБ/сек). В рамках мпиая порядка 200 МБ/сек. лтентность 10 мкс. Но это уже другой уровень стоимотсти. За такую ком среду надо платить примерно столько же сколько за выч узлы.
 
-
*SCI(SCalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет сохдавать двух-трехмерные торы, в ней отстутвует понятие коммутатор, вся ком ведется спец платами, вставляемые в выч узлы. Давал скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность он потерял. ТОже дорогая технология.
+
==Специализированные коммуникационные среды==
-
* Сейчас наиболее популярна Infiniband. ПОпулярна в дорогом сегменте. Изначально был рассчитан на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных блиизко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.
+
*Myrinet 2000. Пиковая пропускная сопособность 2 гигабита(250 МБ/сек). В рамках MPI порядка 200 МБ/сек. Латентность 10 мкс. Но это уже другой уровень стоимотсти. За такую коммуникационную среду надо платить примерно столько же сколько за вычислительные узлы.
-
Это красткие характер 5 основных ком технологий, используемых в кластерах. Заачстую используются несколько ком сред.
+
*SCI(SCalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет создавать двух-трехмерные торы, в ней отсутствует понятие коммутатор, вся коммутация ведется специальными платами, вставляемыми в вычислительные узлы. Давала скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность она потеряла. Тоже дорогая технология.
-
Есть множество других сетевых решений. Эти -- наиболее распространенный.
+
*Сейчас наиболее популярна Infiniband. Популярна в дорогом сегменте. Изначально была рассчитана на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных блиизко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.
-
Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компов с распр памятью.
+
-
На производительность влияют
 
-
-Не забываем закон Амдала, который важен для компьютеров с распр памятью.
+
Это красткие характеристики 5 основных коммуникационных технологий, используемых в кластерах. Зачастую используются несколько коммуникационных сред.
 +
 
 +
Есть множество других сетевых решений. Эти -- наиболее распространенные.
 +
 
 +
Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компьютеров с распределенной памятью.
 +
 
 +
 
 +
===Что же влияет на производительность?===
 +
 
 +
-Не забываем закон Амдала, который важен для компьютеров с распределенной памятью.
-латентность и пропускная способность
-латентность и пропускная способность
-
-возможность асинхронно посылки сообщений - влияет на то что проц не проставивает когда общается с другими процами
+
-возможность асинхронной посылки сообщений -- влияет на то, что процессор не простаивает, когда общается с другими процессорами.
-
-равномерная загрузка узлов - очень важный фактор. надо строить задачу таким образом, что бы все процам которые есть давалась
+
-равномерная загрузка узлов - очень важный фактор. Надо строить задачу таким образом, что бы все процессорам, которые есть, давалась
-
примерно одинаковое колво данных насчет, чтобы процессоры не проставивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью разной памятью)
+
примерно одинаковое количество данных на счет, чтобы процессоры не простаивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью, разной памятью).
-
Далее, если сускаться на более низкий уровень:
+
Далее, если спускаться на более низкий уровень:
-
-производительность процессора.Каждый проц может иметь свою архитектуру.
+
-производительность процессора.Каждый процессор может иметь свою архитектуру.
Строка 38: Строка 45:
-
И как крайню точку комп с распр памятью рассмотрим ещё один класс.
+
===GRID===
-
Если мы двигаемя от компов с общей памятью через компы с массивно параллельной пмятью, через кластеры, то крайней точкой можно рассматривать такое поянтие как мета компьютинг, когда в качестве компьютера рассмартивают компы хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как выч мощность такого компьютера потенциально ужасно огромна. GRID технологии.
+
И как крайнюю точку компьютеров с распределенной памятью рассмотрим ещё один класс.
 +
Если мы двигаемся от компьютеров с общей памятью через компьютеры с массивно-параллельной пмятью, через кластеры, то крайней точкой можно рассматривать такое понятие, как мета компьютинг, когда в качестве компьютера рассматривают компьютеры хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как вычислительная мощность такого компьютера потенциально ужасно огромна. GRID технологии.
-
Весьма изщвестные и распространненые проекты:
+
==Весьма известные и распространенные проекты==
-
*PACX-MPI - расширение мпи. мпи работающий через тсп/ип. Было продемонтсрировано использование 2 компов(германия-сша) решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
+
*PACX-MPI - расширение MPI. MPI работающий через TCP/IP. Было продемонстрировано использование 2 компьютеров(Германия-США), решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
-
* Condarю Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое по, есть реализации под различные оси.
+
*Condar. Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое ПО, есть реализации под различные операционные системы.
-
Проекты решающие конкретные прикладные залачи:
+
-
*SETI@home - всем желающим было предложено нализировать данные радиолокаторов и искть следы внеземных цивилизаций, но вроде ничего не нашли. НО был один из наболее извсетных проектов, привлекший внимание к подобным затеям.
+
==Проекты решающие конкретные прикладные задачи==
-
*distributed.net - продалжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров
+
*SETI@home - всем желающим было предложено анализировать данные радиолокаторов и иаскть следы внеземных цивилизаций, но вроде ничего не нашли. Но был один из наиболее известных проектов, привлекший внимание к подобным затеям.
 +
 
 +
*distributed.net -- продолжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров.
*GIMPS- ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.
*GIMPS- ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.
-
Проекто последнее очень много, желающие могут найти информацию. НО это -- решение конкретных задач, а что делать если ххочется создать более менее универсальный мета компьютер?
 
-
Наиболее популярнs
 
-
*Globus недостаток - сложность установки и настройки. чтобы одключиться надо проделать много магических движений, что бы настроить прочитать много документции. Это явл значительным недостатком. Тем не менее много сетей ора
+
Проектов последнее очень много, желающие могут найти информацию. Но это -- решение конкретных задач, а что делать если хочется создать более менее универсальный мета компьютер?
 +
==Универсальные GRID==
 +
Наиболее популярны:
 +
 
 +
*Globus недостаток - сложность установки и настройки. чтобы подключиться надо проделать много магических движений, что бы настроить прочитать много документции. Это является значительным недостатком.
{{Параллельная Обработка Данных}}
{{Параллельная Обработка Данных}}
{{Lection-stub}}
{{Lection-stub}}

Версия 09:31, 11 декабря 2007

Предыдущая лекция | Следующая лекция

Содержание

Коммуникационные среды и технологии

Распространенные коммуникационные технологии

  • FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров через MPI обычно удается достичь 6-7

МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.

  • Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках MPI удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у FastEthernet. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клаcтерах, как самое дешевое решение, или используют как вспомогательную сеть, если есть высокопроизводительные коммуникационые среды.


Специализированные коммуникационные среды

  • Myrinet 2000. Пиковая пропускная сопособность 2 гигабита(250 МБ/сек). В рамках MPI порядка 200 МБ/сек. Латентность 10 мкс. Но это уже другой уровень стоимотсти. За такую коммуникационную среду надо платить примерно столько же сколько за вычислительные узлы.
  • SCI(SCalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет создавать двух-трехмерные торы, в ней отсутствует понятие коммутатор, вся коммутация ведется специальными платами, вставляемыми в вычислительные узлы. Давала скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность она потеряла. Тоже дорогая технология.
  • Сейчас наиболее популярна Infiniband. Популярна в дорогом сегменте. Изначально была рассчитана на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных блиизко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.


Это красткие характеристики 5 основных коммуникационных технологий, используемых в кластерах. Зачастую используются несколько коммуникационных сред.

Есть множество других сетевых решений. Эти -- наиболее распространенные.

Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компьютеров с распределенной памятью.


Что же влияет на производительность?

-Не забываем закон Амдала, который важен для компьютеров с распределенной памятью.

-латентность и пропускная способность

-возможность асинхронной посылки сообщений -- влияет на то, что процессор не простаивает, когда общается с другими процессорами.

-равномерная загрузка узлов - очень важный фактор. Надо строить задачу таким образом, что бы все процессорам, которые есть, давалась примерно одинаковое количество данных на счет, чтобы процессоры не простаивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью, разной памятью). Далее, если спускаться на более низкий уровень:

-производительность процессора.Каждый процессор может иметь свою архитектуру.


Таких факторов много, это только основные И нужно учитывать, что все эти факторы действую одновременно.


GRID

И как крайнюю точку компьютеров с распределенной памятью рассмотрим ещё один класс. Если мы двигаемся от компьютеров с общей памятью через компьютеры с массивно-параллельной пмятью, через кластеры, то крайней точкой можно рассматривать такое понятие, как мета компьютинг, когда в качестве компьютера рассматривают компьютеры хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как вычислительная мощность такого компьютера потенциально ужасно огромна. GRID технологии.

Весьма известные и распространенные проекты

  • PACX-MPI - расширение MPI. MPI работающий через TCP/IP. Было продемонстрировано использование 2 компьютеров(Германия-США), решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
  • Condar. Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое ПО, есть реализации под различные операционные системы.

Проекты решающие конкретные прикладные задачи

  • SETI@home - всем желающим было предложено анализировать данные радиолокаторов и иаскть следы внеземных цивилизаций, но вроде ничего не нашли. Но был один из наиболее известных проектов, привлекший внимание к подобным затеям.
  • distributed.net -- продолжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров.
  • GIMPS- ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.

Проектов последнее очень много, желающие могут найти информацию. Но это -- решение конкретных задач, а что делать если хочется создать более менее универсальный мета компьютер?

Универсальные GRID

Наиболее популярны:

  • Globus недостаток - сложность установки и настройки. чтобы подключиться надо проделать много магических движений, что бы настроить прочитать много документции. Это является значительным недостатком.


Параллельная Обработка Данных


01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16


Календарь

вт вт вт вт вт
Сентябрь
04 11 18 25
Октябрь
02 09 16 23 30
Ноябрь
06 13 20 27
Декабрь
04 11 18

Материалы к зачету

Вопросы к зачету по курсу Параллельная обработка данных


Эта статья является конспектом лекции.

Эта статья ещё не вычитана. Пожалуйста, вычитайте её и исправьте ошибки, если они есть.
Личные инструменты
Разделы