Главная Оснащение Кластер ОмГТУ
Кластер ОмГТУ PDF Печать

Кластер ОмГТУ

 

Вход на кластер

 

Сотрудники кафедры обеспечивают работу кластера ОмГТУ.

Кластер ОмГТУ является уникальным и единственным в России гибридным вычислительным устройством, которое объединяет в себе кластер ЦПУ (центральных процессоров), кластер ГПУ (графических процессоров) с архитектурой CUDA GPU и систему хранения данных.

Сотрудниками кафедры разработано и постоянно улучшается уникальное ПО для прозрачного доступа к кластеру через Веб-интерфейс.

Гибридная суперкомпьютерная система, включает оборудование различных производителей (вендоров) для эффективного решения широкого класса задач, связанных с оптимизацией производства и бизнес процессов.

 

Описание суперкомпьютерной системы

Преимущества нашей системы

Технические данные

 

Описание суперкомпьютерной системы

Гибридная суперкомпьютерная система включает в себя:
Вычислительную систему, объединяющую кластер CPU(центральных процессоров) x86/64 - на базе процессоров Intel Xeon, и кластер GPU(графических процессоров) - на базе процессоров NVidia Tesla.

Модуль системы хранения данных на базе оборудования Sun Microsystems.

Инновационную модель программирования, позволяющую объединить вычисления, использующие CPU и GPU.

Инновационную программную систему, которая управляет выполнением проекта, использующего гибридные вычисления, и предоставляет прозрачный интерфейс для работы пользователей с системой на базе web-технологий.

Преимущества нашей системы

В настоящее время есть множество общедоступных вычислительных кластеров (суперкомпьютеров). Одни основаны на стандартной архитектуре CPU, другие на менее известной архитектуре GPU. Проведенный обзор показал, что вычислительных систем, объединяющих данные архитектуры в единый кластер, нет, либо они являются коммерческим секретом.

Архитектура CPU позволяет использовать практически любые шаблоны параллельных вычислений, в то время как GPU является менее гибким, но гораздо более производительным вариантом для решения многих вычислительных задач. В частности, архитектура современных GPU NVidia Tesla включает в себя множество масштабируемых блоков, не обладающих мощной управляющей логикой и большим объемом кэш-памяти. Эта архитектура может эффективно применяться при вычислениях с большим параллелизмом и интенсивной арифметикой. Все функции, выполнимые на GPU, не поддерживают рекурсии и имеют некоторые другие ограничения, которых нет в архитектуре CPU. С помощью созданной авторами модели программирования стало возможным разрабатывать сложные проекты с использованием параллельных вычислений, которые одновременно могут использовать "гибкость" CPU и более скоростные вычисления GPU.

Другим недостатком существующих суперкомпьютерных систем является непрозрачный доступ пользователя к своим проектам на кластере. Сегодня пользователю предлагается обучиться работать с арсеналом программного обеспечения (программой удаленного доступа, командной строкой, компилятором, планировщиком и т.д.), установленным на целевом кластере. Поэтому авторами разработана программная система, позволяющая осуществлять удаленную работу с проектами без необходимости погружаться в устройство операционной системы кластера.

Технические данные

На сегодняшний день в распоряжении ОмГТУ находится пять вычислительных узлов с архитектурой CPU (mgr, cn01, cn02, cn03, cn04). Каждый вычислительный узел включает два 4-ядерных процессора HP X5472 DL 160G5. Пиковая производительность достигает 1 Tflop, а объем оперативной памяти составляет 40GB. Структура масштабируема и расширяема. Вычислительная мощность может быть увеличена за счет добавления дополнительных узлов.

В рамках гибридизации к суперкомпьютеру добавлен вычислительный узел cn05, осуществляющий управление кластером GPU. Для его построения выбрана платформа NVidia Tesla 10 c архитектурой CUDA GPU. Узел представляет собой персональный компьютер с подключенными к нему ячейками NVidia Tesla S1070, каждая из которых включает в себя 4 GPU с суммарной пиковой вычислительной мощностью 4 Tflops в операциях с одинарной точностью. То есть производительность всей системы, при относительно малых затратах увеличивается до 5 Tflops (при задействовании одной ячейки Tesla S1070). Для выполнения параллельных вычислений используется NVidia CUDA API для языков программирования C, C++, Fortran.

Другим дополнением суперкомпьютерной системы является модуль хранения данных (ssd) на базе системы Sun StorageTek 9900V. Данная система отличается высокой отказоустойчивостью. Общий объем системы хранения данных 12 Тб, планируется расширение до 165 Тб.

Все узлы объединены в локальную высокоскоростную сеть (1Gb/сек). Параллельное выполнение программ осуществляется с помощью технологий MPI и CUDA. Поддерживаемые реализации MPI: OpenMPI, HPMPI, MPICH.

Для управления кластером один из его узлов выделен как управляющий (mgr), при необходимости он может быть использован для вычислений. На управляющем узле установлена авторская программная система для управления проектами на кластере (HIG_Cluster_Pack). С её помощью узел принимает и выполняет команды авторизованных пользователей через Интернет. Все соединения осуществляются по защищенному HTTPS протоколу.

Программная система доступа к кластеру является инновационной полностью переносимой и расширяемой и может работать на суперкомпьютерах с любой аппаратной конфигурацией, операционной системой и программным обеспечением. На сегодняшний день данная система не имеет аналогов и успешно используется на кластере ОмГТУ. Среди достоинств данной системы можно выделить строгую аутентификацию пользователей, защищенное выполнение кода пользовательского проекта, удобный web-интерфейс управления проектом, систему полуавтоматической обработки заданий, автоматизацию действий администратора.

Суперкомпьютерная система, разработанная нашими сотрудниками ориентирована на широкий круг задач. В сочетании с инновационными авторскими разработками по созданию унифицированных средств доступа и управления, данная система позволяет использовать сразу все ведущие решения в области высокопроизводительных вычислений.

(c)

HIG_Cluster_Pack:

Автор идеи - к.ф.-м.н. Хныкин И.Г.
Разработчик - к.ф.-м.н. Хныкин И.Г.

Гибридный суперкомпьютер

Автор идеи - д.т.н. Файзуллин Р.Т.
Разработчики - к.ф.-м.н. Хныкин И.Г., Свенч А.А.

 
Баннер