На сьогоднішній день вельми актуальна тема переходу до нових поколінь обчислювальних засобів, що пов'язане з потребами вирішення складних завдань великих размерностей. В той же час не коштує">
На сьогоднішній день вельми актуальна тема переходу до нових поколінь обчислювальних засобів, що пов'язане з потребами вирішення складних завдань великих размерностей. В той же час не коштує на місці процес розробки нового вигляду озброєнь, і це теж вимагає створення нових, вдосконалених, обчислювальних машин для підтримки їх ефективного функціонування. У наш час однопроцесорні обчислювальні системи вже не вже не в змозі вирішити більшість військово-прикладних завдань, так рівень вимог до продуктивності і надійності обчислювальних засобів, особливо в області вирішення вирішення військово-прикладних завдань постійно росте і тепер як засіб підвищення продуктивності обчислювальних систем військового призначення найчастіше використовуються багатопроцесорні обчислювальні системи (МВС).
Як основні вимоги, що пред'являються до таких систем, можна виділити наступні:
• необхідність високої продуктивності для будь-якого алгоритму;
• узгодження продуктивності пам'яті з продуктивністю обчислювальної частки;
• здатність мікропроцесорів погоджено працювати при непередбачуваних затримках даних від будь-якого джерела;
• машинно-незалежне програмування.
Одним з чинників, що впливають на архітектуру високопродуктивних обчислювальних систем, є взаємозалежність архітектури і алгоритмів завдань. Найчастіше наявність цього чинника веде до створення проблемно-орієнтованих систем. При цьому може бути досягнутий найвищий рівень продуктивності для даного класу завдань. Така взаємозалежність також виступає стимулом для пошуку алгоритмів, щонайкраще відповідних можливим формам паралелізму на рівні апаратури, а, як відомо, збільшення ступеня паралелізму веде до збільшення числа логічних схем, що супроводиться збільшенням фізичних розмірів, внаслідок чого зростають затримки сигналів на межсоєдіненіях. А оскільки для написання програм використовуються мови високого рівня, необхідні певні засоби автоматизації процесів розпаралелювання і оптимізації програм. Кінець кінцем, цей чинник приводить до одного з двох результатів:
• до зниження тактової частоти
• до створення додаткових логічних ступенів і, як наслідок, до втрати продуктивності;
Варто також відзначити, що зростання числа логічних схем також приводить до зростання споживаної енергії і тепла, що відводиться.
До того ж більш високочастотні логічні схеми за інших рівних умов споживають велику потужність на один вентиль. Результатом є виникнення теплофізичного бар'єру, що обумовлене двома чинниками:
• високою питомою щільністю теплового потоку, що вимагає застосування складних засобів відведення тепла;
• високою загальною потужністю системи, що викликає необхідність використання складної системи енергозабезпечення і спеціальних приміщень.
Разом з тим, мають місце підходи, зв'язані із застосуванням спеціалізованих мікропроцесорів, які орієнтовані саме на використання в паралельних системах. Як приклад можна привести серію трансп'ютерів фірми Inmos. Але із-за обмеженого ринку ця серія по продуктивності різко відстала від універсальних мікропроцесорів, таких, як Alpha, Power РС, Pentium.
Спеціалізовані мікропроцесори матимуть повноцінну конкурентоспроможність тільки за умови скорочення витрат на проектування і освоєння у виробництві. А це, у свою чергу, багато в чому залежить від продуктивності інструментальних обчислювальних засобів, використовуваних в системах автоматизованого проектування.
Відмітимо, що апаратна реалізація паралельних підсистем повністю залежить від вибраних мікропроцесорів, БІС пам'яті і інших компонентів. На сьогоднішній день по економічних міркуваннях доцільно використовувати найбільш високопродуктивні мікропроцесори, розроблені для уніпроцессорних машин.
Різні обчислювальні машини використовують різні підходи, направлені на досягнення наступних цілей:
• максимальна арифметична продуктивність процесора;
• ефективність роботи операційної системи і зручність спілкування з нею для програміста;
• ефективність трансляції з мов високого рівня і виключення написання програм на автокоді;
• ефективність розпаралелювання алгоритмів для паралельної архітектури.
Проте в будь-якій машині необхідно в тій або іншій формі вирішувати всі вказані завдання. Відзначимо, що спочатку цього намагалися досягти за допомогою одного або декількох однакових процесорів.
У розвиток обчислювальних засобів завжди вносили найбільший внесок технологічні рішення. Причому основоположною характеристикою покоління обчислювальних систем була елементна база, оскільки перехід на нову елементну базу добре корреліруєтся з новим рівнем показників продуктивності і надійності обчислювальних систем.
Дещо припинив пошуки принципово нових архітектурних рішень бурхливий розвиток технології СБІС і розробка останніх поколінь мікропроцесорів, проте, стає очевидною, що чисто технологічні рішення втратили своє монопольне положення.
Так, наприклад, в найближчому майбутньому помітно зростає значення проблеми подолання розриву між апаратними засобами і методами програмування. Ця проблема вирішується чисто архітектурними засобами, при цьому роль технології є непрямою: високий ступінь інтеграції створює умови для реалізації нових архітектурних рішень. Також не викликає подиви і той факт, що без кардинальної перебудови архітектурних принципів підтримувати інтенсивні темпи розвитку засобів обчислювальної техніки вже неможливо. Найоптимістичніші прогнози свідчать: тактові частоти сучасних і перспективних СБІС можуть бути збільшені в осяжному майбутньому до 5 Ггц.
Досягнутий ступінь інтеграції, у свою чергу, дозволяє будувати паралельні системи, в яких число процесорів може досягати десятків тисяч. В області підвищення продуктивності обчислювальних систем резерв технологічних рішень обмежується одним порядком. Освоєння ж масового паралелізму і нових архітектурних рішень містить резерв підвищення продуктивності на декілька порядків.
Взагалі, в розвитку обчислювальних засобів виділяють три основні проблеми:
• підвищення продуктивності;
• підвищення надійності;
• покриття семантичного розриву.
Етапи розвитку обчислювальних засобів прийнято розрізняти по поколіннях машин. Характеристика покоління визначається конкретними показниками, що відображають досягнутий рівень у вирішенні трьох перерахованих проблем. Оскільки величезний внесок в розвиток обчислювальних засобів завжди належав технологічним рішенням, за основоположну характеристику покоління машин вважалася елементна база. І дійсно, перехід на нову елементну базу добре корреліруєтся з новим рівнем показників продуктивності, надійності і скорочення семантичного розриву.
В даний час актуальним є перехід до нових поколінь обчислювальних засобів: одним з домініруюших напрямів розвитку СУПЕРЕОМ можна назвати обчислювальні системи з MIMD-параллелизмом на основі матриці мікропроцесорів. Для створення подібних обчислювальних систем, що складаються з сотень і тисяч зв'язаних процесорів, потрібно було подолати ряд складних проблем як в програмному забезпеченні (мови Parallel Pascal, Modula-2, Ada), так і в апаратних засобах (ефективна комутаційна середа, високошвидкісні засоби обміну, потужні мікропроцесори). Елементна база сучасних високопродуктивних систем характеризується високим ступенем інтеграції (до 3,5 млн. транзисторів на кристалі) і високими тактовими частотами (до 600 Мгц).
За традицією, що склалася, вирішальна роль відводиться технології виробництва елементної бази. В той же час стає очевидним, що технологічні рішення втратили монопольне положення. Так, наприклад, в найближчій перспективі помітно зростає значення проблеми покриття семантичного розриву, що відбивається в необхідності створення високоскладних програмних продуктів і вимагає кардинального зниження трудоємкотси програмування. Ця проблема вирішується переважно архітектурними засобами. Роль технології тут може бути тільки непрямою: високий ступінь інтеграції створює умови для реалізації архітектурних рішень.
В даний час всі фірми і всі університети США, Західної Європи і Японії, розробляючі СУПЕРЕОМ, ведуть інтенсивні дослідження в області багатопроцесорних СУПЕРЕОМ з масовим паралелізмом, створюють безліч їх типів, організовують їх виробництво і прискореними темпами освоюють світовий ринок в цій області. Багатопроцесорні ЕОМ з масовим паралелізмом вже зараз істотно випереджають по продуктивності традиційні СУПЕРЕОМ з векторно-конвеєрною архітектурою. Системи з масовим паралелізмом пред'являють менші вимоги до мікропроцесорів і елементної бази і мають значно меншу вартість при будь-якому рівні продуктивності, чим векторно-конвеєрні СУПЕРЕОМ. Вже в поточному десятилітті продуктивність СУПЕРЕОМ з масовим паралелізмом досягне колосальної величини - десятків тисяч мільярдів операцій в секунду з плаваючою комою над 64-розрядними числами (десятків Тфлопс).
На щорічній конференції в Чепел-хилл (Сівши. Кароліна) представлений проект фірми IBM, метою якого є створення гіперкубічного паралельного процесора в одному корпусі. Конструкція, названа Execube, має 8 - 16-розрядних мікропроцесоров, вбудованих в кристал 4мбіт динамічного ЗУ(ДЗУ). При цьому ступінь інтеграци складає 5 млн. транзисторів. Мікросхема виготовлена по КМОП-технології з трьома рівнями металізації на заводі IBM Microelectronic (Ясу, Японія). Execube є спробою підвищення ступеня інтеграції процесора з пам'яттю шляхом ефективнішого доступу до інформації ДЗУ. По суті, пам'ять перетворюється на розширені регістри процесорів. Продуктивність мікросхеми складає 50 млн оп/с.
Фірма CRAY Research оголосила про початок випуску суперкопьютеров CRAY T3/e. Основна характеристика, на якій акцентували увагу розробники - масштабованість. Мінімальна конфігурація складає 8 мікропроцесорів, максимальна - 2048. В порівнянні з попередньою моделлю T3/d співвідношення ціна/продуктивність понижена в 4 рази і складає 60 долл/мфлопс, чому сприяло застосування недорогих процесорів DEC Alpha EVC, виготовлених по КМОП-технології. Передбачувана вартість моделі Т3/е на основі 16 процесорів з 1-гбайт ЗУ складе 900 тис. доларів, а ціна найбільш потужної конфігурації (1024 процесори, ЗУ 64 Гбайт) - 39,7 млн. доларів при піковій продуктивності 600 Гфлопс.
Одним із способів подальшого підвищення продуктивності обчислювальної системи є об'єднання суперкомп'ютерів в кластери за допомогою оптоволоконних з'єднань. З цією метою комп'ютери CRAY T3/e забезпечені каналами введення/виводу з пропускною спроможністю 128 Гбайт/с. Потенційні замовники виявляють підвищену цікавість до нової розробки фірми. Бажання придбати комп'ютер виявили такі організації як Pittsburgh Supercomputer Center, Mobile Oil, Департамент по океанографії і атмосферним дослідженням США. При цьому підписано декілька контрактів на виготовлення декількох комп'ютерів 512-процесорної конфігурації.
Серед японських компаній слід виділити фірму Hitachi, яка випустила суперкомп'ютер Sr2201 з масовим паралелізмом, що містить до 2048 процесоров. У основі системи перероблена компанією процесорна архітектура RA-RISC від фірми Hewlett-paccard. Псевдовекторний процесор функціонує під управлінням ОС Hp-ux/mpp Mash 3.0. У комп'ютері, крім того, використана система підтримки паралельного режиму роботи Express, створена корпорацією Parasoft і що отримала назву Parallelware. Продуктивність нового комп'ютера складає 600 Гфлопс. До березня 1999 р. фірма планує продати 30 суперкомп'ютерів.
Одним з найбільш масштабних проектів в області створення обчислювальних засобів з масовим паралелізмом є проект фірми Intel по розробці самого швидкодіючого комп'ютера на основі мікропроцесорів шостого покоління P6. Нова система, яку планується встановити в Sandia National Laboratories складатиметься з 9000 процесорів Pentium P6 і матиме пікову продуктивність 1000 Гфлопс. Замовником системи є міністерство енергетики США. При цьому основною сферою застосування буде моделювання підземних ядерних вибухів, що дозволить витрачати 25 млн. доларів в рік замість 300 млн.
За останнє десятиліття має місце наступна динаміка зростання продуктивності паралельних обчислювальних систем в США: 1987 р. - 50 Мфлопс.
1989 р. - 1 Гфлопс(суперкомп'ютери СМ).
1991 р. - 10 Гфлопс(векторні процесори і процесори серії 528).
1994 р. - 100 Гфлопс (CRAY, Paragon0).
1996 - 1997 рр. - 200 - 500 Гфлопс (комбінація векторного процесора і куба потокової обробки).
1998 - 1999 рр. - 1000 - 3000 Гфлопс (ASCI, T3e).