Рефераты

Процессоры

быстрыми сопроцессорами для работы с 386DX/486DLC/38600DX. Жесткий диск

Conner 3204F, емкость 203 МВ, интерфейс IDE (пропускная способность по

тесту CORETEST 1100 КВ/с, время поиска 16 мс). Плата SVGA (ISA, Diamond

SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, как экранный буфер,

графический ускоритель отключен. Переключатели на видеоплате установлены

для наиболее надежной с быстрой работы, с пропускной способностью 6500

байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.

Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, HyperDisk

4.32 в режиме обратной записи, используется 2 МВ расширенной памяти, в

качестве менеджера памяти используется 386MAX 6.01. Эта программа также

обеспечивает DPMI в некоторых тестах.

Результаты тестов

Для тестов Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и

Savage больший показатель означает большую производительность.

Для тестов MAKE RTL, MAKE TRANK и теста String- Test меньший

показатель означает большую производительность.

33,3 МГц Intel C&T Intel Cyrix Cyrix

386DX 38600DX RapidCAD 486DLC 486DLC

кэш выкл. кэш вкл. Тесты с

целыми числами

Whetstone (kWhet/s) 447 585 563 695 803

Drhystone(C) (Dhry./s) 11688 11819 12357 14150 15488

Drhystone(Pas) (Dhry./s) 10455 10877 10751 12154 13858

String-Test (ms) 459 453 441 347 327

MAKE RTL (s) 51,32 47,10 46,34 43,45 39,13

MAKE TRANCK (s) 62,42 55,47 55,37 53,64 46,12

WINTACH 4,85 4.90 5.49 5.53 6.14

Тесты с плавающей запятой

DODUC (Индекс скорости) 79.0 76.4 150.3 89.4 90.7

LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438

LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139

Whetstone (kWhet/s) 2540 2340 3990 2908 3061

Savage (решений/с) 71685 53191 72464 88757 93897

40 МГц Intel C&T Intel Cyrix Cyrix

386DX 38600DX RapidCAD 486DLC 486DLC

Тесты с целыми числами кэш выкл. кэш вкл.

Whetstone (kWhet/s) 536 702 676 835 963

Drhystone(C) (Dhry./s) 14128 14116 14836 16987 18750

Drhystone(Pas) (Dhry./s) 12490 13067 12890 14573 16624

String-Test (ms) 384 377 368 289 273

MAKE RTL (s) 43.46 40.11 39.84 37.25 33.54

MAKE TRANCK (s) 53.00 47.59 47.07 45.36 39.00

WINTACH 5.65 5.73 6.41 6.46 7.23

Тесты с плавающей запятой

DODUC (Индекс скорости) 94.9 77.5 180.3 105.1 106.6

LINPACK (Mflops) 0.3324 0.3260 0.5418 0.3789 0.4131

LLL (Mflops) 0.4025 0.4204 0.7260 0.4562 0.4956

Whetstone (kWhet/s) 3061 2632 4798 3505 3677

Savage (решений/с) 86083 49587 86957 106762 112360

Среди испытанных процессоров Cyrix 486DLC обладает самой большой

производительностью по целым числам. С включенной внутренней кэш-памятью

производительность по целым числам на одинаковой тактовой частоте 486DLC на

80% превышает 386DX, среднее увеличение скорости работы прикладных программ

составляет 35%. При работе с прикладными программами, использующими

операции как с целыми числами, так и с плавающей точкой, включенный кэш

обеспечивает на 5% - 15% более высокие показатели по сравнению с работой

без КЭШа. Скорость операций с плавающей точкой по сравнению с i386DX

увеличивается на 15% - 30%

Intel RapidCAD при работе вместо i386DX обеспечивает самые высокие

характеристики при выполнении операций с плавающей точкой. Прикладные

программы, выполняющие интенсивные операции с плавающей точкой, работают

быстрее на 60% - 90% по сравнению с i386DX/387DX, отставая от i486DX при

той же тактовой частоте по скорости операций с плавающей точкой всего на

25%. Скорость операций с целыми числами увеличивается на 15% - 35% по

сравнению с i386DX/i387DX.

Процессор Chips & Technologies 38600DX обладает несколько более

высокими характеристиками при работе с целыми числами, чем i386DX, давая

среднее увеличение скорости порядка 10%.

5.2. Результаты тестирования микропроцессоров с помощью пакета The

Speed Test.

Для тестирования различных микропроцессоров иногда применяют

специальные пакеты программ processor benchmarks. Ниже приведены результаты

тестирования процессоров с помощью пакета программ Speed Test, ARA

Copyright (C) 1994,95,96 Agababyan Robert Assotiation Used TMi0SDGL(tm)

Pentium iP5-200(3-200), 512K PB 1318841

Pentium iP5-200(2.5-200), 512K PB 1309353

Pentium iP5-200(2.5-200) 1290780

Pentium iP5-200(3-200) 1290780

Pentium iP5-180, 512K PB 1181818

Pentium iP5-180 1151899

Pentium iP55-166, Intel Triton, IWill TSW2 1109756

Pentium iP5-166, 512K PB 1096386

Pentium iP5-166 1076923

Pentium iP5-160, 512K PB 1052023

Pentium iP5-160 1040000

Pentium iP5-150, 512K PB 983784

Pentium iP5-150 968085

Pentium iP5-133, 512K PB 879227

Pentium iP5-133 866667

Pentium iP54-75(1.5-120), Intel Triton 812500

Pentium iP54-75(2-120), Intel Triton 812500

Pentium iP54-75(2-120), SiS 501/503 812500

Pentium iP5-100(2-120), Intel Triton, ASUS P55-TP4 798246

Pentium iP5-120(1.5-120), 512K PB 798246

Pentium iP5-120, 512K PB 787879

Pentium iP5-120(1.5-120) 781116

Pentium iP5-120 777778

Cx5x86-M1sc-100(3-150,Opt) 771186

Cx5x86-M1sc-100(3-150,Opt) 758333

Am5x86-133-X5-P75(4-200) 710938

Pentium iP5-100, ALR Revolution 679104

Pentium iP5-100, Intel Triton, ASUS P/I-P55TP4XE 669118

Pentium iP5-100, Intel Triton 669118

Pentium iP54-75(100), Intel Triton 669118

Am5x86-133-X5-P75(3-180), UMC8886BF/8881F 640845

Cx5x86-M1sc-100(3-120,Opt) 614865

Pentium iP54-75(90), Intel Triton, ASUSTeK P54-TP4 606667

Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG 600660

Am5x86-133-X5-P75(4-160), SiS 471, BTC 4SLD5.1 568750

Am5x86-133-X5-P75(4-160), SiS 496/7, ASUS PVI-SP3 568750

Am5x86-133-X5-P75(4-160), SiS 471 561730

Am5x86-133-X5-P75(4-160), SiS 496 PCI 561728

Am5x86-133-X5-P75(4-160) 561128

Cx5x86-M1sc-100(3-120), SiS 496/7, ASUS PVI-SP3 548193

Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG 535294

i80486DX4-100(120), UMC 8498F 535294

Am5x86-133-X5-P75(3-150), SiS 471, BTC 4SLD5.1 529070

Cx5x86-M1sc-100(Opt) 511236

Nx586-90(100), NxVL System Logic, Alaris 505450

Cx5x86-M1sc-100(Opt), SiS 471, GMB-486SG 501377

Am5x86-133-X5-P75, SiS 471, BTC 4SLD5.1 469072

Am5x86-133-X5-P75, SiS 496/7, ASUS PVI-SP3 469072

Cx5x86-M1sc-100, SiS 496/7, ASUS PVI-SP3 455000

i80486DX4-100, UMC 881 455000

Nx586-90, NxVL System Logic, Alaris 455000

Pentium iP5-60(66), PCI58PL 450495

Pentium iP5-60(66), SiS 501/502/503, ASUS P5-SP 450495

Cx5x86-M1sc-100, SiS 471, GMB-486SG 446078

i80486DX2-66(4-100), PC Chips 18 446078

i80486DX4-100, SiS 82C471, SOYO 446078

OverDrive iDX4ODPR100 (486DX4-100) 437500

i80486DX4-100, Compaq ProLinea 4/100 433333

Am80486DX4-120SV8B, SiS 471, BTC 4SLD5.1 425234

Am80486DX4-120, SiS 471, SOYO 425234

Pentium iP5-60, Compaq DeskPro XL 560 406250

Pentium iP5-60, Compaq Proliant 406250

Pentium iP54-75(60), Intel Triton 406250

Pentium iP5-60, OPTi 596/546/82, Bison III v1.0 406250

Pentium iP5-60, SiS 501/502/503, ASUS P5-SP 406250

Am80486DX2-80(100), UMC 8498F 352713

Am80486DX4-100, PC Chips 18 350000

Am80486DX2-80(100), SiS 471 345351

Cx80486DX2-100, Opti VIP 344697

i80486DX4-100(75), UMC 881 337037

Pentium iP54-75(50), Intel Triton 334559

Pentium iP54-75(45), Intel Triton 303333

U5-S33(60), UMC 491F 301325

i80486SX2-50(80), SiS 471, S486G 282609

i80486DX2-S-80, PC Chips 18 280864

i80486DX2-80, Symphony Haydn II 280864

i80486DX2-S-80, UNICHIP U4800VLX, U486 WB 280864

Cx80486DX2-66(80), OPTi 495SLC 277560

U5-S33(50), SiS 471, AV7541 250000

U5-S33(50), SiS 471, SOYO 250000

U5-S33(50), UMC 491F 250000

U5-S33F(50), UMC 8498F 250000

U5-S33(50) 246612

U5-S33(50), CONTAQ 82C596A, G486VLI 245946

U5-S40(50) 245946

i80486DX2-66, DELL 238196

Am80486DX2-66, Forex 46C421 234964

Am80486DX2-66, Bioteq 82C3491 234536

Am80486DX2-66, OPTi 495SLC 234536

i80486DX2-66 &E5, AcerMate 466 234536

i80486DX2-66, ALI M1429/M1431 234536

i80486DX2-66, SiS 82C471 234536

i80486DX2-66, Symphony, Predator I 234536

i80486DX2-66, OPTi 82C682, ALR Evolution 4 233333

i80486DX2-66, PC Chips 11&13 233333

Am80486DX2-66, IMS 8849 232143

i80486DX2-66, Compaq ProLinea MT 4/66 232143

Am80486DX2-66, UNICHIP U4800VLX, U486 WB 230964

i80486DX2-66, Intel Champion 230964

Cx80486DX2-66, UMC 82C491F 230964

OverDrive iDX2ODPR66 (486DX2-66) 230964

Am80486DX2-66, SiS 82C471 229798

i80486DX2-66, Symphony Haydn II 229768

i80486DX2-66, SiS 82C471 228643

U5-S33(40), SiS 82C471 200441

U5-S33F(40), UMC 8498F 200441

U5-S33(40), Expert 4045 194861

i80486DX-50, UMC 82C480 176357

i80486DX2-50, Headland HT342/HT321 176357

i80486SX-50, SiS 82C471 176357

Am80486DX-50, UMC 82C491F 173004

i80486DX-50 173004

i80486DX2-50, OPTi 495SLC 171053

Cx486S-40(50), UMC 82C491F 171053

U5-S33, SiS 82C471 167279

U5-S33, Expert 4045 162645

IBM486SLC2-66, OPTi 495XLC 161922

i80486SX-33(40), SiS 82C471 140867

i80486SX-33(40), OPTi 82C495SLC 140867

Am80486DX-40, OPTi 82C495SLC 140432

i80486SX-33(40) &E5, Forex 521 140000

i80486SX-33(40), Forex 521 139571

Am80486DX-40, SiS 82C461 138931

Cx486DX-40 135821

Ti486DLC/E-40BGA, PC Chips, M321 126389

Cx486DLC-40 126389

Tx486DLC-40, OPTi 495SLC 126039

Cx486DLC-40GP, SARC RC4018A4 123641

IBM 486SLC2-50, WD7600 122642

Cx486SLC-40, SARC RC2016A4, M396F 120053

i80486SX-33, SiS 82C471 117571

i80486DX-33, HP Vectra 486/33VL 116967

i80486DX-33, OPTi 82C498, Simens-Nixdorf PCD-4H 116967

i80486SX-20(33), Symphony 116967

i80486DX-33, Intel Champion 116667

i80486DX-33, Toshiba T9901C, LapTop 116667

i80486DX-33, UMC 82C481 114035

i80486SX-25, IBM PS/1 88694

i80486SX-25, SiS 87838

i80486SX-25, HiNT CS8005 87500

i80486SX-25, HP Vectra 486SX/25VL 86502

Am80386DX-40, ALI M1429/M1431 81835

Am80386DX-40, CD-COM, M326 81835

Am80386DX-40 WC, SARC 81835

Am80386DX-40, UMC 82C491F 81688

Am80386DX-40, OPTi 82C391 81531

Am80386DX-40, UNICHIP U4800VXL 81182

Am80386DX-40, PC Chips 5,6 80817

Am80386DX-40, UMC 80C481 80647

Am80386DX-40, OPTi 495XLC 80531

Am80386DX-40, Forex FRX46C402,411 80247

Am80386SX-40, P9 MXIC 73387

i80386DX-33 68114

Am80386SX-40, M396F 67407

Am80386SX-40, Acer M1217 63459

Am80386SX-40, ALI M1217 62329

Am80386SX-40, PC Chips 2 61905

i80386SX-33, Acer M1217 51066

i80386SX-33 49296

i80386DX-25 48925

i80386SX-33, HP Vectra 386SX/33N 48611

Am80386SX-33, Acer M1217 47744

80286-25 45867

80286-20 38625

Harris 80286-20, UMC 82C208L 37387

80286-16, HT12 29111

i80286-12.5 24125

i80286-12 22392

i80286-10, IBM PS/2 15545

i80286-10, IBM PS/2 60 15242

i8088-9.54, Commodore PC-20 5395

i8088-7.16, Commodore PC-20 4011

i8088-4.77, EC-1841 2968

i8088-4.77, Original XT 2697

i8088-4.77, Commodore PC-20 2658

6. Сравнительный анализ.

В середины октября 1995 года в г. Сан-Хосе (Калифорния) состоялся

очередной Микропроцессорный Форум. В прошлом году на нем демонстрировались

прототипы процессоров IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP PA-

8000 и DEC Alpha 21164.

Из прошлогодних процессоров – дебиторов до рынка дошел только

процессор Alpha 21164/300. Его производительность по тесту SPECint92

составила 341 единицу. Пребывая с такой потрясающей производительностью в

лидерах гонки на быстродействие процессоров, в ноябре Alpha пропустила

вперед компанию Intel с процессором Pentium Pro. Страсти накалились

нешуточные и вот на нынешнем форуме Digital сообщила, что в декабре

приступит к выпуску нового варианта этого процессора - Alpha 21164A с

тактовой частой 333 МГц, выполненного по технологии 0.35 мкм. Проектируемая

производительность 500 по SPECint92.

Hewlett – Packard анонсировала 32-разрядный процессор архитектуры РА

следующего поколения РА-7300LC с встроенными функциями мультимедиа. Hачало

его выпуска по 0.5 мкм технологии возможно во второй половине следующего

года. Этот первый процессор PA-RISC, оснащенный внутренними 64 Кбайт КЭШами

первого уровня для команд и для данных, предпочтительно будет иметь 200

SPECint92 и 275 SPECfp92.

Через год после объявления процессора UltraSPARC фирма SPARC

Technology представила новый проект UltraSPARC- II. Hовый процессор будет

иметь 5.4 млн. транзисторов, изготавливаться по технологии

0.35 микрон, работать на частоте 250-300 МГц. Проектируемое быстродействие

250 МГц версии - 350 SPECint92 и 550 SPEFfp92. Кроме базовой системы

команд, процессор будет оснащен набором из 30 новых команд Visual

Instruction Set, которые предназначены для быстрой обработки видеофайлов в

формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.

Рождение Pentium Pro восхитительная новость, но оно неизменно

поднимает несколько серьезных вопросов. Hа самом ли деле это полностью

новое поколение процессора Pentium? Побила ли Intel своих конкурентов

окончательно? Какой процессор является самым безопасным выбором с точки

зрения надежности и совместимости? Какой процессор наиболее выгоден с точки

зрения соотношения цены и производительности? Сегодня с полным основанием

можно спросить, насколько он сравним со своими RISC-оппонентами? Hе устарел

ли лозунг Apple о том, что Power Mac перспективнее, чем линия x86?

Hа все вопросы можно ответить в принципе утвердительно. Конкуренты из

лагеря х86 пока не могут на деле подтвердить свои претензии на равенство

или превосходство. Hичего живого или приличного (Cyrix) на руках пока нет.

А ценовой ориентир Intel известен: настольный high – end компьютер на

платформе Aurora, Pentium Pro 150 MHz, ОЗУ 16 Мб, жесткий диск EIDE 1 Гб, 2

Мб SVGA, монитор 17" NI digital SVGA, Windows 95 в декабре обойдется жадным

к мощности пользователям дешевле $5000. Желающие могут сравнить эту цену с

рабочей станцией Sun или IBM и сделать свои выводы. Hесомненный плюс -

гарантированная совместимость с самым распространенным программным

обеспечением. Приятные вести из области мощных специализированных

приложений - скоро должны появится версии многих замечательных пакетов для

архитектуры Intel, причем цены на них могут вызвать приступ черной зависти

у владельцев рабочих станций.

Если даже производители рабочих станций на RISC-процессорах смогут в

следующем году совершить рывок в производительности, то разрыв между Intel,

исполняющим подавляющую часть ПО, и машинами RISC будет достаточным, чтобы

преимущество рабочих станций было непреодолимым.

В первом номере Computer Week Moscow можно найти пассаж интересного

характера. Дословно: "Опытные системы P6 способны на большее, чем просто

выдерживать конкуренцию со стороны других рабочих станций среднего класса.

При непосредственном сопоставлении рабочих станций Intergraph на 200-МГц

процессоре Pentium Pro и Silicon Graphics Indigo-2 Extreme с 200-МГц

процессором Mips R4400, последняя на тестах iSPEC показала порядка 160

единиц, тогда как оценки Intel для системы P6 полной конфигурации

соответствуют 366 единицам."

При создании процессора Pentium Pro делался упор на способности этой

микросхемы выполнять графический рендеринг и работать с 32-разрядным кодом.

Pentium Pro явно выламывается из рамок процессора Pentium и

принадлежит шестому поколению архитектуры Intel x86. Раньше все конкуренты,

изготовители процессоров-клонов двигались в фарватере оригинала, копируя

его с некоторыми компромиссами, тем самым, обрекая себя на все большее

отставание и замкнутость на вторичных рынках. Подобная тактика себя

исчерпала, она грозит полной потерей конкурентоспособности, да к тому же

Intel буквально терзает конкурентов постоянными сбросами цен и расширением

номенклатуры, сужающими нишу, в которую еще можно протиснуться.

Вот почему AMD, NexGen и Cyrix перешли недавно на собственный курс,

отказавшись от безнадежного копирования схем Intel.

Hо принципиальной прорасти между конкурентами нет. В некоторых

случаях Pentium Pro более сложен, чем Nx586, K5 и M1, в других менее. В

целом же схема P6 сравнима с прочими процессорами; наиболее близок к ней

дизайн К5, как считают эксперты.

Особенность подхода Intel к созданию гибрида CISC/RISC заключается в

формуле dynamic execution (динамическое исполнение). Примерно такие же

базовые принципы вы обнаружите, если станете разбираться подробно с

архитектурой последних RISC-процессоров IBM/Motorola PowerPC 604 и Power PC

620, Sum UltraSparc, Mips R10000, Digital Alpha 21164 и HP PA-8000.

Разительно сходство подхода разных фирм к гибридизации подходов CISC

и RISC. Внешне Pentim Pro выглядит традиционным CISC-процессором,

совместимым со всем наработанным программно-аппаратным фондом. Знакомый

"фасад" прикрывает от пользователя RISC-подобное ядро. Между "фасадом" и

"задними комнатами" работает умнейший декодер, разбивающий сложные и

длинные команды х86 на более простые операции, похожие на команды RISC -

компания Intel называет их u-ops или micro - ops. Эти micro - ops поступают

в ядро процессора, которое их буквально перелопачивает. Элементарные

микрооперации легче распределять и параллельно обрабатывать, чем

порождающие их команды х86. Как бы они не назывались, цель преследуется

одна: преодолеть ограничения системы команд х86, но сохранить совместимость

с существующим программным обеспечением х86. Внешне - на взгляд

программиста, пишущего программы - все эти ЦПУ выглядят как стандартные х86-

совместимые CISC-процессоры. А внутри они работают как современнейшие

модели RISC-чипов.

Hо сегодня Pentium Pro "живее" и быстрее не только любого из "живых"

процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого из

выпускаемых RISC-процессоров.

Как говорится, не дразните большого парня, иначе будете с

расквашенным носом. Именно таков смысл послания Intel в адрес конкурентов:

NexGen, Cyrix и AMD.

7. Pentium II.

7.1 Pentium II

Выпущенный с середины 1997 года, Pentium II ввел ряд больших

изменений в мир процессоров PC.

Во-первых, чип и системный кэш второго уровня соединялись по

выделенной шине, способной работать на частоте шины процессор-система.

Во вторых, процессор, вторичный кэш и тепло отвод были смонтированы

на небольшой плате, вставлявшейся в разъем на системной плате, что больше

напоминало карту расширения, чем традиционную схему процессор/гнездо. Intel

окрестил это Single Edge Contact cartridge (SEC) - односторонне контактный

картридж. В этом картридже находятся шесть отдельных компонент - процессор,

четыре индустриально стандартных burst-static-cache RAM и один tag RAM.

Дизайн SEC картриджа наделял важными преимуществами. PGA-компоновка Pentium

Pro требовала 387 контактов, в то время как SEC-картридж - только 242.

Уменьшение на треть числа контактов произошло благодаря наличию в картридже

дискретных элементов, таких как замыкающие резисторы и конденсаторы. Эти

элементы обеспечивают расщепление сигналов, что значит намного меньшее

число требуемых разъемов питания. Разъем SEC-картриджа использует так

называемый Slot 1 и воспринимается как принимающий эстафету у уходящего

Socket 7.

Третье изменение - в большем синтезе, так как Pentium II объединяет

Dual Independent Bus (DIB) от Pentium Pro c технологией MMX от Pentium MMX,

формируя новый вид - гибрид Pentium Pro/MMX. Таким образом, внешне очень

отличный от предыдущих интеловских процессоров, Pentium II внутренне являет

собой смесь новых технологий и улучшений старых чипов.

И наконец, в отличие от Pentium Pro, работающего на 3.3v, Pentium II

питается от 2.8v, позволяя Intel пускать его на больших частотах без

чрезмерного увеличения требование к мощности. В то время, как 200MHz

Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz Pentium II с 512kb

кэша сжигает 37.0 ватт.

Подобно Pentium Pro, Pentium II применяет интеловскую Технологию

Динамического Исполнения. Когда программная инструкция считывается в

процессор и декодируется, она попадает в исполняемый пул. Технология

Динамического Исполнения принимает три основных подхода к оптимизации

способа обращения процессора с кодом. Множественные Предсказания Ветвлений

проверяют программный поток вдоль нескольких ветвей и предсказывают, где в

памяти находится следующая инструкция.

Когда процессор читает, он также проверяет следующие инструкции в

потоке, ускоряя в результате рабочее течение. Анализ Потока Данных

оптимизирует последовательность, в которой инструкции будут выполняться,

проверяя декодированные инструкции и определяя, готовы ли они для обработки

или зависят от других инструкций. Спекулятивное Выполнение увеличивает

скорость таких инструкций просмотром вперед от текущей инструкции и

обработкой дальнейших инструкций, которые вероятно могут понадобится. Эти

результаты хранятся как спекулятивные до тех пор, пока процессор не

определит, какие ему нужны, а какие - нет. С этой точки инструкция

возвращается в нормальную очередь и добавляется к потоку.

У Технологии Динамического Исполнения есть два основных преимущества:

Инструкции обрабатываются быстрее и эффективнее, чем обычно, и, в отличие

от CPU с применением RISC архитектуры, программы не надо перекомпилировать

для извлечения выгод процессора. Процессор все делает на лету.

Значительной новой особенностью является удаление вторичного кэша из

собственно процессора на отдельную кремниевую пластину в картридже.

Процессор читает и пишет данные в кэше используя специализированную

высокоскоростную шину. Называемая задней (backside) шиной, она отделена от

системной шины процессор-память (сейчас называемой передней (frontside)

шиной). Процессор может использовать обе шины одновременно, но архитектура

двойной независимой шины имеет другие преимущества.

Хотя шина между процессором и кэшем второго уровня работает

медленнее, чем на обычном Pentium Pro (на половине скорости процессора),

она чрезвычайно масштабируема. Чем быстрее процессор, тем быстрее кэш,

независимо от 66MHz передней шины. Вдобавок, передняя шина может быть

увеличена с 66 до 100MHz без влияния на шину кэша второго уровня. Также

очевидно, что наличие памяти на одном кристалле с процессором негативно

сказывается на проценте выхода годных 512kb Pentium Pro, сохраняя высокими

цены.

Pentium II опирается на GTL+ (gunning-transceiver-logic) логику хост-шины,

допускающую естественную поддержку двух процессоров. Во время выхода это

обеспечивало стоимостно эффективное минималистское двухпроцессорное

решение, допускаемое симметричной мультипроцессорностью (SMP).

Двухпроцессорное ограничение налагалось не самим Pentium II, а поддержкой

чипсета. Изначальное ограничение чипсета двухпроцессорной конфигурацией

позволяло Intel и поставщикам рабочих станций предлагать двухпроцессорные

системы как временное и экономичное решение, что по другому и не было

возможно. Это ограничение было снято с середины 1998 года с выходом чипсета

450NX, поддерживающего от одного до четырех процессоров. Чипсет 440FX,

содержащий чипы PMC и DBX, не допускал чередования (interleaving) памяти,

но поддерживал EDO DRAM, позволяя улучшать производительность памяти

уменьшением ожидания.

Когда Intel проектировал Pentium II, он также взялся за слабую 16-

битную производительность его предшественника. Pentium Pro роскошно

работает с полностью 32-битным обеспечением, таким как Windows NT, но

опускается ниже стандартного Pentium'а, обрабатывая 16-битный код. Это

влечет худшую чем Pentium производительность под Windows 95, большие части

которой пока 16-битны. Intel решил эту проблему использованием пентиумного

кэша с дескрипторами сегментов в Pentium II.

Как и Pentium Pro, Pentium II чрезвычайно быстр в арифметике плавающей

точки. В сочетании с Accelerated Graphics Port (AGP) это делает Pentium II

мощным решением для высокопроизводительной 3D графики.

7.2 Deschutes

333MHz воплощение Pentium II под кодовым названием Deschutes (по реке,

текущей в Орегоне), было анонсировано в начале 1998 года с планируемыми в

течение года 400MHz и выше. Имя Deschutes в действительности относится к

двум разным линиям CPU.

Версия для Slot 1 - ничего более, чем слегка эволюционировавший Pentium II.

Архитектура и физический дизайн идентичны, за исключением того, что

Deschutes Slot 1 частью сделан с использованием 0.25-микронной технологии,

введенной осенью 1997 года с ноутбучным процессором Tillamook, по сравнению

с 233-300MHz версиями, выполненными по 0.35-микронному процессу. Применение

0.25-микрон означает, что транзисторы на матрице физически ближе между

собой и CPU потребляет меньше энергии, а следовательно рассеивает меньше

тепла на данной частоте, позволяя ядру тикать на больших частотах.

Все иное у Slot 1 Deschutes идентично обычному Pentium II.

Смонтированный на основание и заключенный в SEC картридж, он поддерживает

набор инструкций MMX и общается с 512kb вторичного кэша на половинной

частоте ядра. Он имеет тот же конечный коннектор, и работает на тех же

системных платах с теми же чипсетами. Как таковой он работает с 440FX или

440LX на внешней частоте 66MHz.

С весны 1998 года большой шаг в производительности пришел со следующим

воплощением Deschutes, когда вышел новый чипсет 440BX, допускающий 100MHz

передачу по системной шине, уменьшая закупоривание данных и поддерживая

частоты от 350 до 400MHz.

Другой процессор, зовущийся Deschutes, относится к Slot 2, выпущен с

середины 1998 года как Pentium II Xeon. Intel разбил Slot 1 и Slot 2

Deschutes на взаимодополняющие товарные линии, где Slot 1 предназначен для

массового производства, а Slot 2 нацелен на high-end серверы и туда, где

цена вторична по отношению к производительности.

7.3 Мобильный Pentium II

Естественное продвижение маломощного (в смысле энерго

потребления/рассеивания) семейства Pentium II Deschutes на рынок

портативных PC осуществилось с выпуском линейки мобильных Pentium II в

апреле 1998 года. Новый процессор и его компаньон мобильный 440BX чипсет,

изначально были доступны в 233 и 266MHz вариантах, скомпонованные в

существующий мобильный модуль (MMO) или новый мини-картридж формат. Intel

ожидает к концу 1998 года более половины из снаряженных его мобильными

процессорами PC будут уже Pentium II, а срок мобильных Pentium II Tillamook

окончится к середине 1999 года.

7.4 Celeron

В попытке лучшего удовлетворения сектора дешевых PC, до настоящего

времени вотчины производителей клонов, AMD и Cyrix, продолжающих развивать

унаследованную архитектуру Socket 7, Intel выпустил свой ряд процессоров

Celeron в апреле 1998 года.

Основанный на той же P6 архитектуре, что и Pentium II, и используя тот же

0.25-микронный процесс, Celeron-системы предлагают полный комплект

последних технологий, включая поддержку AGP графики, ATA-33 жестких дисков,

SDRAM и ACPI. Celeron будет работать на любом интеловском Pentium II

чипсете, поддерживающим 66MHz системной шины, включая 440LX, 440BX и новый

440EX, специально спроектированный для рынка 'базовых' PC. В отличие от

Pentium II с его SEC картриджем, Celeron не имеет защитного пластикого

покрытия вокруг карт процессора, что Intel называет Single Edge Processor

Package (SEPP). Он полностью совместим со Slot1, что позволяет использовать

существующие платы, но механизм крепления для карты CPU не адаптирован для

форм фактора SEPP.

Первые 266 и 300MHz Celeron'ы без кэша второго уровня встретили мало

энтузиазма на рынке, не неся или неся мало преимуществ над системами-

клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeron семейством

процессором, названных Mendocino. Снабженный 128kb вторичного кэа на

матрице, работающего на полной частоте процессора, и соединяясь через

внешнюю 66MHz шину, новый Celeron стал намного более живым, чем его вялый

предшественник. Отчасти путано, две доступные версии получили названия

Celeron 333 и 300a. Первый является основной версией, совместимый с

существующей интеловской архитектурой, в то время как второй патентует Pin

370 socket, отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end

машины.

7.5 Pentium “Xeon”

C начала июля 1998 года по всему миру проходила серия мероприятий,

посвящённых представлению самого мощного процессора архитектуры х86

корпорации Intel. Задолго до этого из информации, размещённой на Web-сайтах

Intel стало известно его название и назначение. Особо подчёркивалось, что

слово Xeon нежно произносить как «Зеон», но российское представительство

приняло решение подчинить это название нормам русского (и греческого)

языка. Так что в России мы будем иметь дело с «Ксеоном»,- ведь есть же у

нас Ван Клиберн и Мехико.

Новый процессор, к слову, стал подарком компании-производителя самой

себе по случаю тридцатилетия.

Первое, что бросается в глаза, - необычно крупный размер процессорного

картриджа в который «пакуется» Xeon. Он предназначен для установки в

разъём новой конструкции Slot 2. По словам разработчиков, это связанно с

увеличением ёмкости кэш-памяти второго уровня. В настоящий момент

процессоры Xeon с единой тактовой частотой поставляются в двух вариантах: с

512 Кбайт и 1 Мбайт КЭШа L2. Но уже в текущем году планируется довести

ёмкость кэш-памяти второго уровня до 2 Мбайт и повысить тактовую частоту до

450 МГц. Напомню, что старый Pentium II комплектовался лишь 512 Кбайт.

Но ещё больший интерес вызывает тот факт, что конструкторы смогли

«заставить» L2-кэш работать на тактовой частоте процессорного ядра.

Напомню, что та же концепция была реализована в Pentium Pro, но при этом

разработчики «столкнулись» на стадии производства (процент выхода двух

качественных кристаллов оказался ниже предполагаемого), и процессор

оказался довольно дорогим. Возможно, именно поэтому Pentium II изначально

создавался с «разделением» кристаллов (основного и КЭШа L2), за что

пришлось расплачиваться «половиной» тактовой частоты кэш-памяти второго

уровня.

Высокая частота работы КЭШа спровоцировала увеличение теплоотдачи

процессорного блока, поэтому потребовалось использование массивной

поглощающей тепло пластины, что, в свою очередь, привело к увеличению веса

и габаритов модуля.

В каждом модуле Slot 2 три специальных области данных: доступная только

для чтения, область для чтения/записи и динамическая информация о

температуре внутри процессорного модуля. В области первого типа помещена

информация о версии процессора, данные о пошаговой отладке и указана

предельно допустимая температура. Во второю область памяти пользователи

могут вводить свою информацию.

Доступ к динамическим данным об изменении температуры даёт возможность

управляющим программам оповещать администратора об

опасных системных событиях.

Увеличение ёмкости КЭШа второго уровня повышает пропускную способность

системы благодаря мгновенному доступу процессоров к часто используемым

данным и инструкциям, хранящимся в быстрой кэш-памяти. По заявлению Intel,

увеличение ёмкости КЭШа с 512 Кбайт до 1 Мбайт приводит иногда к 20% росту

общей производительности системы.

Для объяснения этого явления уместно провести аналогию с холодильниками,

используемую Intel: хранение запаса продуктов в

холодильнике избавляет поваров ресторана от необходимости ездить по

магазинам, закупая провизию. Чем больше холодильник, тем лучше,

особенно в час пик, когда количество клиентов в ресторане резко возрастает.

Так вот, в случае с сервером «холодильник» - это кэш-память второго уровня,

а «магазин» (где доступны те же продукты) - в принципе более медленная

системная память.

Большой кэш L2 значительно повышает общую производительность

многопроцессорных конфигураций в системах, работающих с крупными массивами

несопоставимых данных. По информации Intel, проведённые корпорацией тесты

ZD ServerBench показали почти

пропорциональный рост производительности системы по мере установки

дополнительных процессоров с мегабайтным КЭШем.

Усовершенствованная архитектура Xeon, допускающая 36-разрядную

адресацию физической памяти, теоретически позволяет процессору получать

доступ к системной памяти ёмкостью до 64 Гбайт. Новый механизм

постраничного обмена Page Size Extension - 36 останется практически

незаметной для глаз пользователя и разработчиков приложений. В настоящее

время PSE-36 поддерживают операционные системы Windows NT, SCO UnixWare и

Sun Solaris. Для остальных операционных систем потребуется обновить драйвер

блока управления памятью.

Intel 450NX PCIset стал первым микросхемным набором, оптимизированным

для Pentium II Xeon. Он выпускается в двух вариантах, Basic и Full,

соответственно для серверных hi-end и систем среднего уровня. Они имеют

одинаковую структуру ядра, но отличаются производительностью и ценой.

Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один - 64-

разрядной и до 4 Гбайт системной памяти типа EDO. Его более

совершенный «родственник» Full PCIset поддерживает до четырёх слотов типа

EDO. Эти чипсеты объединяет функционирование на

100-мегагерцовой частоте системной шины и возможность поддержки

многопроцессорных (до четырёх Xeon) конфигураций. 64-разрядная

шина PCI способна существенным образом повысить общую производительность

системы с учётом оптоволоконной технологии обмена данными с дисковыми

массивами, использования высокопроизводительных сетевых магистралей на

основе АТМ, Gigabit Ethernet и других. Повышается, по сути, синхронизация

мощности процессора и производительности подсистемы ввода-вывода.

Xeon, как я уже отмечал, предназначен не только для серверов, но и для

рабочих и графических станций, для которых одним из важнейших

параметров является производительность видеоподсистемы. Для них разработан

чипсет Intel 440GX AGPset на базе известного микросхемного набора 440BX.

440GX управляет работой порта AGP в режиме 2х. Режим удвоенной

производительности реализуется благодаря так называемой технологии двойной

накачки - данные передаются как по переднему, так и по заднему фронтам

тактовых импульсов (у обычной AGP - только по переднему), при этом полоса

пропускания достигает значения 533 Мбайт/с. Физические параметры интерфейса

AGP остаются прежними.

Ещё одой особенностью набора чипсета 440GX стала возможность обращения

к памяти ёмкостью до 2 Гбайт, что в два раза больше, чем у

его приемника.

Несмотря на тот факт, что в настоящий момент понятие

многопроцессорности ассоциируется у Intel лишь с четырьмя устройствами на

одной плате, ведутся работы по созданию симметричных мультипроцессорных

систем, поддерживающих до восьми «Ксеонов». Разработки восьмиканального

чипсета для Xeon ведутся фирмой Corollary, дочерней компанией Intel. И,

само собой, возможны кластерные решения, скажем, на основе архитектуры

распределённой памяти (NUMA). В обоих случаях, как правило, не требуется

«переписывать» прикладные программы (правда, операционная система требует

некоторой оптимизации). В процессорной шине чипсета Intel 450NX PCIset

предусмотрен так называемый разъём кластерного соединения, что упрощает

построение кластерного соединения на основе стандартных четырёхпроцессорных

узлов.

Ещё одним перспективным направлением является кластер с передачей

сообщений. Суть её состоит в отсутствии разделения ресурсов. Отдельно

стоящие узлы кластера обмениваются данными, например, тактовыми импульсами,

сигнализирующими о нормальном состоянии системы. И хотя LAN-соединение

остаётся работоспособным, существует необходимость в сети нового типа - так

называемой SAN (System area Network).

В завершении хотел бы отметить, что некоторые ведущие западные

производители (IBM, NCR, Dell) уже начали поставки систем на базе

Xeon, а на презентации процессора в России компании Kraftway и «Вист» также

представили свои новые серверные решения.

Ориентировочные цены на Pentium Xeon составят 1124 долларов (L2 512

Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.

Список литературы:

Д-р Джон Гудмен "Управление памятью для всех",

Диалектика, Киев, 1996

В.Л. Григорьев "Микропроцессор i486. Архитектура и

программирование", Гранал, Москва, 1993.

Информационно - рекламная газета "КМ - информ"

газета "Компьютер World/Киев"

газета "Компьютер Week/Moscow"

Ж.К. Голенкова и др. "Руководство по архитектуре IBM PC AT",

Консул, Минск, 1993

Руководство программиста по процессору Intel i386,

Техническая документация уровня 2, (C) Intel Corp.

Руководство программиста по процессору Intel i486,

Техническая документация уровня 2, (C) Intel Corp.

Материалы эхоконференции SU.HARDW.PC.CPU компьютерной сети

FidoNet

Страницы: 1, 2, 3, 4


© 2010 БИБЛИОТЕКА РЕФЕРАТЫ