НОТЕ: Этот ответ был написан 8 лет назад. С тех пор параллельное программирование стало более актуальным. Скорее всего, это связано с присущими ему ограничениями тактовой частоты и быстро приближающимися ограничениями на размер транзистора.
Ваша основная проблема - это программное обеспечение, не написанное для многоядерных систем.
Посмотрите на отличную статью Джеффа Атвуда о Выбор двойного или четырехъядерного ядра .
для большинства программ, после двух ядер вы попадаете в точку снижения доходности очень быстро. В Quad-Core Desktops and Diminishing Returns , я спросил, насколько эффективно сегодняшнее программное обеспечение может действительно использовать даже четыре ядра процессора, и тем более неизбежные восемь и шестнадцать ядер процессора, которые мы увидим через несколько лет.
Ответ здесь (выделенная часть скопирована из статьи Джеффа),
Однако здесь были некоторые сюрпризы, такие как Excel 2007, и настройка “одновременных операций” на Потерянной планете. Вполне возможно, что программная инженерия в конце концов перейдет к тому, что тактовая частота имеет меньшее значение, чем параллелизм. Или, в конце концов, это может оказаться несущественным, если мы не сможем сделать выбор между более высокой тактовой частотой и большим количеством ядер процессора. Но в то же время, тактовая скорость выигрывает большую часть времени. Больше ядер процессора автоматически не лучше. Типичные пользователи будут лучше с самым быстрым двухъядерным процессором, который они могут себе позволить. 0x2 и 0x2 и * * * 0x2 и 0x2 и Проблема [ Шрифт-сторона шины ]0x3 и (этот термин всегда меня развлекал). С Нехалемом все меняется … как сказала ArsTechnica в прошлом году.
Закон Мура поставил дизайнеров процессоров в неловкое положение с транзисторными богатствами, и нигде это не проявляется так явно, как в 45-нм процессоре Intel Nehalem. Дебютируя в 4- и 8-ядерных вариантах позже в этом году, Nehalem упаковывает тонну оборудования в один процессорный сокет. (Ранние цифры показывают, что количество транзисторов четырехъядерного Nehalem составляет 781 миллион; для 8-ядерной модели пока не появилось ни одной цифры). Но пытаться подпитывать всё это аппаратное обеспечение существующей архитектурой фронтальной шины платформы Intel было бы глупостью. Так что, что не менее важно, Nehalem также звучит как давно назревший смертельный удар для гериатрической архитектуры фронтальной шины Intel.
Радикальное изменение ситуации с пропускной способностью системы Intel, которую представляет новая QuickPath Interconnect (QPI), является, пожалуй, самым большим единичным фактором, который сформировал дизайн компании Nehalem. Между QuickPath и встроенным контроллером памяти Nehalem процессор Nehalem будет иметь доступ к беспрецедентному объему совокупной пропускной способности, особенно в двух- и четырехсокетной реализации.
AMD перенесли контроллер памяти в процессор ранее и использовали Hypertransport.