Log-Log Grafikler & Yetersizlik
Hız, 50 yıl boyunca eksponansiyel büyüme izledi. Log hız vs lineer zaman (logaritma-hız) koordinatlarında, bu, S_max = büyüme hızı order bazında yılda bir olan bir doğru olarak görünür.
Fiziksel sınırlar, S_max = moleküler boyut, ışık hızı ve ısı kısıtlamaları tarafından belirlenen maksimum hızda bir dikey tavan oluşturur. Eksponansiyel, S_max'e yaklaşırken, büyüme yavaşlamalıdır.
Lojistik Yetersizlik
Sınırsız büyüme için yaygın bir model:
S(t) = S_max / (1 + e^(−r(t − t₀)))
Bu, teknoloji için lojistik denklemidir. Erken zamanlarda (t << t₀): S(t) ≈ S_max × e^(r(t−t₀)) - saf eksponansiyel. Tavanın yakınında (t >> t₀): S(t) → S_max asimetrik olarak.
Geometri: logaritma-lineer koordinatlarda doğru, tavanın yakınında bükülür ve lineer-lineer koordinatlarda S şeklinde görünür.
Büyümenin Nerede Yetersizleştiği?
Tek işlemci hızı, 1940'dan başlayarak 10^(0.09t) olarak büyür. Fiziksel tavan: S_max = 10^(12) ops/sec (tek çekirdekli işlemci için bir tahmin, ısı ve ışık hızı kısıtlamalarına göre).
Maksimum İletişim Yarıçapları
Bir işlemcinin saat hızı, bir döngü içinde iletişim kurabileceği en büyük yarıçapı belirler. İletişim hatları yaklaşık olarak 2×10⁸ m/s hızında demirden geçer.
Bir saat dönemini T (saniye) olarak belirtin, maksimum bir yönlü iletişim yarıçapı:
r_max = v × T / 2
döngü için bölün: sinyal T içinde çıkıp geri gelmelidir
Saat hızı arttıkça T azalır, bu yüzden r_max küçülür. Bu geometrik kısıtlama, bileşenlerin daha yakın gruplara toplanmasını (çip alanı azalır) veya off-chip iletişim için çok döngüsel gecikme kabul etmesini zorlar.
Etki Alanı Küresi
Bir işlemcinin tüm bir döngü içinde ulaşabileceği bileşenler, işlemcinin merkezinde bulunan r_max yarıçapındaki küreyi oluşturur. Hacim: V = (4/3)π r_max³.
Eğer bileşen yoğunluğu ρ (bileşenler/m³) ise, bir döngü içinde ulaşılabilir bileşenler sayısı: N = ρ × V = ρ × (4/3)π r_max³.
r_max, saat hızında artarken N kübik olarak azalır - bir saat hızında artış, ulaşılabilir bileşen sayısını (1/2)³ = 1/8 oranında küçültür.
Bir Döngü İçinde Ulaşılan Bileşenler
1993 yılına tarihlenen bir iş istasyonu 100 MHz (T = 10 ns) hızında çalışır. Sinyal hızı = 2×10⁸ m/s. Devre kartında bileşen yoğunluğu yaklaşık 10⁸ bileşen/m³ (çipler, dirençler, kondansatörler dahil olmak üzere yaklaşık tahmin).
Bir modern GPU 2 GHz (T = 0.5 ns) hızında çalışır.
Paralel Hızlandirma Sınırı
Bir işlemci hızı fiziksel tavanlara yaklaşır. Endüstri yanıtıs: paralel mimariler. Amdahl'ın Kanununun paralellikten elde edilebilecek hızlandirma miktarını ölçmesi.
Amdahl'ın Kanunu
Bir programın bir kısmını paralel hale getirebilecek bir yüzde f olsun ve yüzde (1−f) seri olarak çalışmak zorunda kalacak. p işlemci ile:
Hızlandirma(p) = 1 / ((1−f) + f/p)
p → ∞: Hızlandirma_max = 1 / (1−f)
Seri kısımlı (1−f) elde edilebilecek hızlandirma miktarını belirleyen bir sert tavan oluşturur, ne kadar fazla işlemci eklerseniz eklesin.
Dikdörtgen bakış açısı: Hızlandirma, p'ye göre hiperbolik bir eğri izler. Asimptota 1/(1−f) vardır. f = 0.9 için maksimum hızlandirma 10, sınırsız işlemci ile. f = 0.99 için maksimum hızlandirma 100.
Hamming'in ima ettiği ders: paralel mimarilere olan ilgi gerçekti, fakat işleme maliyeti paralelizasyonun ne kadar mümkün olduğu tamamen - bu gerçeği birçok paralel bilgisayar optimisti göz ardı etti.
Paralel Hızlandirma Hesaplama
Bir bilimsel simülasyon, bir işlemci üzerinde 1000 saniye sürer. Profillemenin ortaya çıkardığı: 200 saniye seri başlatma aşamasında (paralelize edilemez); 800 saniye paralel hesaplanma aşamasında.