un

guest
1 / ?
back to lessons

Log-Log Grafikler & Yetersizlik

Hız, 50 yıl boyunca eksponansiyel büyüme izledi. Log hız vs lineer zaman (logaritma-hız) koordinatlarında, bu, S_max = büyüme hızı order bazında yılda bir olan bir doğru olarak görünür.

Fiziksel sınırlar, S_max = moleküler boyut, ışık hızı ve ısı kısıtlamaları tarafından belirlenen maksimum hızda bir dikey tavan oluşturur. Eksponansiyel, S_max'e yaklaşırken, büyüme yavaşlamalıdır.

Lojistik Yetersizlik

Sınırsız büyüme için yaygın bir model:

S(t) = S_max / (1 + e^(−r(t − t₀)))

Bu, teknoloji için lojistik denklemidir. Erken zamanlarda (t << t₀): S(t) ≈ S_max × e^(r(t−t₀)) - saf eksponansiyel. Tavanın yakınında (t >> t₀): S(t) → S_max asimetrik olarak.

Geometri: logaritma-lineer koordinatlarda doğru, tavanın yakınında bükülür ve lineer-lineer koordinatlarda S şeklinde görünür.

Bilgisayar Donanımı Geometrisi: Amdahl'ın Yasası & Işık Hızı Toplu

Büyümenin Nerede Yetersizleştiği?

Tek işlemci hızı, 1940'dan başlayarak 10^(0.09t) olarak büyür. Fiziksel tavan: S_max = 10^(12) ops/sec (tek çekirdekli işlemci için bir tahmin, ısı ve ışık hızı kısıtlamalarına göre).

S(t) = 10^(0.09·t) (t = yıllar, 1940'dan başlayarak), S(t) 10¹⁰'a (tavan yaklaşımı) ulaşan yılını bulun. İşlemi gösterin. Ardından, 1952 (IBM 701) ve o tavan yılı arasındaki hız katlanmalarını hesaplayın. Katlanma süresini, b = 0.09 × ln(10) olan doubling time = ln(2)/b kullanın.

Maksimum İletişim Yarıçapları

Bir işlemcinin saat hızı, bir döngü içinde iletişim kurabileceği en büyük yarıçapı belirler. İletişim hatları yaklaşık olarak 2×10⁸ m/s hızında demirden geçer.

Bir saat dönemini T (saniye) olarak belirtin, maksimum bir yönlü iletişim yarıçapı:

r_max = v × T / 2

döngü için bölün: sinyal T içinde çıkıp geri gelmelidir

Saat hızı arttıkça T azalır, bu yüzden r_max küçülür. Bu geometrik kısıtlama, bileşenlerin daha yakın gruplara toplanmasını (çip alanı azalır) veya off-chip iletişim için çok döngüsel gecikme kabul etmesini zorlar.

Etki Alanı Küresi

Bir işlemcinin tüm bir döngü içinde ulaşabileceği bileşenler, işlemcinin merkezinde bulunan r_max yarıçapındaki küreyi oluşturur. Hacim: V = (4/3)π r_max³.

Eğer bileşen yoğunluğu ρ (bileşenler/m³) ise, bir döngü içinde ulaşılabilir bileşenler sayısı: N = ρ × V = ρ × (4/3)π r_max³.

r_max, saat hızında artarken N kübik olarak azalır - bir saat hızında artış, ulaşılabilir bileşen sayısını (1/2)³ = 1/8 oranında küçültür.

Bir Döngü İçinde Ulaşılan Bileşenler

1993 yılına tarihlenen bir iş istasyonu 100 MHz (T = 10 ns) hızında çalışır. Sinyal hızı = 2×10⁸ m/s. Devre kartında bileşen yoğunluğu yaklaşık 10⁸ bileşen/m³ (çipler, dirençler, kondansatörler dahil olmak üzere yaklaşık tahmin).

Bir modern GPU 2 GHz (T = 0.5 ns) hızında çalışır.

100 MHz iş istasyonu için (T=10 ns, v=2×10⁸ m/s, ρ=10⁸/m³): r_max hesaplayın, sonra V = (4/3)π r_max³, sonra N = ρ × V. Ardından, 2 GHz işlemci için aynı N'yi hesaplayın (aynı ρ, aynı v). N(100MHz) / N(2GHz) nedir?

Paralel Hızlandirma Sınırı

Bir işlemci hızı fiziksel tavanlara yaklaşır. Endüstri yanıtıs: paralel mimariler. Amdahl'ın Kanununun paralellikten elde edilebilecek hızlandirma miktarını ölçmesi.

Amdahl'ın Kanunu

Bir programın bir kısmını paralel hale getirebilecek bir yüzde f olsun ve yüzde (1−f) seri olarak çalışmak zorunda kalacak. p işlemci ile:

Hızlandirma(p) = 1 / ((1−f) + f/p)

p → ∞: Hızlandirma_max = 1 / (1−f)

Seri kısımlı (1−f) elde edilebilecek hızlandirma miktarını belirleyen bir sert tavan oluşturur, ne kadar fazla işlemci eklerseniz eklesin.

Dikdörtgen bakış açısı: Hızlandirma, p'ye göre hiperbolik bir eğri izler. Asimptota 1/(1−f) vardır. f = 0.9 için maksimum hızlandirma 10, sınırsız işlemci ile. f = 0.99 için maksimum hızlandirma 100.

Hamming'in ima ettiği ders: paralel mimarilere olan ilgi gerçekti, fakat işleme maliyeti paralelizasyonun ne kadar mümkün olduğu tamamen - bu gerçeği birçok paralel bilgisayar optimisti göz ardı etti.

Paralel Hızlandirma Hesaplama

Bir bilimsel simülasyon, bir işlemci üzerinde 1000 saniye sürer. Profillemenin ortaya çıkardığı: 200 saniye seri başlatma aşamasında (paralelize edilemez); 800 saniye paralel hesaplanma aşamasında.

Paralel kısımlı oranı f'yi hesaplayın. Amdahl'ın Kanununu kullanarak Speedup(4), Speedup(16), Speedup(∞) hesaplayın. Her formül uygulamasını gösterin. Ardından yorumlayınız: 16'dan ∞'ye kadar işlemci ekleme, donanım maliyetine değer mi? Dikdörtgenin geometrisi, azalan getiri hakkında ne söyler?