English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

konuk
1 / ?
derslere geri dön

Shannon'ın Bilgiyi Nasıl Adlandırdığı

Shannon, sürprizliği ölçerek bilgiyi tanımladı. p olasılığına sahip bir mesaj şunu taşır:

I = −log₂(p) bit

Kesin bir olay (p = 1) 0 bit taşır — sürpriz yok, bilgi yok. Nadir bir olay (p = 1/1024) 10 bit taşır.

Hamming hemen sorunu işaret ediyor: bu bir niceliği ölçmek için bir formüldür, kavramın tanımı değildir. Makinesel sürprizi ölçer, insan anlamını değil. Bir sorunun cevabını zaten bilen bir öğrenci, cevapta 0 bit alır — cevabın diğerleri için ne kadar önemli olduğundan bağımsız olarak.

Formül telefon sistemlerine, radyoya, bilgisayarlara iyi uygulanır. İnsan iletişimine, biyolojiye veya anlama kötü uygulanır. Hamming'in tercih ettiği ad: 'İletişim Teorisi', 'Bilgi Teorisi' değil.

Entropi

p₁, p₂, ..., p_q olasılıklarına sahip q sembolün alfabesi için, sembol başına ortalama bilgi entropidir:

H = −Σᵢ pᵢ log₂(pᵢ)

H tüm olasılıklar eşit olduğunda maksimuma ulaşır: H_max = log₂(q) bit. Herhangi bir homojen olmayan dağılım daha düşük entropiye sahiptir.

Entropiyi Hesaplama

İkili entropi: iki sembolü olan bir kaynak, P(0) = p, P(1) = 1−p.

H(p) = −p log₂(p) − (1−p) log₂(1−p)

H(p) p = 0 veya p = 1 konumunda 0'dır (tamamen tahmin edilebilir). H(p) p = 0.5 konumunda 1 bittir (tamamen tahmin edilemez).

İkili Entropi & Kanal Kapasitesi

p = 0.25 için H(p) hesaplayın. Formülü sayılarla değiştirilmiş şekilde gösterin, her iki terimi değerlendirin ve sonucu bit cinsinden belirtin. Sonra yorumlayın: H(0.25) < H(0.5) size adil bir yazı tura atışına karşı önyargılı bir yazı tura atışının bilgi içeriği hakkında ne söyler?

Gibbs Eşitsizliği & Gürültüsüz Kodlama

Gibbs eşitsizliği: herhangi iki olasılık dağılımı p = {pᵢ} ve q = {qᵢ} için:

−Σ pᵢ log₂(pᵢ) ≤ −Σ pᵢ log₂(qᵢ)

eşitlik ancak p = q olduğunda geçerlidir. Bu, tüm x > 0 için ln(x) ≤ x − 1 gerçeğine dayanır, eşitlik x = 1 konumundadır.

Sonuç: entropi H(p) tüm semboller eşit olasılıkta olduğunda maksimize edilir. q sembol için: H_max = log₂(q).

Gürültüsüz kodlama teoremi: benzersiz olarak decodlanabilir bir kod verildiğinde, Kraft eşitsizliği Σ 2^(−lᵢ) ≤ 1 gerektirir; burada lᵢ sembol i için kodun uzunluğudur. Gibbs eşitsizliği ile, ortalama kod uzunluğu L = Σ pᵢ lᵢ şunu sağlar:

L ≥ H(p) = −Σ pᵢ log₂(pᵢ)

Entropiye kıyasla daha iyi yapamayız. Huffman kodlaması L < H + 1 elde eder.

Gibbs eşitsizliği H(p) ≤ −Σ pᵢ log₂(qᵢ) herhangi bir dağılım q için der. q homojen dağılım olduğunda qᵢ = 1/q tüm i için, sağ taraf log₂(q)'ye basitleşir. Bu basitleştirmeyi cebirsel olarak gösterin, sonra bunu bir q-sembolün alfabesinin maksimum entropisi hakkında ne anlama geldiğini belirtin.

Kanal Kapasitesi

İkili simetrik kanal (BSC), her biti bağımsız olarak Q = 1 − P hata olasılığı ile çevirir. BSC'nin kapasitesi — maksimum güvenilir bilgi hızı — şudur:

C = 1 + P log₂(P) + Q log₂(Q) = 1 − H(Q)

burada H(Q) = −Q log₂(Q) − (1−Q) log₂(1−Q) hata oranının ikili entropisidir.

Q = 0 (hata yok) konumunda: C = 1 bit/iletim (mükemmel kanal). Q = 0.5 (rastgele çevirme) konumunda: C = 0 (kanal bilgi taşımaz). Q = 1 (tüm bitler çevrilir) konumunda: C = 1 (gönderenin ne gönderdiğini tam olarak bilirsiniz, sadece her şeyi geri çevirin).

C, R'nin maksimum hızını ölçer; burada keyfi olarak küçük hata olasılığı ile iletebilirsiniz. R < C ise, bu tür kodlar vardır. R > C ise, yoktur — hiçbir kod kapasiteyi yenemez.

Entropi & Kanal Kapasitesi

Kanal Kapasitesini Hesaplama

P = 0.9 ile (%10 hata oranı, Q = 0.1):

C = 1 + 0.9 log₂(0.9) + 0.1 log₂(0.1)

log₂(0.9) ≈ −0.152, log₂(0.1) ≈ −3.322

C ≈ 1 + 0.9×(−0.152) + 0.1×(−3.322) = 1 − 0.137 − 0.332 ≈ 0.531 bit/iletim

İkili simetrik kanal hata olasılığı Q = 0.2 (P = 0.8) ile var. Kanal kapasitesini C = 1 + P log₂(P) + Q log₂(Q) hesaplayın. log₂(0.8) ≈ −0.322 ve log₂(0.2) ≈ −2.322 kullanın. Değiştiricinizi ve aritmetiğinizi gösterin, sonra yorumlayın: bu kapasitede, ham bit oranının hangi kısmı gerçek bilgi taşıyabilir?

Teorem Neyi Kanıtlar

Shannon'ın temel teoremi: herhangi bir R < C hızı için, blok uzunluğu n (n → ∞ ile) olan kodlar vardır ve P_E → 0 hata olasılığı elde eder.

Kanıt şaşırtıcı bir argüman kullanır: rastgele kodlar. Belirli bir kod yazmak yerine, Shannon tüm olası rastgele kod kitapları (yazı tura kodlaması) arasında ortalamasını aldı. Tüm kod kitapları arasındaki ortalama hatasının küçük olduğunu gösterdi. Ortalama küçükse, en az biri küçük hata elde eder.

Küre tabanlı analiz: gönderici aᵢ → n-boyutlu ikili uzayda aᵢ etrafında n(Q + ε₂) yarıçaplı küre seçer. Büyük n için, alınan sözcük bⱼ bu küre içinde yüksek olasılıkla yer alır. Alıcı, bⱼ içeren codeword'e kodu çözer.

Dört durum hata olasılığı P_E belirler:

`` aᵢ içinde küre diğer aⱼ küre içinde sonuç evet hayır doğru (hata yok) evet evet muğlak → hata hayır evet yanlış decode → hata hayır hayır tüm küreler dışında → hata ``

Bilgi Geometrisi & Küre Paketlemesi

P_E sınırı şu şekilde çalışır: P_E ≤ d + M × 2^(n × (H(Q+ε₂) − C)) uygun d ve ε₂ seçimi için. H(Q+ε₂) < C olarak ε₂ seçmek üssü negatif yapıyor. Büyük n için, ikinci terim → 0.

Teoremin Varoluşsal Doğası

Hamming, teorimin neyi yaptığını ve yapmadığını tam olarak düşündü.

Kanıtladığı şey: güvenilir iletişim R < C oranında prensipte mümkündür, yeterince büyük n için.

Sağlamadığı şey: açık kod yapısı. Kapasiteye yaklaşmaya yeterince büyük n uzunluğundaki rastgele kod, M × n bit boyutunda bir kod kitabına sahiptir; burada hem M hem de n astronomik olarak büyüktür. Bunu saklayamaz veya onunla hesap yapamazsınız.

Hata düzeltme kodları vs. Shannon: hata düzeltme kodları (Hamming, Reed-Solomon, turbo, LDPC) açık, hesaplanabilir yapılar sağlar. Kapasite ile biraz mesafe için kodlayıcı & çözücü hesaplanabilirliği feda ederler. n büyüdükçe ve blok başına daha fazla hata düzeltilirken, pratik kodlar kapasiteye yakından yaklaşabilir.

Uzay uydusu örneği: Voyager ve Pioneer, milyarlarca mil uzaklıkta 5–20 watt gücüyle iletişim kurmak için güçlü hata düzeltme kodları kullanmıştır. Uzun blok uzunlukları, mesafeden gelen muazzam gürültüye rağmen kapasiteye yakın itme yapmasını sağlayan blok başına daha fazla hata düzeltmeyi mümkün kılmıştır.

Eleştirel Değerlendirme

Hamming, Bölüm 13'ü bilimde tanımlar hakkında daha geniş bir eleştiriyle kapattı. Shannon'ın bilgi formülü makinesel sürprizi ölçer, insan anlamını değil. 'Bilgi Teorisi' adı aşırı vaat eder. Balık ağı analojisi: ağ göz boyutundan daha küçük balık tutamayan balıkçı, daha küçük balık olmadığı sonucuna varır. Aracın sınırlamaları, dünyanın görünür kısıtlamaları haline gelir.

Shannon teoremi, R < C oranında keyfi olarak küçük hata elde eden kodlar vardır, ancak kanıt yapıcı değildir: rastgele kod kitapları üzerinden ortalamasını alarak varlığı gösterir, bir kodu inşa ederek değil. Bunun pratik olarak neden önemli olduğunu kendi sözlerinizle açıklayın ve Shannon'ın varoluş kanıtı ile çalışan bir hata düzeltme kodu arasındaki boşluğun mühendislerin çözmesi gereken şey olduğunu açıklayın.

Tanımlar ile İlgili Problem

Hamming, bilgi teorisini daha geniş bir metodolojik noktayı yapmak için kullandı: ilk tanımlar, çoğu insanın fark ettiğinden daha çok neyi bulduğunuzu belirler.

Shannon 'bilgiyi' sürpriz olarak tanımlamayı seçti. Bu tanım, iletişim mühendisliği için üretken oldu. Fakat belirli bir kapsam — makinesel sistemler — 'bilgi' sözcüğüne ithal etti, bu evrensel uygulanabilirliği ima eder.

Balık ağı analojisi: 6 inçlik ağ göz boyutlu bir ağ sadece büyük balıkları yakalar. Balıkçı şu sonucu verir: minimum balık boyutu 6 inçtir. Sonuç aracı yansıtır, dünyayı değil.

IQ paralel örneği: 'zekayı' ölçmek için tasarlanan bir test, normal dağılım üretmek için ayarlanmış, sonra zekayı tanımlamak için kullanılan. Araç kavramı şekillendirir.

Hamming'in tavsiyesi: tanımla karşılaştığınız zaman, şunu sorun (1) sizin önceki sezginizle ne kadar anlaşıyor? (2) ne kadar bozuyor? (3) ne koşullar altında çerçevelendi? (4) şimdi farklı koşullar altında uygulanıyor mu?

Hamming'in dört soruluk eleştirisini Shannon'ın bilgi tanımına uygulayın. Dört sorunun her biri için, tanım ve sınırları ile uğraştığınızı gösteren belirli bir cevap verin.