English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

khách
1 / ?
trở lại bài học

Branching Factor & Số Nút

Cây trò chơi mô hình hóa mọi chuỗi nước đi có thể từ một vị trí bắt đầu. Mỗi nút biểu thị một trạng thái bàn cờ. Mỗi cạnh biểu thị một nước đi hợp pháp. Cấu trúc cây quyết định xem tìm kiếm có vẫn khả thi hay không.

Các Thông số Chính

Branching factor b: số nước đi hợp pháp có sẵn tại một vị trí điển hình.

Depth d: số ply (nửa nước đi) để tìm kiếm trước.

Số nút ở depth d: b^d

Tổng số nút trên tất cả depths: 1 + b + b² + ... + b^d = (b^(d+1) − 1) / (b − 1)

Đối với b & d lớn, tổng ≈ b^d (được chi phối bởi mức leaf).

Tic-Tac-Toe 4×4×4

Cây trò chơi đầy đủ: b ≈ 64 (ô hợp pháp), d = 64 (tổng nước đi). Số nút đầy đủ ≈ 64^64 ≈ 10^115. Vũ trụ có thể quan sát được chứa khoảng 10^80 nguyên tử. Tìm kiếm brute-force là không thể về mặt vật lý.

Game Tree & Alpha-Beta Pruning

Tính Kích Thước Cây

Chess cung cấp những con số thực tế hơn. Branching factor trung bình b ≈ 35. Tìm kiếm 6-ply (3 nước đi mỗi bên) đòi hỏi khoảng 35^6 nút.

Tính số nút leaf cho một tìm kiếm chess có depth d = 6 plies với branching factor b = 35. Sau đó tính cùng một số cho d = 10 plies. Hiển thị cả hai phép tính một cách rõ ràng.

Alpha-Beta Pruning: Giảm Exponent

Alpha-beta pruning loại bỏ các cây con không thể ảnh hưởng đến kết quả minimax. Công cụ chính là: nếu bạn đã biết một nhánh cho giá trị V, bạn có thể cắt bất kỳ nhánh anh em nào có giá trị chứng minh rơi dưới V (cho người chơi tối đa hóa) hoặc trên V (cho người chơi tối thiểu hóa).

Best-Case Geometry

Dưới sắp xếp nước đi tối ưu (nước đi tốt nhất được tìm kiếm trước), alpha-beta giảm branching factor hiệu dụng từ b thành √b. Depth tìm kiếm tăng gấp đôi cho cùng ngân sách nút:

Tìm kiếm đầy đủ: b^d nút

Alpha-beta best case: b^(d/2) nút

Ví dụ: b=35, d=6. Đầy đủ: 35^6 ≈ 1.84 × 10^9. Alpha-beta: 35^3 = 42,875. Hệ số giảm: ~43,000.

Trong thực tế, sắp xếp nước đi không hoàn hảo. Giảm điển hình: b^(d×0.75) — branching factor hiệu dụng ≈ b^0.75.

Đối với một chess engine có b = 35 & d = 8 plies, tính số nút dưới: (1) tìm kiếm minimax đầy đủ, (2) alpha-beta pruning hoàn hảo (best case). Hệ số giảm là bao nhiêu? Hiển thị tất cả phép tính.

Center-Corner Duality

Hamming chỉ ra một duality hình học trong lập phương 4×4×4: có một inversion gửi 8 vị trí góc đến 8 vị trí trung tâm (lập phương 2×2×2 bên trong) & ngược lại, trong khi vẫn giữ tất cả 76 đường winning.

Đếm Dòng Qua một Vị trí

Trong lập phương 4×4×4, vị trí khác nhau về bao nhiêu đường winning đi qua chúng:

Vị trí góc: 7 dòng mỗi (4 đường chéo mặt, 2 đường cạnh, 1 đường chéo không gian)

Vị trí edge-center: 4 dòng mỗi

Vị trí face-center: 6 dòng mỗi

Vị trí body-center (lập phương 2×2×2 bên trong): 7 dòng mỗi

Duality ánh xạ góc (7 dòng) đến body-centers (7 dòng). Cả hai tập hợp tạo thành 'hot spots.'

Tại sao Hot Spots Quan trọng Hình học

Một người chơi kiểm soát nhiều vị trí high-line-count kiểm soát nhiều đường winning tiềm năng. Đây là một lập luận hình học trực tiếp: tối đa hóa line coverage hướng dẫn chọn nước đi mà không bất kỳ tìm kiếm nào.

Lập phương 4×4×4 có 76 tổng cộng winning lines & 64 vị trí. 8 góc mỗi nằm trên 7 dòng, 8 vị trí body-center mỗi nằm trên 7 dòng, 24 vị trí face-center mỗi nằm trên 6 dòng, & 24 vị trí edge mỗi nằm trên 4 dòng. Xác minh: những số đếm này có cộng lại nhất quán không? Tính tổng số lượng (position, line) incidences từ cả hai bên: bằng cách cộng trên vị trí, & riêng biệt bằng cách đếm 4 endpoints mỗi dòng. Hai tổng có đồng ý không?

Evaluation Functions

Mọi chương trình chơi trò chơi đều cần một evaluation function: một hàm ánh xạ trạng thái bàn cờ thành giá trị số (dương = tốt cho người chơi tối đa hóa, âm = tốt cho người chơi tối thiểu hóa). Evaluation function cung cấp điều kiện biên ở lá của cây tìm kiếm.

Linear Evaluation Functions

Một linear evaluation function gán trọng số w_i cho mỗi feature f_i của vị trí:

E(position) = w_1 × f_1 + w_2 × f_2 + ... + w_n × f_n

Đối với tic-tac-toe 4×4×4: các feature có thể bao gồm dòng mở được kiểm soát, vị trí trong hình vuông high-line-count, forks bị đe dọa. Đối với chess: đếm tài liệu, điều khiển trung tâm, an toàn vua, cấu trúc quân tốt.

Đây là một hàm tuyến tính trong không gian feature — một hyperplane trong ℝ^n. Hai vị trí có cùng giá trị feature nhận được cùng một đánh giá bất kể tất cả các khác biệt khác. Hình học của evaluation function xác định những gì chương trình 'thấy.'

Chương trình checker của Samuel được cải thiện bằng cách điều chỉnh vector trọng số w — gradient descent trong không gian của linear evaluation functions.

Một evaluation function tic-tac-toe 4×4×4 đơn giản sử dụng hai features: (1) f_1 = số dòng mở của bạn (dòng nơi bạn có quân & đối thủ không), (2) f_2 = số dòng mở của đối thủ. Đánh giá: E = w_1 × f_1 − w_2 × f_2. Nếu w_1 = 2 & w_2 = 3, tính E cho một vị trí nơi bạn có 12 dòng mở & đối thủ của bạn có 8. Sau đó: nếu E > 0 có nghĩa là vị trí ủng hộ bạn, kết quả này nói gì về vị trí?

Hình học & Biên giới của Hình thức hóa

Cây trò chơi có một cấu trúc hình học sạch sẽ: tăng trưởng exponential ở depth d, có thể giảm xuống b^(d/2) bằng alpha-beta, tiếp tục có thể giảm bằng cách giới hạn trong các vị trí high-value (hot spots giảm effective b). Evaluation function xác định một hyperplane trong feature space.

Tất cả điều này là sạch sẽ, chính xác, hoàn chỉnh về mặt hình thức. Nó mô tả trung tâm của vấn đề chơi trò chơi — khu vực nơi cấu trúc toán học cung cấp hướng dẫn rõ ràng.

Biên giới — nơi chuyển từ quy tắc áp dụng thành khám phá, khi nào thay đổi lợi thế vị trí cho cơ hội kỹ thuật, cách nhận ra các pattern mới nổi vượt ra ngoài evaluation function — chống lại sự hình thức hóa này. Kiến thức ngầm của Hamming tồn tại ở biên giới đó.

Hình học cho phép bạn tính toán bao nhiêu tìm kiếm bạn có thể chi trả. Nó không cho bạn biết cái gì để tìm kiếm.

Suy ngẫm về hình học được bao gồm trong bài học này. Hình thức trò chơi cây (nút b^d, giảm alpha-beta thành b^(d/2), linear evaluation functions) cung cấp một mô tả chính xác về các phần *khả thi* của chơi trò chơi. Hình học bị phá vỡ ở đâu — & tính chất nào của trí thông minh chơi trò chơi nằm ngoài mô hình hình học? Đưa ra một câu trả lời cụ thể, không phải một quan sát chung chung.