English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

სტუმარი
1 / ?
უკან გაკვეთილებზე

CUDA აანგარიშებს დოკუმენტის ინდექსებს

CUDA ტრენერი იცის რომელი დოკუმენტი შეღებინა

თითოეული ტრენინგის ნაბიჯი იღებს თანმიმდევრობას .btok ბინარულიდან, რომელიც შეიცავს მრავალ დოკუმენტს ერთმანეთის ჩამოყოლილი. CUDA ჩაწერს დოკუმენტის ინდექსს loss-თან ერთად: ნაბიჯი 47213, წყარო=gutenberg, დოკ=128407, loss=2.81. პროქსი აგროვებს ამ ანგარიშებს & ინარჩუნებს უნიკალური დოკუმენტის ინდექსების ნაკრებს წყაროს მიხედვით.


რაოდენობიდან დაფარვამდე

წყაროს დაფარვა = unique_docs_seen / n_docs. რამდენიმე მაგალითი:


წყაროn_docsუნიკალურად ნანახიდაფარვა
gutenberg512,000154,00030.1%
hermes3-general67,39547,17670.0%
dictionary88,00088,000100.0%
synthetic-chat1,4001,400100.0%

მცირე წყაროები სწრაფად გაჯერებენ. დიდი წყაროები კვირებით ეცემა 50%-ის ქვემოთ. დაფარვის ბონუსი ჯილდოვებს ბანდიტს დოკუმენტების მონახულებისთვის, რომლებსაც ჯერ არ მოიკლო წყაროში.


დაფარვის ბონუსი წყაროს მიხედვით


ბონუსის ფორმულა

დაფარვის ბონუსი ლინეარულად მერყეობს 1.3x-დან 0%-იანი დაფარვისას 1.0x-მდე 50%-იანი დაფარვისას, შემდეგ კი 50%-ზე მეტისთვის რჩება 1.0x-ზე:


თუ coverage < 0.5:
bonus = 1.0 + 0.3 * (1.0 - coverage / 0.5)
სხვა შემთხვევაში:
bonus = 1.0

წყარო 0%-იანი ფარისხით იღებს 1.3x ბონუსს; 25%-იანი ფარისხის წყარო იღებს 1.15x-ს; 50%-იან ფარისხზე ეცემა 1.0x-მდე. 50%-ზე მეტის შემთხვევაში ბონუსი არ ვრცელდება.

ბონუსის გამოთვლა

გაშვება gutenberg-ის დაფარვით 30% და hermes3-general-ის დაფარვით 70%. გამოთვალეთ დაფარვის ბონუსის მულტიპლიკატორი თითოეული წყაროსთვის. აჩვენეთ თქვენი არითმეტიკა.

ორი განსხვავებული სუნთქვის სიგნალი

იგივე მიზანი, განსხვავებული გრანულარობა

ANDREA-ს ორი მექანიზმი აქვს, რომელიც ხელს უშლის ერთი წყაროს მიერ გადაწვას. ისინი მსგავსად ჟღერს; სხვადასხვა რამეს ზომავს.


Epoch შუალედი. აკონტროლებს საერთო გადაწევას. როდესაც lifetime_pulls / n_docs > 1.0, წყარომ თეორიულად ყველა დოკუმენტს ერთხელ მაინც გაატარა. შუალედი = 1 / (1 + epochs). 1.4K-დოკუმენტიანი synthetic-chat წყარო 5,600 lifetime pulls-ით (epochs = 4) იღებს შუალედს 1/5 = 0.2x. Epoch-ების მონდომება განახლებებზე მუდმივია; ისინი არასდროს მცირდება.


Coverage ბონუსი. აკონტროლებს დოკუმენტების სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის სუნთქვის


Why Both Matter


სიგნალითვალყურის დევნებამიმართულებაზღვარიშენარჩუნდება ხელახალი გაშვებების შემდეგ
ეპოქის სჯააგრეგატული გადაჭარბებული მოთხრაამცირებს1/(1+e)კი
დაფარვის ბონუსითითო დოკუმენტის სუნთქვის სუნთქვაზრდის1.3xკი

500K-დოკუმენტიანი gutenberg წყარო შეუძლია დარჩეს 50%-იანი დაფარვის ქვემოთ მთელი 200K-იანი ტრენინგის განმავლობაში, ხოლო არასდროს მიუახლოვდეს ეპოქა=1-ს. ეპოქის სჯა იგნორირებს მას; დაფარვის ბონუსი აქტიურად იზიდავს ბანდიტს gutenberg-ის unexplored 70% კუდისკენ.


საპირისპიროდ, 1.4K სინთეზური-ჩატის წყარო სატურირებს დაფარვას (100%) რამდენიმე ათასი მოთხრის შემდეგ; დაფარვის ბონუსი რჩება 1.0x-ზე, ხოლო ეპოქის სჯა იზრდება.

განასხვავეთ ორი

წარმოიდგინეთ ორი წყარო ტრენინგის შუაში: წყარო A აქვს 1,400 დოკუმენტი & 8,400 lifetime pulls. წყარო B აქვს 500,000 დოკუმენტი & 80,000 lifetime pulls; პროქსიმ ჩაწერილი აქვს 75,000 უნიკალური doc indices B-სთვის ამ დრომდე. რომელი სიგნალი (epoch შუალედება თუ coverage ბონუსი) მართავს თითოეული წყაროს bandit წონას, & რატომ?

რას ყიდულობს Coverage Bonus ANDREA-სთვის

ხარვეზის რეჟიმი, რომელსაც ის ხელს უშლის

დოკუმენტის დონის თრექინგის გარეშე, ბენდიტი, რომელიც ირჩევს ნაბიჯის ჯილდოს მიხედვით, .btok თანმიმდევრობებს სიყვარულით ირჩევს. 500K-დოკუმენტიანი გუტენბერგის კორპუსი შეიცავს რამდენიმე ათას თანმიმდევრობას დაბალი კროს-ენტროპიით (თანმიმდევრული პროზა, ხშირი ლექსიკა). მხოლოდ ჯილდოს ბენდიტი ბრუნდება ამ თანმიმდევრობებში განმეორებით, რადგან ისინი მუდმივად გამოსცემენ ძლიერ ჯილდოს სიგნალებს.


შედეგი: 500K-დოკუმენტიანი კორპუსი იღებს სემპლინგს მხოლოდ 2K-5K განსხვავებულ თანმიმდევრობაზე 200K ტრენინგის ნაბიჯზე. მოდელი ამ თანმიმდევრობებს მემორიზებს, არასდროს ხედავს დანარჩენს. შესაძლებლობები ფუჭდება; კავერაჟი რჩება 1%-ის ქვემოთ.


რას ყიდულობს კავერაჟის ბონუსი

1.3x 0% კავერაჟზე, მასშტაბდება 1.0x-მდე 50%-ზე. ეს მცირე ნაკერკი გავრცელდება UCB1 შერჩევაში: იარაღები დაბალი კავერაჟით რჩება კონკურენტუნარიანად, მაშინაც კი, როდესაც მათი თითოეული გაყვანის ჯილდო კლებულობს. ბენდიტი თავისი დიზაინით იკვლევს კუდს, არა შემთხვევითობით.


500K-დოკუმენტიან გუტენბერგზე 200K-ნაბიჯიანი გაშვებაში, კავერაჟის ბონუსი ჩვეულებრივ ზრდის ობსერვირებულ კავერაჟს ~3%-დან (ბონუსის გარეშე) ~25-30%-მდე (ბონუსით). იგივე კომპიუტერი, რვა-ათჯერ მეტი დოკუმენტი შეხებული.


სად მდებარეობს თრექინგი


კომპონენტიპასუხისმგებლობა
microgpt_cuda.cuიუწყება დოკუმენტის ინდექსს თითოეული ტრეინინგის ნაბიჯზე
training_proxy.pyინარჩუნებს seen_docs მნიშვნელობას წყაროს მიხედვით
training_proxy.pyითვლის დაფარვას, გამოიყენებს ბონუსს ბანდიტის ჯილდოსთვის
training_proxy.pyseen_docs-ს .state.json-ში ხსნის ხელახლა გაშვებებზე

დაუკავშირდით კონკრეტულ ინჟინერიულ არჩევანს

დაუშვით, რომ ANDREA-120M-ის ტრენინგიდან ამოიღებდით coverage bonus-ს. პროგნოზირებული ერთი კონკრეტული შედეგი gutenberg-ის ხელისთვის კონკრეტულად (რომელსაც 500K+ დოკუმენტი აქვს) 200K-სტეპიანი გაშვების განმავლობაში. მიუთითეთ coverage პროცენტი, დოკუმენტების დივერსიფიკაცია ან downstream sample-ის ხარისხი.