Studie zeigt: "Test-Time Compute Scaling" ist der Weg zu besseren KI-Systemen

Delete Set public Set private Add tags Delete tags

12642 shaares
316 private links

12642 shaares · 316 private links

Filters

Links per page

20 50 100

Studie zeigt: "Test-Time Compute Scaling" ist der Weg zu besseren KI-Systemen

Die Wissenschaftler untersuchten drei zentrale suchbasierte Ansätze: Die "Best-of-N"-Methode generiert mehrere Lösungsvorschläge und wählt den besten aus. Beam Search untersucht den Lösungsraum systematisch mit Hilfe eines Process Reward Models (PRM). Die neu entwickelte "Diverse Verifier Tree Search" (DVTS) optimiert zusätzlich die Vielfalt der gefundenen Lösungen.

Die Ergebnisse der Praxistests sind beeindruckend: Ein Llama-Modell mit nur einer Milliarde Parametern erreichte die Leistung eines achtmal größeren Modells. Bei mathematischen Aufgaben erzielte es eine Genauigkeit von fast 55 Prozent - laut Hugging Face nahe an der durchschnittlichen Leistung von Informatik-Doktoranden.

Ein 3-Milliarden-Parameter-Modell übertraf sogar die Leistung des 22-mal größeren 70-Milliarden-Parameter-Modells Llama 3.1

ai · news · 2024

December 19, 2024 at 2:21:01 PM GMT+1 * · permalink

https://the-decoder.de/studie-zeigt-test-time-compute-scaling-ist-der-weg-zu-besseren-ki-systemen/

Filters

Links per page

20 50 100