Cercetătorii de la Universitatea Tsinghua, Beijing Institute for General Artificial Intelligence și Pennsylvania State University au dezvoltat un sistem AI care învață prin generarea propriilor întrebări și găsirea răspunsurilor, potrivit Wired. Sistemul numit Absolute Zero Reasoner (AZR) îmbunătățește semnificativ abilitățile de programare și raționament ale modelelor de limbaj.
Cum funcționează sistemul de auto-învățare
AZR folosește un model de limbaj pentru a genera probleme de programare Python provocatoare, dar rezolvabile. Același model încearcă apoi să rezolve aceste probleme, verificându-și munca prin rularea codului. Sistemul folosește succesele și eșecurile pentru a-și rafina capacitățile de a pune întrebări mai bune și de a le rezolva.
Rezultate superioare datelor create de oameni
Echipa a descoperit că abordarea lor a îmbunătățit semnificativ abilitățile modelului open source Qwen, atât pentru versiunile cu 7 miliarde, cât și pentru cele cu 14 miliarde de parametri. Impresionant, modelul a depășit chiar și modele care primiseră date create de oameni.
„La început îți imiti părinții și faci ca profesorii tăi, dar apoi trebuie să-ți pui propriile întrebări”, a declarat Andrew Zhao, student la doctorat la Universitatea Tsinghua și autorul ideii originale. „Și în final poți să-i depășești pe cei care te-au învățat la școală.”
Conceptul de auto-joc în AI
Zhao și colegul său Zilong Zheng de la BIGAI au explicat că ideea de AI care învață prin „auto-joc” datează de ani de zile. Conceptul a fost explorat anterior de pionieri AI precum Jürgen Schmidhuber și Pierre-Yves Oudeyer de la Inria din Franța.
„Nivelul de dificultate crește pe măsură ce modelul devine mai puternic”, a explicat Zheng. Unul dintre elementele cele mai interesante ale proiectului este modul în care abilitățile modelului de a pune și rezolva probleme se dezvoltă împreună.
Limitări și perspective viitoare
Pentru moment, sistemul funcționează doar cu probleme care pot fi verificate ușor, cum ar fi cele care implică matematică sau programare. Pe viitor, ar putea fi folosit pentru sarcini AI mai complexe, precum navigarea pe web sau îndeplinirea sarcinilor de birou.
„Odată ce avem asta, este într-un fel o modalitate de a atinge superinteligența”, a declarat Zheng pentru Wired. Această posibilitate fascinantă sugerează că Absolute Zero ar putea permite modelelor să depășească învățarea umană.
Adopția în laboratoarele mari de AI
Există semne timpurii că abordarea Absolute Zero câștigă teren în laboratoarele mari de AI. Un proiect numit Agent0, dezvoltat de Salesforce, Stanford și University of North Carolina at Chapel Hill, implică un agent care se îmbunătățește prin auto-joc.
Cercetători de la Meta, University of Illinois și Carnegie Mellon University au prezentat recent un sistem similar pentru ingineria software. Autorii acestei lucrări sugerează că reprezintă „un primul pas către paradigme de antrenament pentru agenți software superinteligenți”.
Viitorul învățării AI
Găsirea de noi modalități pentru AI să învețe va fi probabil o temă majoră în industria tech în acest an. Cu sursele convenționale de date devenind din ce în ce mai rare și mai scumpe, proiecte precum Absolute Zero ar putea duce la sisteme AI mai puțin imitative și mai asemănătoare oamenilor.
