螞蟻集團聯合清華大學發布開源強化學習訓練框架AReaL v1.0穩定版,主打「Agent一鍵接入RL訓練」,不用改代碼,兼容各類Agent框架,讓智能體強化學習訓練開箱即用。AReaL是首個全異步訓推解耦的大模型強化學習訓練系統,能讓Agent在真實任務交互中獲得反饋、持續優化決策。此次發布的v1.0版本讓任意Agent零改造接入RL訓練成為現實,即通過在智能體與訓練系統之間加入Proxy Worker中轉層,開發者只需修改一個請求地址即可接入訓練。(jl/w)