Add support in TRL for async reward functions so users can run batched external API calls (e.g. OpenAI/Deepseek or local inference) with asyncio.gather when computing rewards in the GRPO trainer. I am ...
Add a description, image, and links to the functions-in-javascript topic page so that developers can more easily learn about it.
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する