grpo-rl-training

4 results for tag "grpo-rl-training"

🎯

Skills

grpo-rl-trainingdavila7/claude-code-templates1550

A large collection of Claude Code skill templates sponsored by Z.AI, providing ready-to-use development skill configurations across various domains.

grpo-rl-training

grpo-rl-trainingorchestra-research/ai-research-skills350

A skill from the AI Research Engineering Skills library that teaches AI coding agents how to implement GRPO (Group Relative Policy Optimization) for reinforcement learning training of language models.

grpo-rl-training

grpo-rl-trainingovachiever/droid-tings250

Guides fine-tuning language models using Group Relative Policy Optimization (GRPO) for structured reasoning and task-specific training with TRL.

grpo-rl-training

grpo-rl-trainingzechenzhangagi/ai-research-skills★ 17