jnian
/

Qwen2.5-7B-Instruct-Open-R1-GRPO-hard_query

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-Instruct-Open-R1-GRPO-hard_query / README.md

Commit History

End of training

aaf1c95
verified

jnian commited on Mar 26, 2025

Model save

302688f
verified

jnian commited on Mar 26, 2025

End of training

42711ef
verified

jnian commited on Mar 23, 2025

Model save

e08a292
verified

jnian commited on Mar 23, 2025