jnian
/

Qwen2.5-7B-Instruct-Open-R1-GRPO-500easy_500hard_query

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-Instruct-Open-R1-GRPO-500easy_500hard_query

Commit History

End of training

b0bce5d
verified

jnian commited on Mar 27, 2025

Model save

a0af9ab
verified

jnian commited on Mar 27, 2025

Training in progress, epoch 0

bdab447
verified

jnian commited on Mar 27, 2025

End of training

10d0fdb
verified

jnian commited on Mar 26, 2025

Model save

cbfd8f4
verified

jnian commited on Mar 26, 2025

Training in progress, epoch 0

0732107
verified

jnian commited on Mar 26, 2025

initial commit

ee5bd95
verified

jnian commited on Mar 26, 2025