MSWagner/qwen-lora-grpo-letter-counting

Fine-tuning Qwen2.5-3B-Instruct model with LoRa (Low-Rank Adaptation) and Group Relative Policy Optimization (GRPO)

/ 100

Experimental

No License No Package No Dependents

Maintenance 10 / 25

Adoption 0 / 25

Maturity 3 / 25

Community 0 / 25

Stars

—

Forks

—

Language

Jupyter Notebook

License

—

Category

Last pushed

Feb 08, 2026

Commits (30d)

Get this data via API

curl "https://pt-edge.onrender.com/api/v1/quality/transformers/MSWagner/qwen-lora-grpo-letter-counting"

Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.

Higher-rated alternatives

OptimalScale/LMFlow

An Extensible Toolkit for Finetuning and Inference of Large Foundation Models. Large Models for All.

adithya-s-k/AI-Engineering.academy

Mastering Applied AI, One Concept at a Time

jax-ml/jax-llm-examples

Minimal yet performant LLM examples in pure JAX

young-geng/scalax

A simple library for scaling up JAX programs

riyanshibohra/TuneKit

Upload your data → Get a fine-tuned SLM. Free.