YqjMartin

init YqjMartin

0 followers · 1 following

Achievements

Stars

Lixiaokun0106 / USTB_PrinciplesOfComputerCompositionCourseDesign

北京科技大学计算机组成原理课程设计

VHDL 10 1 Updated May 28, 2024

RUC-NLPIR / ARPO

✨ Agentic Reinforced Policy Optimization

Python 718 32 Updated Oct 21, 2025

PRIME-RL / Entropy-Mechanism-of-RL

The Entropy Mechanism of Reinforcement Learning for Large Language Model Reasoning.

Python 354 12 Updated Jul 11, 2025

OpenDCAI / DataFlow

Easy Data Preparation with latest LLMs-based Operators and Pipelines.

Python 1,400 93 Updated Oct 22, 2025

RUC-NLPIR / FlashRAG

⚡FlashRAG: A Python Toolkit for Efficient RAG Research (WWW2025 Resource)

Python 3,068 261 Updated Sep 25, 2025

alibaba / ROLL

An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models

Python 2,096 128 Updated Oct 14, 2025

Simple-Efficient / RL-Factory

Train your Agent model via our easy and efficient framework

Python 1,579 143 Updated Oct 20, 2025

agentcodee / cursor-free-everyday

完全免费, 自动获取新账号,一键重置新额度, 解决机器码问题, 自动满额度

Rust 5,788 541 Updated Oct 14, 2025

PeterGriffinJin / Search-R1

Search-R1: An Efficient, Scalable RL Training Framework for Reasoning & Search Engine Calling interleaved LLM based on veRL

Python 3,376 285 Updated Oct 4, 2025

Lixiaokun0106 / OS_doc

北京科技大学操作系统课内资料

HTML 6 Updated Dec 5, 2023

Agent-RL / ReCall

ReCall: Learning to Reason with Tool Call for LLMs via Reinforcement Learning

Python 1,223 77 Updated May 16, 2025

WitchElaina / USTB-Computer-Courses-Codes

北京科技大学计算机系课程代码总集，个人课程代码收集与导航仓库

61 7 Updated Apr 30, 2025

jingyaogong / minimind

🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT！🌏 Train a 26M-parameter GPT from scratch in just 2h!

Python 31,091 3,580 Updated Oct 21, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

init YqjMartin

Achievements

Achievements

Block or report YqjMartin

Stars

Lixiaokun0106 / USTB_PrinciplesOfComputerCompositionCourseDesign

RUC-NLPIR / ARPO

PRIME-RL / Entropy-Mechanism-of-RL

OpenDCAI / DataFlow

RUC-NLPIR / FlashRAG

alibaba / ROLL

Simple-Efficient / RL-Factory

agentcodee / cursor-free-everyday

PeterGriffinJin / Search-R1

Lixiaokun0106 / OS_doc

Agent-RL / ReCall

WitchElaina / USTB-Computer-Courses-Codes

jingyaogong / minimind