CS Notes

标签: 数学推理

此标签下有1条笔记。

  • 2024年2月05日

    DeepSeekMath - Pushing the Limits of Mathematical Reasoning in Open Language Models

    • LLM
    • 数学推理
    • RL
    • DeepSeek
    • GRPO

Created with Quartz v1.0.0 © 2026

  • GitHub