CS Notes

标签: reinforcement-learning

此标签下有3条笔记。

  • 2024年3月21日

    Deep RL Course

    • huggingface
    • deep-rl
    • reinforcement-learning
    • course
  • 2024年3月21日

    Hugging Face Course

    • huggingface
    • course
    • llm
    • reinforcement-learning
  • 2026年4月13日

    PPO 近端策略优化算法

    • reinforcement-learning
    • deep-learning
    • ppo
    • rlhf
    • llm

Created with Quartz v1.0.0 © 2026

  • GitHub