
大语言模型(LLM)
生成式过程奖励模型(GenPRM)
OpenAIo1
DeepSeekR1