共3篇关于"强化学习"的文章

Kimi专注研发AI应用

Kimi近期推出基于强化学习的新一代视觉思考模型k1，从长文本扩展到多模态领域，展示其在AI领域的领先地位。

AI行业信息 Kimi 视觉思考模型k1 强化学习多模态

5 个月前

全新AI助手Claude登场

Anthropic推出AI助手Claude，挑战ChatGPT地位。Claude采用Constitutional AI（以AI反馈强化学习）技术，显著降低开发门槛并增加应用透明度，论文《Constitutional AI: Harmlessness from AI Feedback》提供成本较低的新技术思路。

人工智能 Claude RLAIF ChatGPT 无害性强化学习

5 个月前

早谈AI资讯：OpenAI全员乱斗Q*，英伟达H20推迟到明年初发布，李沐大模型公司细节曝光

本文对最近OpenAI发布的Q*模型进行了详尽的分析，探讨了其背后的原理、突破点以及未来可能带来的影响和争议。

AI行业信息 OpenAI Q*模型人工智能深度学习强化学习

5 个月前