共3篇关于"强化学习"的文章

Kimi专注研发AI应用

Kimi近期推出基于强化学习的新一代视觉思考模型k1,从长文本扩展到多模态领域,展示其在AI领域的领先地位。

全新AI助手Claude登场

Anthropic推出AI助手Claude,挑战ChatGPT地位。Claude采用Constitutional AI(以AI反馈强化学习)技术,显著降低开发门槛并增加应用透明度,论文《Constitutional AI: Harmlessness from AI Feedback》提供成本较低的新技术思路。

早谈AI资讯:OpenAI全员乱斗Q*,英伟达H20推迟到明年初发布,李沐大模型公司细节曝光

本文对最近OpenAI发布的Q*模型进行了详尽的分析,探讨了其背后的原理、突破点以及未来可能带来的影响和争议。