算力周跟踪:OpenAI发布o1大模型,开启强化学习新范式!
2024年09月20日
华福证券 陈海进,徐巡,李雅文
投资要点:
本周 CPU/GPU 板块出现回调, 云计算板块普涨。
(1) CPU/GPU 板块: 本周(0916-0918) 英伟达-4.81%, 海光信息-4.17%, 寒武纪-4.76%,龙芯中科-3.03%。 英特尔+5.65%, 当地时间 9 月 16 日, 英特尔公布业务调整消息, 剥离芯片代工业务。
(2) 云计算板块: 商汤科技+5.77%, 9 月 14日公布商汤科技 5.2 亿中标移动天津 2024 年智算中心一期。
最新一周数据显示文本大模型总体访问量持续亮眼。
据 similarweb 最新数据(0906-0912) : (1) ChatGPT 和 Perplexity 访问量持续攀升。 (2)豆包访问量长期增长。 9 月 14 日, “豆包爱学” 全新升级, 推出了很多辅助学习的实用功能。 (3) Runway 访问量继续提升。 9 月 14 日, Runway推出一种新的控制机制, 可以通过参考视频来精确控制运动、 表现力和意图, 大大提高 AI 制作电影、 游戏特效方向的可行性。 据七麦最新数据(0911-0917) : 阿里通义下载量增长稳定。 通义万相 AI 生视频将在 9 月19 日上线, 现已开启预约, 支持文或图生视频, 支持多语音与可变分辨率生成。 OpenAI 公开 o1 大模型, 强化学习 Scaling Law 提出算力需求。 9 月13 日, OpenAI 正式公开 o1 大模型, 即此前宣传的草莓大模型。 它具备真正的通用推理能力, 在高难度基准测试中展现出色的表现, 相比 GPT-4o 有显著提升。 OpenAI 还发布了成本效率更高的 o1-mini 模型, 尤其擅长编程任务。 目前, ChatGPT Plus 和 Team 用户可以开始使用 o1 模型, 但使用量有限。 OpenAI 计划未来增加更多功能, 如网络浏览、 文件和图像上传等, 以提升模型的实用性。
观点#1: 思维链深化推理能力, 强化学习突破 LLM 推理极限。从方法上,o1 大模型首次证明了语言模型可以进行真正的强化学习——给越多算力,就输出越多智能, 一直到超越人类水平。 o1 还引入了思维链(CoT) 推理,也就是该模型在作出反应之前, 需要像人类一样, 花更多时间思考问题。通过训练, 它们学会完善自己的思维过程, 尝试不同的策略, 并认识到自己的错误。 CoT 显著扩展了模型的表达能力, 使其能够处理更复杂的问题。
观点#2: OpenAI o1 打破 Scaling law 瓶颈, 反哺多模态通用模型。目前普遍认为通过增加数据和模型规模来提升大模型效果的 Scaling law 模式,其增长速度在放缓。 目前面临的问题包括数据资源的枯竭, 因为像 GPT-4这样的模型已经使用了大量可用数据, 导致“数据荒” 。 同时, 大模型的训练需要大量 GPU 资源, 这也使得算力和数据的扩展面临瓶颈。OpenAI 发现, 随着更多的强化学习(训练时计算) 和更多的思考时间(测试时计算),o1 的性能持续提高, 而且扩展这种方法的限制与大模型预训练的限制有很大不同。 可以通过 o1 增强最重要的基座模型逻辑推理能力, 再把这种能力迁移到 GPT 4o 这种多模态通用模型上。 比如通过直接用 o1 基座模型替换GPT 4o 的基座、 或者利用 o1 模型生成逻辑推理方面的合成数据增强 GPT4o、 再或者用 o1 蒸馏 GPT 4o 模型。
建议关注
国产算力链: 寒武纪、 海光信息、 龙芯中科、 盛科通信等。
数据中心硬件: 中际旭创、 工业富联、 新易盛、 天孚通信、 沃尔核材、英维克、 沪电股份、 胜宏科技。
风险提示
技术发展及落地不及预期; 下游终端出货不及预期; 下游需求不及预期; 市场竞争加剧风险; 地缘政治风险。
甘肃网友:股友299tq60231 (资历5)