[中金成长精选混合C-of010952]开启强化学习新范式!，算力跟踪：OpenAI发布o1大模型-投资-电影,游戏,数码-娱乐新闻

[中金成长精选混合C-of010952]开启强化学习新范式!，算力跟踪：OpenAI发布o1大模型

tc 3月前 14

算力周跟踪：OpenAI发布o1大模型，开启强化学习新范式!　
　2024年09月20日　
华福证券陈海进,徐巡,李雅文　
　　投资要点：　
　　本周 CPU/GPU 板块出现回调，云计算板块普涨。　
　　（1） CPU/GPU 板块：本周（0916-0918）英伟达-4.81%，海光信息-4.17%，寒武纪-4.76%，龙芯中科-3.03%。英特尔+5.65%，当地时间 9 月 16 日，英特尔公布业务调整消息，剥离芯片代工业务。　
　　（2）云计算板块：商汤科技+5.77%， 9 月 14日公布商汤科技 5.2 亿中标移动天津 2024 年智算中心一期。
　　最新一周数据显示文本大模型总体访问量持续亮眼。　
　　据 similarweb 最新数据（0906-0912）：（1） ChatGPT 和 Perplexity 访问量持续攀升。（2）豆包访问量长期增长。 9 月 14 日， “豆包爱学” 全新升级，推出了很多辅助学习的实用功能。（3） Runway 访问量继续提升。 9 月 14 日， Runway推出一种新的控制机制，可以通过参考视频来精确控制运动、表现力和意图，大大提高 AI 制作电影、游戏特效方向的可行性。据七麦最新数据（0911-0917）：阿里通义下载量增长稳定。通义万相 AI 生视频将在 9 月19 日上线，现已开启预约，支持文或图生视频，支持多语音与可变分辨率生成。　　OpenAI 公开 o1 大模型，强化学习 Scaling Law 提出算力需求。 9 月13 日， OpenAI 正式公开 o1 大模型，即此前宣传的草莓大模型。它具备真正的通用推理能力，在高难度基准测试中展现出色的表现，相比 GPT-4o 有显著提升。　OpenAI 还发布了成本效率更高的 o1-mini 模型，尤其擅长编程任务。　目前， ChatGPT Plus 和 Team 用户可以开始使用 o1 模型，但使用量有限。 OpenAI 计划未来增加更多功能，如网络浏览、文件和图像上传等，以提升模型的实用性。
　　观点#1：思维链深化推理能力，强化学习突破 LLM 推理极限。从方法上，o1 大模型首次证明了语言模型可以进行真正的强化学习——给越多算力，就输出越多智能，一直到超越人类水平。 o1 还引入了思维链（CoT）推理，也就是该模型在作出反应之前，需要像人类一样，花更多时间思考问题。通过训练，它们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。 CoT 显著扩展了模型的表达能力，使其能够处理更复杂的问题。
　　　观点#2： OpenAI o1 打破 Scaling law 瓶颈，反哺多模态通用模型。目前普遍认为通过增加数据和模型规模来提升大模型效果的 Scaling law 模式，其增长速度在放缓。目前面临的问题包括数据资源的枯竭，因为像 GPT-4这样的模型已经使用了大量可用数据，导致“数据荒” 。　同时，大模型的训练需要大量 GPU 资源，这也使得算力和数据的扩展面临瓶颈。OpenAI 发现，随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高，而且扩展这种方法的限制与大模型预训练的限制有很大不同。可以通过 o1 增强最重要的基座模型逻辑推理能力，再把这种能力迁移到 GPT 4o 这种多模态通用模型上。比如通过直接用 o1 基座模型替换GPT 4o 的基座、或者利用 o1 模型生成逻辑推理方面的合成数据增强 GPT4o、再或者用 o1 蒸馏 GPT 4o 模型。　
　　建议关注　　
　　国产算力链：寒武纪、海光信息、龙芯中科、盛科通信等。
　　数据中心硬件：中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。　　
　　风险提示　
　　技术发展及落地不及预期；下游终端出货不及预期；下游需求不及预期；市场竞争加剧风险；地缘政治风险。　

甘肃网友:股友299tq60231 (资历5)

最新回复 (0)

发新帖

tc

积分数
-18

帖子数
0

注册排名
3

[中金成长精选混合C-of010952]开启强化学习新范式!，算力跟踪：OpenAI发布o1大模型

tc

作者最近主题：