热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

NingNing
认知图更新
据AI大牛 Andrej Karpathy的说法,预训练时代,关键的是互联网文本数据;监督微调时代,关键的是知乎、Stackflow的问答体结构化知识;强化学习时代,关键的是多样化的环境。
专注于AI资产代币化的AI x Crypto赛道,在传统的算力、数据、模型、Agent之外,有了新的可代币化AI资产:环境

Andrej Karpathy8月28日 04:34
在预训练时代,重要的是互联网文本。你主要希望拥有一个大型、多样化、高质量的互联网文档集合来学习。
在监督微调时代,重要的是对话。雇佣合同工来为问题创建答案,有点像你在 Stack Overflow / Quora 等地方看到的,但更针对 LLM 的用例。
我认为上述两者都不会消失,但在这个强化学习的时代,现在重要的是环境。与上述不同,它们给 LLM 提供了实际互动的机会——采取行动、查看结果等。这意味着你可以希望比统计专家模仿做得更好。它们可以用于模型训练和评估。但就像以前一样,现在的核心问题是需要一个大型、多样化、高质量的环境集合,作为 LLM 练习的练习场。
在某种程度上,我想起了 OpenAI 的第一个项目(gym),这正是一个希望建立一个大型环境集合的框架,但那是在 LLM 之前。因此,这些环境是当时简单的学术控制任务,比如 cartpole、ATARI 等。@PrimeIntellect 环境中心(以及 GitHub 上的 `verifiers` 仓库)构建了现代化版本,专门针对 LLM,这是一个伟大的努力/想法。今年早些时候,我建议有人构建类似的东西:
环境具有这样的特性,一旦框架的骨架到位,原则上社区/行业可以在许多不同领域并行化,这令人兴奋。
最后的想法——就个人和长期而言,我对环境和代理互动持乐观态度,但对强化学习持悲观态度。我认为奖励函数非常可疑,我认为人类并不使用 RL 来学习(也许他们在某些运动任务等方面使用,但在智力问题解决任务中并不使用)。人类使用不同的学习范式,这些范式显著更强大且样本效率更高,而这些范式尚未得到适当的发明和扩展,尽管早期的草图和想法已经存在(例如,“系统提示学习”的想法,将更新移动到令牌/上下文而不是权重,并可选择将其提炼为权重,作为一个类似于睡眠的单独过程)。
2.76K
对市场当前关心两个热门问题的判断——基于与自指式深度分析Agent系统 v6.1 🧠的对话
1⃣关于美联储9月降息
自指式深度分析Agent系统 v6.1的最终判断:美联储9月降息概率78%,跨资产配置建议向成长风格倾斜,重点关注美股科技+A股科创+以太坊生态的组合配置
确定降息之后:
-美股: 温和利好,但涨幅有限 (+2-4%)
-加密市场: 短期震荡,中期利好 (-5% to +15%)
A股风格: 成长股迎来配置窗口 (成长 +8-12%, 价值 +3-5%)
9月的交易博弈时间窗口:
时间窗口1: 当前至9月6日 - "预期缓慢升温期"
时间窗口2: 9月6日 - "概率剧烈重定价期"
时间窗口3: 9月11日 - "通胀制约测试期"
时间窗口4: 9月11日-17日 - "静默期博弈"
时间窗口5: 9月18日及其后 - "结果兑现与预期重构"
2⃣关于牛尾论
自指式深度分析Agent系统 v6.1的核心结论: 中文CT流行的"牛尾论"是一个系统性认知偏误,基于过时的周期模式认知,忽略了当前牛市的结构性变化。
7个分析框架中,6个强烈反对牛尾论,1个中性。
"牛尾论"实质上是新旧范式交替期的认知摩擦。当市场从散户驱动转向机构驱动时,传统的判断标准失效,导致对"冷静"的误读。
对个人投资者:
避免周期思维陷阱: 不要因为"时间太长"就认为牛市结束
关注结构变化: 重点配置受益于机构化的核心资产
理性对待回调: 将技术性调整视为加仓机会

10.36K
热门
排行
收藏