8种AI模型架构,视觉解释: 每个人都在谈论LLM,但还有一整类专门模型在做令人难以置信的事情。 以下是快速概述: 1. LLM(大型语言模型) 文本输入,经过标记化为嵌入,通过变换器处理,然后输出文本。 ↳ GPT,Claude,Gemini,Llama。 2. LCM(大型概念模型) 在概念层面工作,而不是标记。输入被分割成句子,经过SONAR嵌入,然后使用扩散再输出。 ↳ Meta的LCM是先锋。 3. LAM(大型行动模型) 将意图转化为行动。输入经过感知、意图识别、任务分解,然后在执行前进行带记忆的行动规划。 ↳ Rabbit R1,Microsoft UFO,Claude计算机使用。 4. MoE(专家混合) 路由器决定哪些专门的“专家”处理您的查询。只有相关的专家被激活。结果经过选择和处理。 ↳ Mixtral,GPT-4,DeepSeek。 ...