有美团基因的大语言模型
从这几年王兴的各种动作看,美团发布LongCat不是跟风。在 2024 年美团CEO王兴在财报分析会上就阐述了公司的 AI 战略布局,当时提出了通过三层架构推动技术落地:
AI at Work:目标是利用AI工具提升超过 10 万名员工的工作效率。
AI in Products:旨在用AI改造现有产品并创建原生AI应用。
Building LLM:持续投入资源自研大模型。
里面所提到的“Building LLM”应该就是现在的LongCat。当然LongCat在现在这个时间点发布,肯定也有自己的独特之处,可以简要总结如下:
与传统大模型“全参数激活”的“蛮力”模式不同,LongCat通过“零计算专家”机制实现“按需分配”——对于常见词、标点等“低重要性”token,直接由“零计算专家”处理,仅对关键token激活更多专家。这种设计既保持了5600亿参数的强大性能,又实现了270亿参数的平均激活量,推理速度更快、成本更低。
LongCat的设计聚焦实用型智能体任务,其**VitaBench(复杂商业场景)**得分24.30分(行业第一),远超参数规模更大的模型。这意味着在涉及“多工具调用、多步骤交互”的实际场景(如智能客服、企业决策辅助)中,LongCat能以更低的算力消耗完成任务,更适合企业落地。
LongCat的开源并非“技术炫技”,而是推动AI实用化的重要举措。其MIT协议允许商业使用,适配主流推理框架,降低了企业的使用门槛。此外,美团将其融入本地生活服务(如“袋鼠参谋”决策辅助、“AI经营决策助手”),展示了大模型从“技术演示”向“实际生产力”的转变。
用户评论 (2)
发表评论
霍太稳@极客邦科技
从这几年王兴的各种动作看,美团发布LongCat不是跟风。在 2024 年美团CEO王兴在财报分析会上就阐述了公司的 AI 战略布局,当时提出了通过三层架构推动技术落地:
AI at Work:目标是利用AI工具提升超过 10 万名员工的工作效率。
AI in Products:旨在用AI改造现有产品并创建原生AI应用。
Building LLM:持续投入资源自研大模型。
里面所提到的“Building LLM”应该就是现在的LongCat。当然LongCat在现在这个时间点发布,肯定也有自己的独特之处,可以简要总结如下:
1. “会挑活干”的动态计算
与传统大模型“全参数激活”的“蛮力”模式不同,LongCat通过“零计算专家”机制实现“按需分配”——对于常见词、标点等“低重要性”token,直接由“零计算专家”处理,仅对关键token激活更多专家。这种设计既保持了5600亿参数的强大性能,又实现了270亿参数的平均激活量,推理速度更快、成本更低。
2. 智能体任务的“效率天花板”
LongCat的设计聚焦实用型智能体任务,其**VitaBench(复杂商业场景)**得分24.30分(行业第一),远超参数规模更大的模型。这意味着在涉及“多工具调用、多步骤交互”的实际场景(如智能客服、企业决策辅助)中,LongCat能以更低的算力消耗完成任务,更适合企业落地。
3. 开源生态的“实用导向”
LongCat的开源并非“技术炫技”,而是推动AI实用化的重要举措。其MIT协议允许商业使用,适配主流推理框架,降低了企业的使用门槛。此外,美团将其融入本地生活服务(如“袋鼠参谋”决策辅助、“AI经营决策助手”),展示了大模型从“技术演示”向“实际生产力”的转变。
英