2024 年 12 月 26 日,国内一支成立仅一年多的 AI 团队推出了名为 DeepSeek V3 的模型,它在 14.8 万亿高质量 token 上进行预训练,还通过监督微调和强化学习进一步提升性能。 相较于其五个月前发布的版本,此次采用了多头潜在注意力 ( MLA ) 和 MoE 架构,引入无辅助损失的负载均衡策略和多 token 预测训练目标,实现了高效推理和低成本训练。 仅仅一个月后,该团队又发布了新模型 DeepSeek R1,它仅用相当于 OpenAI o1 三十分之一的成本却...
2025/03/06
美国东部时间1月20日,特朗普正式宣誓就任美国第47任美国总统,开启“特朗普2.0时代”。他将带领美国走向何方?又将如何影响全球?除了特朗普以外,2025年全球经济还将受哪些因素影响?惠誉评级首席经济师布莱恩.库尔顿(Brian Coulton)将为我们带来独家分析。...
2025/02/04