近日,杭州的 AI 公司 DeepSeek 推出的最新大型语言模型 V3,在业界引发了强烈反响
12。该开源模型在多项基准测试中的表现与 OpenAI 的 4o 以及 Anthropic 的 Claude3.5Sonnet 极为接近,令人刮目相看
12。尤其值得一提的是,相较于美国同行训练大模型动辄数亿美元的投资,DeepSeek 的 V3 模型总
成本仅约 557 万美元,如此巨大的成本差异着实令人瞩目
2。
DeepSeek 的首席执行官梁文峰表示,资金对他们而言并非关键问题,尽管 V3 是基于 H800 芯片进行训练的,但 DeepSeek 的团队在资源有限的情况下,依旧展现出了卓越的研究与工程能力2。
AI 领域的先驱 Andrej Karpathy 对此评价道,DeepSeek 的投资预算看似 “微不足道”,然而最终所呈现出的成果却是 “在资源受限的条件下,展现出了高度令人钦佩的研究与工程水平”2。
AGI 一直被视作 AI 研究领域的 “圣杯”,一旦实现,将在解决问题和执行任务的能力上超越人类。相关专家预测,当 AGI 技术成熟之时,首个实现 AGI 的国家将在经济、科学以及安全等方面获得巨大的优势。