2024年12月DeepSeekv3基座大模型发布震惊硅谷,如今备受期待的DeepSeekv4将于4月下旬正式上线。其最大优势在于高性价比,且有望补齐短板,在编程、企业级AI Agent平台等方面表现值得关注。
2024年12月DeepSeekv3发布震惊硅谷,2025年1月R1推理大模型在Arena排行榜性能接近OpenAI的o1-preview,且训练成本仅为其数十分之一。如今人们盼望的DeepSeekv4即将上线,虽未发布但进展信息不断透露。
DeepSeek不断改进稀疏化结构的混合专家模型MoE,成本从1/20降至1/60甚至1/100。西方企业也用MoE降本,但效果不如DeepSeek。若DeepSeek成本降至1/20且性能不低于西方80%,有望在对比中取胜。
在编程领域竞争白热化,Anthropic的Claude Opus 4.7编程能力大幅提升。DeepSeek虽试图编程登顶较难,但有望跻身全球编程前列。
全球四大AI Agent平台竞争激烈,企业级AI Agent平台关键在企业场景落地。DeepSeek - v4的AI Agent平台表现有望排名前列,v3.1在GAIA测试中排名第二可作参考。
DeepSeek - v4将英伟达的CUDA全面转向华为的CANN,摆脱对英伟达硬件依赖,倒逼中国建立算力自主生态闭环,获取算力“规划制定权”和“生态主导权”。
编辑观点:DeepSeekv4亮点颇多,性价比、编程及企业级平台表现值得期待,其在国产算力上的突破更具战略意义,有望推动行业发展。