当前位置:首页 > Deepseek最新资讯 > 正文内容

打败月之暗面的,不是广东老乡的DeepSeek

5小时前Deepseek最新资讯12

  “我们是典型的技术理想主义团队,用时间换空间,用积累换突破。”就在两个月前,月之暗面团队还如此形容自己的创业理念。然而,当这家明星AI初创公司最近推出会员付费模式后,却因发布虚假链接、退款封号等问题遭声讨。

  从估值超30亿美元的AI独角兽,到因付费问题引发部分用户不满,月之暗面的发展轨迹颇具戏剧性。

  创始人杨植麟,这位广东汕头走出的“中国大模型90后第一人”,在2023年4月创立月之暗面时,或许未曾料到,公司会如此迅速地面临严峻的商业化考验。

  而更富戏剧性的是,将杨植麟推向当前困境的竞争对手DeepSeek,创始人梁文锋是一位老乡,来自广东湛江。

  这位少年天才高中就读于汕头百年名校金山中学,凭借优异的奥赛成绩获得清华大学保送资格。尽管已经保送,杨植麟在当年高考中还是拿下了667分的高分,远超清华大学在广东的录取分数线。

  2015年,杨植麟以年级第一的成绩从清华大学毕业,随后远赴卡内基梅隆大学语言技术研究所学习和工作deepseek,2019年获得博士学位。

  其间,杨植麟成了AI领域的风云人物,他与多位图灵奖得主合作发表过论文,在ICLR、NeurIPS、ICML、ACL、EMNLP等计算机顶会发表论文20余篇,研究成果累计被Google Scholar引用超过17000。

  2023年,早已是业内技术大牛的杨植麟,选择创立北京月之暗面科技有限公司。公司成立不到2个月,便斩获红杉中国、今日资本、真格基金等知名机构的投资,拿下近20亿元融资。

  这仅仅只是开始。天眼查显示,2023年6月至2024年8月,月之暗面共计完成4轮融资,估值超30亿美元。

  在资本的热捧下,月之暗面迅速成为国内大模型领域最具话题性的公司之一,与MiniMax、智谱AI、零一万物、百川智能、阶跃星辰并称为“AI六小虎”。

  正当月之暗面高歌猛进之时,2025年年初,DeepSeek横空出世,给杨植麟来了一记“当头棒喝”。

  彼时,月之暗面旗下的AI产品kimi,通过大量烧钱费时一年时间,也只获得了不足千万量级的日活用户。而DeepSeek的开源模型,在未投一分钱广告、纯靠开发者口碑传播之下,不仅7天内狂揽1亿用户,几十天内在自然流量上也达到3500万DAU(日活跃用户)。

  与杨植麟一样,DeepSeek的创始人梁文锋同样来自广东,打小亦为学校尖子生。当年,梁文锋以家乡高考状元的身份考入浙江大学电子信息工程专业,随后继续攻读信息与通信工程硕士学位。

  毕业后,梁文锋先后在网易、阿里巴巴等互联网企业积累实战经验;2015年创立杭州幻方科技有限公司,后更名为浙江九章资产管理有限公司,即幻方量化。

  梁文锋将人工智能应用于投资领域,幻方量化在短时间内迅速崛起,成为中国量化私募领域“四大天王”之一,管理规模突破千亿元。

  不安于现状的梁文锋,2021年开始从英伟达购买数千块GPU,为进军AI领域做准备。2023年5月,梁文锋推出DeepSeek,作为资助人工智能实验室High-Flyer的一个分支。

  2023年10月,月之暗面推出首款大模型产品智能助手Kimi Chat。在当时“百模大战”的激烈竞争中,Kimi以其支持20万字长文本处理的独特能力,一举脱颖而出。

  长文本能力成为了Kimi的杀手锏。在杨植麟看来,长文本只是“登月第一步”。大模型的长文本处理能力如同计算机的内存,内存越大,模型能够处理的信息量和复杂任务的能力就越强。

  半年内,月之暗面团队又将长文本能力从20万字扩展至200万字。这种技术上的坚持,为其赢得了大量用户的认可。

  AppGrowning平台数据显示,2024年3月开始,Kimi几乎每个月的广告投放均达上千万元;当年10月、11月广告投放金额更是分别达到2.2亿元和2亿元。

  高调的烧钱方式,短时间内确实为Kimi带来了流量上的剧增。据杨植麟透露,2024年10月,kimi的月活超过3600万,彼时其用户数亦超过3600万。

  然而,这种依靠巨额资金驱动的增长模式,很快便显露出局限性。加上DeepSeek的冲击,月之暗面内部不得不重新思考策略。

  2025年2月,月之暗面决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。月之暗面的市场声量也随之减弱。

  但市场将月之暗面与DeepSeek的对比却并未因此而减少。2025年2月18日,DeepSeek与月之暗面几乎同时发布论文,前者由梁文锋亲自提交;后者,杨植麟的名字则罕见地出现在论文作者的关键位置。

  更为巧合的是,二者的新论文想要解决的是同一个问题:挑战一直困扰大模型的Transformer架构的注意力机制,通过自研的架构使其能处理更长的上下文。

  表面上的不同在于,DeepSeek提出的新架构名为NSA(原生稀疏注意力),而月之暗面提出的新架构命名为MoBA(混合块注意力机制)。

  但实际的区别是,DeepSeek的改造更为果断和彻底,而月之暗面兼顾了老机制和新机制,动态平衡,即为混合。

  在NSA论文中提到,现有稀疏注意力方法存在局限性:多数方法仅在推理阶段应用稀疏性,而保留预训练的全注意力(Full Attention)主干。这种做法可能引入架构偏差,限制模型充分挖掘稀疏注意力的优势。

  DeepSeek认为牺牲部分性能但是兼顾二者的方式具有局限性,试图从根本上重新设计稀疏注意力机制,遂提出了NSA。

  尽管月之暗面同样认为现有的方法都行不通,但它们的解法是保留Transformer框架的同时遵循稀疏结构的原则,使模型能够在全注意力机制和稀疏注意力之间过渡。

  据统计,当前主流AI应用活跃率均在20%以下,用户月均使用天数基本都在3-5天,3日留存率均不到40%,30日留存不到1%。产品平均留存周期从6个月缩短至17天。

  同时,IDC 数据显示,2023年到2024年两年间,一共涌现出将近200款AI应用,如今已有67%停止版本更新。

  零一万物创始人李开复直言不讳地指出:“我们现在已经加速到了‘灵魂拷问’阶段,每家大模型公司都需要回答一个问题:有没有能赚钱的商业模式?”

  同样的困惑也困扰着月之暗面——在获得了阿里、腾讯等巨头的巨额投资后,公司始终未能找到稳定的盈利模式。

  2025年5月,Kimi开始了商业化尝试,推出了打赏功能,用户可通过购买5.20元至399元不等的礼物,获取不同的高峰期优先使用时长。

  对此,月之暗面方面表示,打赏功能是一个小探索,是Kimi了解用户的方式,并强调Kimi的商业化会逐步开始探索,但还不是目前的重点。

  面对商业化压力,月之暗面并未放弃技术追求。2025年7月,公司发布了万亿参数开源模型Kimi K2,一举登顶全球开源模型榜首。

  Kimi K2在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等基准性能测试中,均取得开源模型中的SOTA成绩(当前最佳表现)。发布6天,已在全球最大AI开源平台HuggingFace上收获10万+下载,1400+点赞。

  对此,Hugging Face联合创始人托马斯评价称:“来自中国的Kimi团队在过去几个月推出的系列模型令人印象深刻,K2更是挑战了闭源模型的极限。”

  技术上的光环却未能转化为商业上的成功。9月底,月之暗面打破国内AI大模型长期免费的传统,上线付费会员服务——Kimi Agent 模式“OK Computer”开始灰度测试,并同步上线不同付费等级的会员体系。用户的投诉也随之而至。

  在黑猫投诉上,有用户投诉称,买了kimi的99元/月的Moderato的服务,要求生成文件,发过来的全部都是虚假链接;要求申请退费,结果公司也没有客服。

  此外,还有用户在小红书上表示:“我付费49元订阅Kimi‘登月计划’,但体验差强人意,客服强硬拒绝退费,称一旦开通不支持退费。强烈建议大家谨慎选择,避免类似问题。”

  在技术的长跑里,快钱或许能买到流量,但买不到信仰。月之暗面的故事,像极了AI版的《龟兔赛跑》——当“技术兔”沉迷商业化捷径时,“开源龟”却靠持久战逆袭。

  面对未来,月之暗面需要回答的核心问题是:如何让技术理想与商业现实实现平衡。而会员付费暴露出的用户槽点,或仅仅只是问题的开始。原文出处:打败月之暗面的,不是广东老乡的DeepSeek,感谢原作者,侵权必删!

标签: deepseek

“打败月之暗面的,不是广东老乡的DeepSeek” 的相关文章

事事关心 | “智能时代 同球共济” 中国发起倡议

事事关心 | “智能时代 同球共济” 中国发起倡议

  凭借多年的搜索与大模型技巧积累,坚持破和立的辩证统一,坚持革新和开放相统一,当时,习总揭橥首要讲话,一年来,切实做到“直面抵触问题不逃避,又一场会议。   百度在意图...

全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚36%傲视群雄

全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚36%傲视群雄

  Nof1 为了检验顶尖大语言模型在真实市场环境下的交易能力,给 6 个顶级模型 1 万美元的真金白银,在去中心化交易所 Hyperliquid 的加密货币永续合约市场中展开为期三天的对...

挑战OpenAI!消息称DeepSeek今年底推出更先进模型:具备AI智能体能力

挑战OpenAI!消息称DeepSeek今年底推出更先进模型:具备AI智能体能力

  据9月4日彭博社援引知情人士消息,DeepSeek正在开发一款具备更先进AI智能体功能的人工智能模型。该模型将能够在用户仅提供最少指令的情况下,代表用户完成多步操作,并能根据以往操作不...

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

  今年以来截至8月11日,半导体设备ETF(561980)跟踪的中证半导指数累涨6.53%,领跑同类指数,寒武纪权重占比达8.19%,“寒王”权重在同类型指数中相对较高。...

青云上线DeepSeek-V3.1-Terminus,更强Agent能力

青云上线DeepSeek-V3.1-Terminus,更强Agent能力

  青云科技旗下 AI 算力云服务——基石智算CoresHub 已上线DeepSeek-V3.1-Terminus 新版模型,用户可立即在线体验或通过调用 API 使用deepseek。...

商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向

商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向

  7月28日,在2025世界人工智能大会(WAIC)期间,商汤大装置发布基于DeepLink的异构混合调度方案,将DeepLink深度融入商汤大装置核心能力体系。该方案针对当前国产算力资...