当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

8个月前 (02-25)Deepseek最新资讯449

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

教育行业拥抱DeepSeek的浪潮还在继续 学而思×DeepSeek,首发超级学习应用“随时问”

教育行业拥抱DeepSeek的浪潮还在继续 学而思×DeepSeek,首发超级学习应用“随时问”

全教育行业拥抱DeepSeek的浪潮还在继续,在产品层面的落地和结合也开始带来惊喜。学而思今天正式发布接入DeepSeek的全新“随时问”APP。该产品深度融合DeepSeek R1智能推理,依托学而...

如何利用 deepseek 高效开发 策略轮动模型 ?

如何利用 deepseek 高效开发 策略轮动模型 ?

近期如何利用deepseek非常火热,我们这些做量化投资的经常重复性的工作就是编程,为此这个周末刚好方便,尝试:如何利用deepseek高效辅助编写量化策略的程序?恰好有个策略轮动模型想要编写测试,那...

《DeepSeek实战指南:从数据到财富》出版发行

《DeepSeek实战指南:从数据到财富》出版发行

近日,新华出版社推出人工智能领域新作《DeepSeek实战指南:从数据到财富》,该书深度解析中国大语言模型领域的“破局者”DeepSeek,指导读者在数据洪流中捕捉财富机遇,现已面向全国发行。该书深入...

甘咨询子公司已经开始接入DeepSeek平台并计划将其应用于相关业务流程中

甘咨询子公司已经开始接入DeepSeek平台并计划将其应用于相关业务流程中

甘咨询子公司已经开始接入DeepSeek平台并计划将其应用于相关业务流程中e公司讯,甘咨询在互动平台表示,公司正积极探索并研究人工智能与大数据等先进技术,包括深度求索(DeepSeek)在内的创新解决...

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

人工智能正以前所未有的深度和广度重塑全球经济格局,成为驱动商业升级的核心引擎。在科技与金融深度融合的今天,远东宏信以战略眼光拥抱变革,率先完成DeepSeek大模型的本地化部署,标志着公司在智能化转型...

DeepSeek你不要太爱普洱了

DeepSeek你不要太爱普洱了

今年春节中国AI公司深度求索开发的大模型DeepSeek火爆“出圈”今天让我们以“旅居”角度对话DeepSeek去看看它眼中旅居普洱是什么样的吧DeepSeek笔下的普洱对话DeepSeek解锁旅居普...