当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

7个月前 (02-25)Deepseek最新资讯393

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

“以前识别假新闻看三要素:错别字、夸张标题、模糊图片。现在?连亲妈发来的生日祝福视频都可能是AI(人工智能)造的!”网络安全博主“代码侠”在直播间举起两瓶矿泉水,左边贴着“DeepSeek出品”标签,...

车企金融公司仅用三天部署“DeepSeek+智能营销中心”

车企金融公司仅用三天部署“DeepSeek+智能营销中心”

上海电信助力汽车金融机构实现“AI自由”作者/ IT时报记者 郝俊慧编辑/ 钱立富 孙妍乘着DeepSeek东风,越来越多的企业低成本完成了自己的“AI初体验”。最近,一家知名车企金融子公司仅用三天时...

极光Adpub接入DeepSeek,开创应用变现新模式

极光Adpub接入DeepSeek,开创应用变现新模式

中国领先的客户互动与营销科技服务商极光(Aurora Mobile)宣布,其广告变现平台Adpub已成功接入先进的大语言模型(LLM)DeepSeek。通过这一接入,Adpub将充分利用DeepSee...

海南机场接入DeepSeek大模型,加速智慧机场建设步伐

海南机场接入DeepSeek大模型,加速智慧机场建设步伐

2月23日,海南机场成功接入DeepSeek人工智能大模型,在智慧民航领域踏出创新重要一步,为其数字化转型添上关键一笔。据悉,此次接入基于私有化架构,融合企业级向量知识库技术,将核心业务数据存储于专属...

方大集团:已部署应用DeepSeek公司大模型,并已在公司的企业管理等方面应用

方大集团:已部署应用DeepSeek公司大模型,并已在公司的企业管理等方面应用

 证券日报网讯 方大集团3月14日在互动平台回答投资者提问时表示,公司高度重视智能化转型与创新技术应用,已部署应用DeepSeek公司大模型,并已在公司的企业管理等方面应用。公司目前正在推进DeepS...

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

       应用中的DeepSeek医疗智能操作系统。  近日,保山市人民医院紧跟国内人工智能趋势,正式完成DeepSeek医疗智能系统的本地化部署,这一举措...