当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

  据介绍,DeepSeek-OCR 参数量约3B ,是对“光学二维映射压缩”技术在长文本上下文处理中的可行性的一次初步探索deepseek

  模型核心由 DeepEncoder 与 DeepSeek3B-MoE-A570M 解码器构成:DeepEncoder 负责在高分辨率输入下保持低激活状态,实现高压缩比并生成适量视觉token,解码器则负责将这些 token 转化为精确文本信息。原文出处:DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本” 的相关文章

张骏吐槽DeepSeek过度思考致回答延迟

张骏吐槽DeepSeek过度思考致回答延迟

  #DeepSeek是很内耗的人工智能# 张骏又开启神吐槽模式!半决赛这轮他说在每次问Deepseek一些问题它都要自己盘问一番,比如你问它1+1等于几,它会先说:用户现在问我1+1等于...

DeepSeek崩了引热议,官方深夜回应:网页API已恢复

DeepSeek崩了引热议,官方深夜回应:网页API已恢复

  8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题”DeepSeek崩了“反馈服务异常。根据DeepSeek在官网发布...

天风证券:DeepSeek V3.1版本正式发布,坚定看好中国AI投资机会

天风证券:DeepSeek V3.1版本正式发布,坚定看好中国AI投资机会

  表示,中国AI板块延续模型与应用双线共振的积极趋势,一方面,国产模型能力持续演进deepseek。DeepSeek发布V3.1版本,重点增强了代码理解与Agent任务的执行能力,Dee...

DeepSeek与智谱将发布新模型

DeepSeek与智谱将发布新模型

  9月29日,AI从业者发现DeepSeek-V3.2新模型已被上传至社区平台HuggingFace,随后被删除。另外,记者了解到deepseek,智谱新模型GLM-4.6也将于近日发布...

成都汇阳投资关于大模型白热化,应用加速分化

成都汇阳投资关于大模型白热化,应用加速分化

  多模态技术路线尚未收敛 , 国内外大模型厂商持续刷新 SOAT。 图片领域 ,GPT-4o 图像生成功能引发热潮后 ,谷歌 Gemini 2.5 Flash Image登顶 多主流图像...

文化视角解读DeepSeek:《东方智慧与AI新文明》新书发布

文化视角解读DeepSeek:《东方智慧与AI新文明》新书发布

  9月27日,在喜迎新中国成立76周年之际,“全国油气田高质量发展研讨会暨油气田企业文化精品图书发布会”在京举行。会上,《东方智慧与AI新文明——DeepSeek横空出世与“河出图、洛出...