当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

10小时前Deepseek最新资讯10

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

DeepSeek预测:切尔西VS富勒姆!蓝军火力全开,内托领衔冲击三连胜!

DeepSeek预测:切尔西VS富勒姆!蓝军火力全开,内托领衔冲击三连胜!

  英超第3轮焦点战即将在斯坦福桥打响!切尔西目前以4分排名第4,而富勒姆2轮平局积2分位列第13。蓝军上轮5-1血洗西汉姆联展现恐怖火力(场均进球2.5),而富勒姆两场1-1暴露锋无力(...

DeepSeek预测:巴黎圣日耳曼VS朗斯,姆巴佩缺席,内维斯能否延续神勇?

DeepSeek预测:巴黎圣日耳曼VS朗斯,姆巴佩缺席,内维斯能否延续神勇?

  法甲第4轮即将上演一场焦点战,领头羊巴黎圣日耳曼将在王子公园球场迎战排名第5的朗斯。两队目前都保持全胜战绩,巴黎圣日耳曼以3战全胜积9分领跑积分榜,朗斯则以2胜1负积6分紧随其后。...

DeepSeek母公司总监被查!套取上亿佣金

DeepSeek母公司总监被查!套取上亿佣金

  幻方量化,是今年在科技圈惊艳四座的DeepSeek母公司,它们的创始人都是梁文锋。成立仅十年,其便因市场总监的行为卷入亿元级风暴。   据报道,李橙曾任职于招商证券,...

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

  马斯克不爽自家Grok没有上推荐榜,炮轰苹果偏袒合作伙伴OpenAI,威胁要起诉苹果涉嫌垄断操纵应用商店,却被网友用中国应用DeepSeek光速打脸,更被自家的Grok...

又是梅西粉丝集体沉默的一天

又是梅西粉丝集体沉默的一天

  这都发到乒乓球区了,是不是怕人知道今天梅西助攻梅开二度,补时助攻队友绝杀,罗密还不得哭天喊地?   这都发到乒乓球区了,是不是怕人知道今天梅西助攻梅开二度,补时助攻队...

小米AI新论文!雷军千万年薪要挖的DeepSeek天才少女署名

小米AI新论文!雷军千万年薪要挖的DeepSeek天才少女署名

  曾被曝获小米集团创始人兼CEO雷军以千万年薪招募的DeepSeek“天才少女”罗福莉,出现在了这篇论文的通讯作者之列   通讯作者中的罗福莉是95后,她本科就读于北京...