首页 科技快讯 突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋

突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋

来源:晰数塔互联网快讯 时间:2026年06月18日 17:14

(来源:智能纪元AGI)

就在1小时前,融完500亿的DeepSeek,开始全量上线网页版的视图模式,App版本开始进入内测阶段。

我也用它尝试识别了一些物品和文字。

我用DeepSeek识图模式识别了今天上午生数和清华团队发布的最新论文首页截图,用时2秒钟。

也用DeepSeek识别了黄仁勋本人,当然也可能是名牌英文的原因,最后用时5秒,DeepSeek轻松识别了黄仁勋本人,以及拍摄的背景。

当然,它也有很多幻觉。我用DeepSeek识别大晓机器人创始人王晓刚,输出的是宇树科技创始人王兴兴。

(王兴兴和梁文锋同在杭州,应该不会计较的)。

DeepSeek多模态研究员陈小康说,如果当年有 DeepSeek,今年是不是就没有"鹅姨战争"了。

事实上,两个月之前,DeepSeek识图模式已经正式灰度落地。

作为原生视觉交互入口,DeepSeek识图模式与快速模式、专家模式并列作为独立一级功能,彻底摆脱了早期纯文本大模型的能力局限,实现图文一体化对话体验。

当时,DeepSeek V4系列彻底引爆科技圈后,DeepSeek内部负责多模态的研究员陈小康在X上发布了一条贴文,并且附上了文字,开测识图模式,让全网热议了一整年的多模态能力实现落地了。

然而,一夜之间,DeepSeek撤回了这个技术github仓库信息。

当时媒体猜测,这可能是DeepSeek对于多模态技术成果并不满意,公测规模有点大。

需要提醒的是,DeepSeek识图模式并非简单的图片文字提取工具,或是简单OCR工具,而是依托自研 DeepSeek-OCR2 视觉因果流机制搭建完整视觉理解闭环。

用户只需直接上传图片搭配文字提问,系统就能同步完成物体识别、场景解析、图表拆解、精细文字提取与细节挖掘。

整套多模态模型采用 284B 总参数、13B 动态激活参数的 MoE 架构,以 DeepSeek-V4-Flash 文本大模型为骨干,搭配自研 DeepSeek-ViT 视觉编码器完成图像切块编码,再通过空间压缩与稀疏注意力机制大幅削减视觉 token 占用,单张标准分辨率图片仅消耗约 90 个词元,整体视觉特征压缩倍数可达七千倍以上。

在降低算力消耗、加快推理速度的同时,保留图像精细空间信息,大幅提升计数、空间拓扑、多层图表解析这类高难度任务的准确率。

根据论文显示,支撑识图模式运行的核心底层技术是 DeepSeek 提出的视觉原语推理框架,而这套框架把坐标点、边界框这类空间标记作为模型推理的基础思维单元,相当于让 AI 思考时可以同步在图像上精准锚定目标,实现 “边推理、边定位” 的逻辑链条。

从基础的看图描述延伸到逻辑推导层面,既能识别日常实物、文档表格、专业图表,也能捕捉画面里微小文字、光影矛盾等人眼容易忽略的信息。

整体毫秒级轻量化响应,和文本对话的操作链路完全打通,不需要切换额外工具,普通用户、科研从业者、职场处理报表图纸都能直接使用这套识图能力开展分析、解读、问答交互。

如今,DeepSeek完成了首轮510亿元融资,企业估值约为4000亿元。

DeepSeek的母公司幻方量化由梁文锋创立于2015年,巅峰时期资产管理规模突破700亿元。

据媒体报道,梁文锋正是凭量化业务积累的利润,才支撑了DeepSeek“不融资、不商业化、不路演”的极简运营模式。直到今年6月初,DeepSeek才被曝正式启动首轮外部融资。

据中国基金报报道,在DeepSeek的A轮融资中:创始人梁文锋或出资约200亿元,为本轮融资中最大单一出资方。腾讯出资约100亿元;宁德时代体系出资约50亿元,其中包括宁德时代及溥泉资本;网易、京东、Monolith砺思资本、IDG资本分别出资约30亿元;正心谷投资、拾象科技分别出资约15亿元,国家人工智能产业投资基金出资约9.8亿元。

值得注意的是,全球动力电池和储能电池领域的龙头宁德时代也出现在出资名单中,且出资额在外部投资方中位列第二,仅次于腾讯集团的100亿元。

目前,Vision识别模式现已在网页和应用上正式上线。

可以来试试这双新眼睛吧,顺便也体验一下它的纯文本功能。

相关推荐

突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋
DeepSeek识图模式大范围开放,开启图文交互新时代
黄仁勋首度回应DeepSeek冲击:算力需求将不减反增
黄仁勋首次回应DeepSeek冲击波:市场理解完全反了,本质上利于AI计算需求
一场英伟达GTC,黄仁勋释放出三大信号
英伟达发布全新AI处理器,黄仁勋盛赞DeepSeek
黄仁勋警告:DeepSeek绑定华为芯片,美国将失去AI话语权
DeepSeek大范围开放了识图模式,正式跨入图文交互时代
黄仁勋已结束中国之行,知情人士称未与DeepSeek会面
黄仁勋在中国DeepSeek大型发布前失控,罕见失态的美国AI未来焦虑

网址: 突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋 https://www.xishuta.cn/newsview150599.html

所属分类:行业热点

推荐科技快讯