突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋
(来源:智能纪元AGI)

就在1小时前,融完500亿的DeepSeek,开始全量上线网页版的视图模式,App版本开始进入内测阶段。

我也用它尝试识别了一些物品和文字。
我用DeepSeek识图模式识别了今天上午生数和清华团队发布的最新论文首页截图,用时2秒钟。
也用DeepSeek识别了黄仁勋本人,当然也可能是名牌英文的原因,最后用时5秒,DeepSeek轻松识别了黄仁勋本人,以及拍摄的背景。

当然,它也有很多幻觉。我用DeepSeek识别大晓机器人创始人王晓刚,输出的是宇树科技创始人王兴兴。
(王兴兴和梁文锋同在杭州,应该不会计较的)。

DeepSeek多模态研究员陈小康说,如果当年有 DeepSeek,今年是不是就没有"鹅姨战争"了。
事实上,两个月之前,DeepSeek识图模式已经正式灰度落地。
作为原生视觉交互入口,DeepSeek识图模式与快速模式、专家模式并列作为独立一级功能,彻底摆脱了早期纯文本大模型的能力局限,实现图文一体化对话体验。
当时,DeepSeek V4系列彻底引爆科技圈后,DeepSeek内部负责多模态的研究员陈小康在X上发布了一条贴文,并且附上了文字,开测识图模式,让全网热议了一整年的多模态能力实现落地了。
然而,一夜之间,DeepSeek撤回了这个技术github仓库信息。
当时媒体猜测,这可能是DeepSeek对于多模态技术成果并不满意,公测规模有点大。
需要提醒的是,DeepSeek识图模式并非简单的图片文字提取工具,或是简单OCR工具,而是依托自研 DeepSeek-OCR2 视觉因果流机制搭建完整视觉理解闭环。
用户只需直接上传图片搭配文字提问,系统就能同步完成物体识别、场景解析、图表拆解、精细文字提取与细节挖掘。
整套多模态模型采用 284B 总参数、13B 动态激活参数的 MoE 架构,以 DeepSeek-V4-Flash 文本大模型为骨干,搭配自研 DeepSeek-ViT 视觉编码器完成图像切块编码,再通过空间压缩与稀疏注意力机制大幅削减视觉 token 占用,单张标准分辨率图片仅消耗约 90 个词元,整体视觉特征压缩倍数可达七千倍以上。
在降低算力消耗、加快推理速度的同时,保留图像精细空间信息,大幅提升计数、空间拓扑、多层图表解析这类高难度任务的准确率。
根据论文显示,支撑识图模式运行的核心底层技术是 DeepSeek 提出的视觉原语推理框架,而这套框架把坐标点、边界框这类空间标记作为模型推理的基础思维单元,相当于让 AI 思考时可以同步在图像上精准锚定目标,实现 “边推理、边定位” 的逻辑链条。
从基础的看图描述延伸到逻辑推导层面,既能识别日常实物、文档表格、专业图表,也能捕捉画面里微小文字、光影矛盾等人眼容易忽略的信息。
整体毫秒级轻量化响应,和文本对话的操作链路完全打通,不需要切换额外工具,普通用户、科研从业者、职场处理报表图纸都能直接使用这套识图能力开展分析、解读、问答交互。
如今,DeepSeek完成了首轮510亿元融资,企业估值约为4000亿元。
DeepSeek的母公司幻方量化由梁文锋创立于2015年,巅峰时期资产管理规模突破700亿元。
据媒体报道,梁文锋正是凭量化业务积累的利润,才支撑了DeepSeek“不融资、不商业化、不路演”的极简运营模式。直到今年6月初,DeepSeek才被曝正式启动首轮外部融资。
据中国基金报报道,在DeepSeek的A轮融资中:创始人梁文锋或出资约200亿元,为本轮融资中最大单一出资方。腾讯出资约100亿元;宁德时代体系出资约50亿元,其中包括宁德时代及溥泉资本;网易、京东、Monolith砺思资本、IDG资本分别出资约30亿元;正心谷投资、拾象科技分别出资约15亿元,国家人工智能产业投资基金出资约9.8亿元。
值得注意的是,全球动力电池和储能电池领域的龙头宁德时代也出现在出资名单中,且出资额在外部投资方中位列第二,仅次于腾讯集团的100亿元。
目前,Vision识别模式现已在网页和应用上正式上线。
可以来试试这双新眼睛吧,顺便也体验一下它的纯文本功能。
相关推荐
突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋
DeepSeek识图模式大范围开放,开启图文交互新时代
黄仁勋首度回应DeepSeek冲击:算力需求将不减反增
黄仁勋首次回应DeepSeek冲击波:市场理解完全反了,本质上利于AI计算需求
一场英伟达GTC,黄仁勋释放出三大信号
英伟达发布全新AI处理器,黄仁勋盛赞DeepSeek
黄仁勋警告:DeepSeek绑定华为芯片,美国将失去AI话语权
DeepSeek大范围开放了识图模式,正式跨入图文交互时代
黄仁勋已结束中国之行,知情人士称未与DeepSeek会面
黄仁勋在中国DeepSeek大型发布前失控,罕见失态的美国AI未来焦虑
网址: 突发!DeepSeek识图模式全量上线,可以5秒识别黄仁勋 https://www.xishuta.cn/newsview150599.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
