前沿热点:DeepSeek团队发布新型视觉压缩模型DeepSeek-OCR
(相关资料图)
智通财经APP获悉,10月20日,DeepSeek-AI团队推出全新研究成果——DeepSeek-OCR,提出通过视觉模态压缩长文本上下文的创新方法,即是把长长的上下文渲染成一张图片再喂给模型,让原本需要数千上万个文本token的上下文,只需几百个视觉token就能表示,实现信息的高效压缩。
据悉,DeepSeek-OCR由两个部分组成:核心编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M。DeepEncoder专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉token数量在可管理的范围内。
实验显示,当文本token数量不超过视觉token的10倍(压缩比低于10x)时,模型的OCR(文字识别)精度可达97%;即便压缩比提高到20x,准确率仍保持约60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR同时具备较高的实际应用价值。
在OmniDocBench测试中,DeepSeek-OCR使用100个视觉token就超过了阶跃星晨的GOT-OCR2.0(每页256个token),而使用不到800个视觉token便优于上海AI实验室的MinerU2.0(平均每页超过6000个token)。在实际生产中,DeepSeek-OCR可在单块A100-40G显卡上每天生成超过20万页的大语言模型/视觉语言模型训练数据。
您可能也感兴趣:
为您推荐
中国红APP正式上线发布
第十二届东亚地方政府会议将在山东临沂召开 促进东亚地区交流合作
(乡村行·看振兴)山西柳林依托“数商兴农”打造乡村e镇 电商交易9个月达3.5亿元
排行
最近更新
- 前沿热点:DeepSeek团队发布新型视觉压缩模型DeepSeek-OCR
- 每日速读!香农芯创:新动能基金拟减持公司不超1%股份
- 焦点热门:伊之密:公司A3系列产品采用了自主研发的第三代伺服...
- 热点!中国移动:前三季度股东应占利润1154亿元 同比增长4%
- “一小时送达”成日常,送货为何这么快?|焦点信息
- 喜报!J 博士获软博会双奖
- 权凌云:墨韵花香里的艺途之旅
- 美芯晟第三季度归母净利润531万元 营收同比增66.3% 当前热讯
- 权凌云:墨韵花香里的艺途之旅
- 百利好:金价上看4600,回调就是机会!
- 以赛促消费,以节聚人气!FISE城市运动嘉年华10.16西岸盛大启幕
- 今日热门!多功能吊具破解高铁架梁难题 实现多规格箱梁“无缝...
- 动态:中国(济南)第十届文房四宝暨珠宝玉石博览会落幕
- 金秋万达酒店多城同开,构筑中高端品牌矩阵,深耕新一线市场
- 已开售!全球首款外用非那雄胺喷雾剂(纷永维®Finjuve®)登...
- 准备上市前夕,宇树科技再发仿生机器人新品|今日热门
- 即时:北信瑞丰优选成长三季报:坚守大消费今年来跌3.26%,规...
- 国家金融监督管理总局两江监管分局核准郭今交通银行重庆两江...
- 2025中国VR50强企业发布 实时
- 第十届中国大学生公共关系策划创业大赛总决赛圆满结束
- 富国智悦稳健FOF今日首发,以多元资产配置把握投资机遇 百事通
- 每日观点:国家金融监督管理总局海南监管局核准王佳涛中国农业...
- 中国联通:智慧助老暖人心 温情服务伴银龄
- 放下手机,拾起思考|云南文山中托盟校区开展“手机利弊”主...
- 焦点滚动:10月20日国内硝酸市场行情动态
- 基金资产配置怎样平衡债券股票?
- 山东青岛:河海湿地披红装 深秋红海滩美如画 百事通
- 2025 怎么炒黄金?新手避坑指南 + 正规平台选择技巧
- 欧定发布2025冬季新品 科技创新引领商务着装变革
- 焦点简讯:PriceSeek提醒:中国LPR利率公布影响商品市场


