DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

业界
2025
10/21
09:51
快科技
分享
评论

10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

【来源:快科技

THE END
广告、内容合作请点击这里 寻求合作
DeepSeek
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

北京时间10月17日,《连线》杂志周四发文,分析了字节跳动旗下AI助手豆包是如何成为中国最受欢迎聊天机器人的。
业界
9 月 18 日消息,DeepSeek 昨晚发布官方声明:近期,有不法分子冒充“深度求索”(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个平台以“算力租赁”、“股权融资”等名义向用户收取费用实...
业界
5月30日消息,日前,DeepSeek R1模型迎来重磅升级,正式发布DeepSeek-R1-0528全新版本。
业界
5月15日,OPPO在广东珠海正式推出备受瞩目的Reno14系列手机,搭载更AI的ColorOS 15,深度整合DeepSeek大模型,支持全新小布记忆和升级的AI灵感成片。
业界
4月18日消息,日前,应中国贸促会邀请,英伟达CEO黄仁勋抵达北京,中国贸促会会长任鸿斌与黄仁勋举行会谈。
业界

相关推荐

1
3