会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 百度文心发布 PaddleOCR 文心作为文心衍生模型!

百度文心发布 PaddleOCR 文心作为文心衍生模型

时间:2026-06-04 00:04:56 来源:闳识孤怀网 作者:焦点 阅读:518次

  近日,百度百度正式发布 PaddleOCR-VL-1.6。文心作为文心衍生模型,发布PaddleOCR-VL-1.6 在 OmniDocBench v1.6 权威评测中准确率突破 96.3%,百度在 Real5-OmniDocBench、文心OmniDocBench v1.5上也取得了最领先的发布分数,综合性能全球第一,百度刷新业界SOTA,文心在复杂文档理解和真实场景解析能力方面进一步突破。发布

  在OmniDocBench v1.6上,百度PaddleOCR-VL-1.6在多项能力中实现SOTA

  在权威评测集 OmniDocBench v1.6 上,文心PaddleOCR-VL-1.6 总指标达到 96.33%,发布超越Gemini-3-Pro、百度GPT-5.2、文心MinerU-2.5-Pro、发布GLM-OCR等,综合性能全球第一,领跑全球通用大模型和专用OCR模型;在面向真实复杂场景构建的 Real5-OmniDocBench 评测中,PaddleOCR-VL-1.6 总指标达到 93.19%,较 Gemini-3-Pro 提升近4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及倾斜文档等五大真实场景下均保持领先表现。

  测试结果显示,PaddleOCR-VL-1.6 在文本、公式、表格等核心识别能力上全面领先当前主流开源及闭源方案,在表格、古籍、生僻字识别等复杂场景能力显著提升,在印章、Spotting、图表识别等多项关键能力同步增强,可更好满足文档数字化的需求。

  据了解,PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖170多个国家和地区。此次发布的 PaddleOCR-VL-1.6 在 PaddleOCR-VL-1.5 基础上进一步升级,通过模型驱动的数据构建机制和渐进式训练优化,在保持0.9B轻量化架构的情况下,模型准确率和复杂场景适应能力进一步提升。由于两代模型模型结构一致,开发者和企业用户无需进行额外适配,即可平滑迁移。

  近年来,PaddleOCR 持续推进文档理解能力升级,先后推出 PaddleOCR-VL、PaddleOCR-VL-1.5 等多款模型。其中,PaddleOCR-VL-1.5 创新支持异形框定位,在真实文档场景中展现出较强解析能力。此前,PaddleOCR GitHub Star 数已突破79.2K,超过谷歌开源OCR项目 Tesseract OCR,成为全球最受开发者欢迎的开源OCR项目之一。

  目前,PaddleOCR-VL-1.6 已上线 PaddleOCR 官网,支持网页端和API调用。同时,模型代码及权重已同步开源至 GitHub 和 Hugging Face,面向全球开发者开放使用。

(责任编辑:百科)

相关内容
  • 一汽大众多款新车空调口狂喷粉末:官方称无害遭专家反驳
  • 小米17T全系标配徕卡5X潜望长焦:支持30cm长焦微距
  • 朱共山:全行业零和博弈,结果只能是“泥坑里打架没有赢家”
  • 朱共山:全行业零和博弈,结果只能是“泥坑里打架没有赢家”
  • Luna相机延迟到6月上市 刘靖康发文道歉:我临时加了需求
  • 一汽大众多款新车空调口狂喷粉末:官方称无害遭专家反驳
  • 宇树科技回应与英伟达合作机器人:新产品“H2 Plus”下半年上市
  • 谷歌母公司 Alphabet 宣布 800 亿美元大额融资,用于 AI 基础设施与算力建设
推荐内容
  • 天涯社区回归上线即被挤崩打不开 前执行总编:打不开也是一种重启成功
  • 阿里高层人事变化:吴泽明进入合伙人委员会,严筱磊改向蒋凡汇报
  • 4000元旗舰手机洗牌!iQOO 15 Ultra性价比登顶
  • 比亚迪罗忠良:千元级激光雷达已具备普及条件
  • 时薪最高304元 可远程兼职!马斯克旗下xAI全球招募中文AI训练师
  • 千亿育儿补贴下发!国家“真金白银”加码“催生”