华中科大与金山办公发布MonkeyOCR迭代成果 文档解析在国际榜单登顶引关注

全球数字化浪潮下,企业对非结构化数据的处理需求急剧增长;国际数据公司(IDC)数据显示,企业数据中超过80%为非结构化文档,这些包含复杂表格、多语言混排的数据严重制约了知识管理效率。传统大模型在该领域表现欠佳,权威评测OCRBench v2显示,现有模型对复杂文档的解析准确率不足60%。

非结构化文档的数据治理已成为企业AI应用成效的关键因素;企业内部散落的非结构化数据的收集和治理直接影响AI应用效果。MonkeyOCR模型的突破表明,通过产学研深度融合和针对性技术创新,我国完全可以在文档智能等关键领域实现自主可控和国际领先。唯有将企业知识充分盘活,才能真正转化为驱动业务发展的生产力,这也是推动人工智能技术造福各行各业的必然要求。