智谱开源GLM-OCR模型:多个领域性能接近Gemini-3-Pro,主打“小尺寸、高精度”
创始人
2026-02-03 11:18:19

2月3日,智谱(02513.HK)官微宣布正式发布并开源GLM-OCR。

据介绍,作为一款轻量的专业级OCR模型,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。

公司表示,尽管GLM-OCR参数量仅0.9B,但在权威文档解析榜单OmniDocBench V1.5中以94.6分取得SOTA性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款OCR专项模型,性能接近Gemini-3-Pro。

相关内容

热门资讯

大兴区举行校园春晚,师生创新演... 1月26日,北京市大兴区第二届校园春晚精彩上演。本场晚会以“童心筑梦新国门 骏马欢腾启新程”为主题,...
小米多项AI研究成果入选 IC... 今日,小米汽车创始人雷军发文表示,小米团队的多篇最新研究成果,成功入选 ICLR 2026,研究方向...
Vibe Coding,正在杀... 来源:市场资讯 (来源:极客公园) Vibe Coding 的繁荣,可能建立在开源生态的废墟之上。...
勐腊县象明乡:党建红引领生态绿... 坐落于古“六大茶山”核心腹地的勐腊县象明彝族乡,坐拥富集的古茶树资源与丰富的生物多样性,是名副其实的...
亲测!成都办会聚会这茶室超合适 上周刚在近悦茶体验馆办了场15人的读书会,必须来分享下体验。 先说核心:2700平的空间真的能打!一...