智谱开源GLM-OCR模型:多个领域性能接近Gemini-3-Pro,主打“小尺寸、高精度”
财闻
2026-02-03 09:13:54
作为一款轻量的专业级OCR模型,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。
2月3日,智谱(02513.HK)官微宣布正式发布并开源GLM-OCR。
据介绍,作为一款轻量的专业级OCR模型,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。
公司表示,尽管GLM-OCR参数量仅0.9B,但在权威文档解析榜单OmniDocBench V1.5中以94.6分取得SOTA性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款OCR专项模型,性能接近Gemini-3-Pro。


