HunyuanOCR

Powered by Tencent Hunyuan Team

⚠️

🔔 重要提示:请注意,当前模型的 Transformers 实现精度尚未完全对齐(团队正在修复)。此 Space 旨在供您快速体验模型,若需获得完整精度与最佳性能,我们推荐使用 vLLM 进行部署。

🔔 Important Notice: Please note that the current Transformers implementation of the model has not yet achieved full precision alignment (the team is working on a fix). This Space is intended for quick model experimentation. For full precision and optimal performance, we recommend deploying via vLLM.

📚 快速体验示例 - 点击下方卡片快速加载
文字检测识别
文档解析
信息抽取
视觉问答
图片翻译
✨ 核心功能
  • 🎯 高精度文字检测识别 - 支持多场景文字检测与识别
  • 📐 智能文档解析 - 自动识别文档结构,支持多粒度文档解析
  • 📋 信息提取 - 支持30+高频卡证票据识别和结构化输出
  • ✏️ 视觉问答 - 支持以文本为中心的开放式问答
  • 🌍 跨语言翻译 - 支持中英互译及14+语种译为中英文
💡 使用建议
  • 推理框架 - 正式生产推荐使用VLLM,以获取更好的推理性能和精度
  • 拍摄角度 - 确保图片清晰,光线充足,分辨率适中,避免严重倾斜、遮挡或反光,正面拍摄效果最佳
  • 文件大小 - 建议单张图片不超过 10MB,支持 JPG/PNG 格式
  • 使用场景 - 适用于文字检测识别、文档数字化、票据识别、信息提取、文字图片翻译等
  • 合规使用 - 仅供学习研究,请遵守法律法规,尊重隐私权

© 2025 Tencent Hunyuan Team. All rights reserved.

本系统基于 HunyuanOCR 构建 | 仅供学习研究使用