HunyuanOCR
Powered by Tencent Hunyuan Team
⚠️
🔔 重要提示:请注意,当前模型的 Transformers 实现精度尚未完全对齐(团队正在修复)。此 Space 旨在供您快速体验模型,若需获得完整精度与最佳性能,我们推荐使用 vLLM 进行部署。
🔔 Important Notice: Please note that the current Transformers implementation of the model has not yet achieved full precision alignment (the team is working on a fix). This Space is intended for quick model experimentation. For full precision and optimal performance, we recommend deploying via vLLM.
📚 快速体验示例 - 点击下方卡片快速加载
✨ 核心功能
- 🎯 高精度文字检测识别 - 支持多场景文字检测与识别
- 📐 智能文档解析 - 自动识别文档结构,支持多粒度文档解析
- 📋 信息提取 - 支持30+高频卡证票据识别和结构化输出
- ✏️ 视觉问答 - 支持以文本为中心的开放式问答
- 🌍 跨语言翻译 - 支持中英互译及14+语种译为中英文
💡 使用建议
- 推理框架 - 正式生产推荐使用VLLM,以获取更好的推理性能和精度
- 拍摄角度 - 确保图片清晰,光线充足,分辨率适中,避免严重倾斜、遮挡或反光,正面拍摄效果最佳
- 文件大小 - 建议单张图片不超过 10MB,支持 JPG/PNG 格式
- 使用场景 - 适用于文字检测识别、文档数字化、票据识别、信息提取、文字图片翻译等
- 合规使用 - 仅供学习研究,请遵守法律法规,尊重隐私权
© 2025 Tencent Hunyuan Team. All rights reserved.
本系统基于 HunyuanOCR 构建 | 仅供学习研究使用