HunyuanOCR

⚠️

🔔 重要提示：请注意，当前模型的 Transformers 实现精度尚未完全对齐（团队正在修复）。此 Space 旨在供您快速体验模型，若需获得完整精度与最佳性能，我们推荐使用 vLLM 进行部署。

🔔 Important Notice: Please note that the current Transformers implementation of the model has not yet achieved full precision alignment (the team is working on a fix). This Space is intended for quick model experimentation. For full precision and optimal performance, we recommend deploying via vLLM.

💬 对话窗口

📚 快速体验示例 - 点击下方卡片快速加载

✨ 核心功能

🎯 高精度文字检测识别 - 支持多场景文字检测与识别
📐 智能文档解析 - 自动识别文档结构，支持多粒度文档解析
📋 信息提取 - 支持30+高频卡证票据识别和结构化输出
✏️ 视觉问答 - 支持以文本为中心的开放式问答
🌍 跨语言翻译 - 支持中英互译及14+语种译为中英文

💡 使用建议

推理框架 - 正式生产推荐使用VLLM，以获取更好的推理性能和精度
拍摄角度 - 确保图片清晰，光线充足，分辨率适中，避免严重倾斜、遮挡或反光，正面拍摄效果最佳
文件大小 - 建议单张图片不超过 10MB，支持 JPG/PNG 格式
使用场景 - 适用于文字检测识别、文档数字化、票据识别、信息提取、文字图片翻译等
合规使用 - 仅供学习研究，请遵守法律法规，尊重隐私权

本系统基于 HunyuanOCR 构建 | 仅供学习研究使用