使用文本识别模块

您正在查看V2.5.1版本的文档。如果您想查阅其他版本的文档，可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您想使用最新版本，可以从梅卡曼德下载中心下载。

■ 如果您不确定当前使用的产品是哪个版本，请随时联系梅卡曼德技术支持。

以识别码数据（单击下载）为例，本节将展示如何使用“文本识别”模块训练出可识别和输出图像中字符（数字、字母及部分特殊符号）的模型。

用户可使用自己准备的数据。整体使用流程一致，标注环节存在差异。

新建工程并添加“文本识别”模块：单击初始页面上的新建工程按钮，选择工程路径并输入工程名称以新建一个工程。然后，单击右上角的，选择“文本识别”模块。
导入图像数据集：解压缩下载的数据压缩包后，在软件界面左上方单击导入 文件夹，导入下载好的图像数据。

为提升模型效果，“文本识别”模块前通常级联了其他模块，导入数据时应选择导入 从上一模块导入。
截取 ROI：单击 ROI 工具，框选能涵盖所有图像中文本区域的部分作为感兴趣区域，并单击标注界面上方的应用确认使用。截取 ROI 的目的是减少无关背景信息的干扰。
标注图像：在图像左侧标注工具栏选择“文本识别工具”进行标注。
划分训练集与验证集：软件默认将数据集的 80% 划分为训练集，20% 为验证集，可以单击拖动滑块调整图像占比。需要确保划分后的训练集和验证集中涵盖所有需要识别的文本类型，如果默认划分的数据集不满足这一条件，右键单击图像名称后选择“移到训练集”或“移到验证集”调整图像所属集合。
训练模型：使用默认参数设定，单击训练开始训练模型。
验证模型：训练结束后，单击验证可以验证并查看模型识别效果。
导出模型：单击导出模型，然后选择存放路径，即可导出模型。