如是古籍数字化工具平台用户手册
如是古籍数字化工具平台用户手册
V1.0
(2021-11-17)
一、平台简介
“如是古籍数字化工具平台”是由北京如是人工智能技术研究院(简称“如是研究院”)自主研发的、开放的古籍数字化系统,旨在为古籍数字化相关单位和个人提供一套强大而又简单易用的古籍数字化生产工具。
平台采用了先进的深度学习OCR算法(核心技术由华南理工大学电信学院深度学习与视觉计算团队提供支持),基于大量的古籍标注数据,从而实现了古籍文字识别的高准确率,同时提供一套基于浏览器的、简便易用的校对工具,从而有助于用户简单、高效的完成古籍数字化作业。
平台网址是:https://guji.rushi-ai.net:800,海外用户如无法访问,则可以访问镜像网站:https://guji.world.rushi-ai.net
图1-1 如是古籍数字化工具平台首页
平台提供如是OCR、智能标点、标点迁移、多文本比对等功能。
如是OCR
智能标点
  • 基于人工智能的古籍OCR技术
  • 切分校对:调整字框、列框和栏框
  • 文字校对:提供按列校对、按页校对模式
  • 数据管理:对用户上传的图片数据进行管理
  • 基于人工智能的自动标点技术
  • 数据管理:对用户上传的标点数据进行管理
标点迁移
多文本比对
  • 两份相似文本,一份含标点,一份无标点,将标点一键迁移至无标点的文本中
  • 数据导出
  • 对多份文本同时进行比对,列出异文
  • 数据导出
个人用户可以在“我的图片”“我的标点”中,对OCR数据和标点数据进行管理。
另外,平台还支持团队用户模式(需向我们提出申请),团队管理员可以进入“管理后台”,对团队成员和数据进行管理,还可以进行任务分派等操作,从而实现团队的分工与协作。
注:“如是OCR”和“智能标点”功能,需注册登陆后才能使用。“标点迁移”和“多文本比对”无需注册,可直接使用。