毕设开题报告范文(共6页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《毕设开题报告范文(共6页).doc》由会员分享,可在线阅读,更多相关《毕设开题报告范文(共6页).doc(6页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上*大学本科毕业设计(论文)开题报告论文题目:基于OCR的名片识别技术研究学 院: *学院 专 业: *工程 年 级: 201*级 班 级: * 学 号: * 姓 名: * 指导教师: * 本科毕业设计(论文)开题报告专业: * 班级:*学号姓名指导教师报 告 题 目基于OCR的名片识别技术研究题目来源(划)科研生产实验室专题研究企业联合论文类型(划)工程设计类实验研究类软件开发类其 他 报 告 日 期2015年 月 日 报告地点: 一、选题目的与背景名片已经成为一种简单且美观的信息载体,扮演着重要的角色,日常生活和商务活动中,它具有介绍、沟通、留存纪念等多种功能,是当
2、代人际交往中不可缺少的名字的派生物。当下手机、掌上电脑笔记本、电子记事簿以及 PC 机都能够完成对于名片的管理,但是经过手动方式输入大量的名片不仅仅是浪费时间,同时也浪费人的体力,除此之外也不能保证信息的正确性和完备性,这就会使得日常生活中经常用到的设备,如手机、掌上电脑及电子记事簿等对名片信息的管理和使用大减折扣。于是急需开发出一种高识别度、易于操作和管理的名片识别系统,使终端设备能够自动将名片中的内容进行保存,便于人们使用6,7。基于 OCR 技术的名片识别方法可解决上述问题,其优点是识别准确率高、复杂低和速度快,适用于各种版式的名片。所谓的 OCR 技术指的是光学文字识别,它是 Opti
3、cal Character Recognition 的简称,是利用扫描把所有书籍、文稿及材料进行扫描,再对图片文稿做一下研究分析,取得字符和版面上信息的一个过程3,4。因此,采用 OCR 技术进行名片识别,并解决已有名片识别方法中存在的问题,具有非常重要的实际意义。二、国内外研究现状汉王公司于 1999 年推出了第一个中文名片识别与管理系统,历经 9 年的发展,功能越来越强大,识别技术水平不断提高,成为继 PDA、手机后又一个个人资源管理必备工具,目前在国内市场上销售的中文名片识别系统有北京汉王科技有限公司的汉王名片通、台湾蒙恬公司的蒙恬名片王、清华紫光公司的紫光名片大师、新加坡维优公司的维优
4、名片管家等。“汉王名片通”的研发起步最早,识别率最高,从 1999 年开始已开发出 10 几个版本,占中国大陆中文名片识别市场份额的 90%以上4。目前,有一些文献讨论名片的识别方法,文献8提出了一种多阶段识别方法,采用两种不同类型的神经网络识别中文名片;文献9构造了一个完整的中文名片识别系统,但只能处理纯横排或纯竖排的名片,而且假设已知待识别的字体;文献10采用模板匹配的方法分析名片版面,因此只能处理固定版面的名片。这些文献没有考虑构造实际系统可能会遇到的困难,比如:名片版面复杂,文字行横竖混排;行内文字排版方向不同;字符粘连;字体、字号变化频繁;汉英双语混排;简繁混排。由于名片识别系统的关
5、键在于字符识别与版面分析上,所以在此重点介绍版面分析与字符识别的研究现状。版面分析技术,己有四十多年的历史,八十年代早期,版面分析技术的初期研究大多集中于对布局结构较简单的文本文档页面进行分割,到九十年代初,对文档内部对象进行逻辑标识的研究开始逐步展开。目前,版面分析技术的研究已发展到针对各个不同领域的文档采用不同的技术,多角度地科学研究,并解决实际问题2。字符识别的研究,早在 1929 年,Taushek 就在德国获得了一项有关 OCR 的专利。据记载,印刷体汉字的识别最早可以追溯到 60 年代5。1966 年,IBM 公司的 Casey 和 Nagy 发表了第一篇关于印刷体汉字识别的论文,
6、在这篇论文中他们利用简单的模板匹配法识别了 1,000 个印刷体汉字。70 年代以来,日本学者做了许多工作,其中有代表性的系统有 1977 年东芝综合研究所研制的可以识别 2000 个汉字的单体印刷汉字识别系统;80 年代初期,日本武藏野电气研究所研制的可以识别 2300 个多体汉字的印刷体汉字识别系统,代表了当时汉字识别的最高水平。此外,日本的二洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统。 我国在 OCR 技术方面的研究起步较晚,在 70 年代才开始对数字、英文字母及符号的识别进行研究,70 年代末开始进行汉字识别的研究,到 1986 年汉字识别的研究进入一个实质性的阶段,取得了
7、较大的成果,不少研究单位相继推出了中文 OCR 产品,在中文信息处理领域有代表性的清华大学,汉王公司等都推出了各自代表性的产品,其中包括汉王的尚书五号、六号,汉王表格自动录入系统,蒙恬 OCR 文字扫描辨识系统,清华文通的 TH-OCR97, TH-OCR2000、清华紫光的紫光 OCR6,7。这些软件在文字识别方面,从识别速度和识别率上看,基本都达到了实用的效果,到目前为止,印刷体汉字识别技术和系统性能有了长足进步,系统的稳健性也得到进一步提高。三、主要研究内容和方法1. 研究内容以印刷体纸质中文名片图像作为信息来源,对名片图像进行二值化、平滑去噪、倾斜校正等预处理1,获得能够达到识别要求的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 开题 报告 范文
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内