您现在的位置: 中国科技创新网 > 文章中心 > 创新人物百科 > 应用科学 > 文章正文
专家信息 科学研究 论文专著 荣誉奖励 媒体报道

专家信息:


刘成林,男,博士,研究员,中国科学院自动化研究所模式识别国家重点实验室研究员、副主任至今。近年来担任国际文档分析与识别大会(ICDAR)和国际手写识别前沿讨论会(IWFHR)程序委员,中国科学院“百人计划”入选者。

教育及工作经历:

1989年武汉大学无线电信息工程系,理学学士。

1992年北京工业大学电路与系统专业,工学硕士。

1995年中国科学院自动化研究所模式识别与智能控制专业,工学博士。

1995年7月到1996年3月中国科学院自动化研究所,文字识别实验室。

1996年3月到1997年10月在韩国科学技术院(KAIST)从事博士后研究。

1997年11月到1999年3月在日本东京农工大学从事博士后研究。

1999年3月到2004年12月在日立制作所中央研究所(东京)先后任研究员和主任研究员。

2005年1月至今中国科学院自动化研究所模式识别国家重点实验室,研究员。

主讲课程:

模式识别,自动化所博士课程,2008

学术兼职:

1、IEEE, Senior Member。

2、ACM, Member。

3、中国计算机学会 高级会员。

4、Pattern Recognition Journal, Associate Editor。

5、Image and Vision Computing, Editorial Board Member。

科学研究:


研究方向:

从事模式识别、图像处理、机器学习及在文字识别中的应用。

承担的科研情况:

重要的研究项目包括中科院“百人计划”项目1项,国家自然科学基金项目3项,国际合作项目3项。

1、笔输入备忘录识别与理解的先进方法研究,国际合作(日立制作所),2005.4—2009.3, 负责人。

2、模式识别理论与方法,中科院“百人计划”项目,2006.1—2008.12, 负责人。

3、基于纠错输出编码的高精度汉字识别研究,国家自然科学基金60543004,2006.1—2007.12, 负责人。

4、用于移动计算的基于部首的联机手写汉字识别方法,国际合作(微软研究院),2007.4—2008.3, 负责人。

5、手写字符串识别的信息融合与参数学习,国家自然科学基金60775004,2008.1—2010.12, 负责人。

6、模式识别理论方法与应用研究,国家杰出青年科学基金60825301,2009.1—2012.12, 负责人。

7、自然书写的脱机中文手写文档识别与检索,国家自然科学基金重点项目,2010.1—2013.12,负责人。

科研成果:

在手写字符识别的图像归一化、特征提取、分类器设计、手写字符串的切分与识别等方面提出一系列有效的方法;研制的文字识别算法在日本的邮政分拣机、表格处理系统等产品中获得成功的应用,尤其是用于邮政分拣的日文手写地址识别系统是该领域第一个成功的应用。

论文专著:


发表论文:

1. C.-L. Liu, M. Nakagawa, Precise candidate selection for large character set recognition by confidence evaluation, IEEE Trans. Pattern AnalysisMachine Intelligence, 22(6): 636-642, 2000.

2. C.-L. Liu, M. Nakagawa, Evaluation of prototype learning algorithms for nearest neighbor classifier in application to handwritten character recognition, Pattern Recognition, 34(3): 601-615, 2001.

3. C.-L. Liu, I.-J. Kim, J.H. Kim, Model-based stroke extractionmatching for handwritten Chinese character recognition, Pattern Recognition, 34(12): 2339-2352, 2001.

4. C.-L. Liu, H. Sako, H. Fujisawa, Performance evaluation of pattern classifiers for handwritten character recognition, Int. J. Document AnalysisRecognition, 4(3): 191-204, 2002.

5. C.-L. Liu, M. Koga, H. Fujisawa, Lexicon-driven segmentationrecognition of handwritten character strings for Japanese address reading, IEEETrans. Pattern AnalysisMachine Intelligence, 24(11): 1425-1437, 2002.

6. C.-L. Liu, K. Nakashima, H. Sako, H. Fujisawa, Handwritten digit recognition: benchmarking of state-of-the-art techniques, Pattern Recognition, 36(10): 2271-2285, 2003.

7. C.-L. Liu, K. Nakashima, H. Sako, H. Fujisawa, Handwritten digit recognition: investigation of normalizationfeature extraction techniques, Pattern Recognition, 37(2): 265-279, 2004.

8. C.-L. Liu, S. Jaeger, M. Nakagawa, Online handwritten Chinese character recognition: the state of the art, IEEE Trans. Pattern AnalysisMachine Intelligence, 26(2): 198-213, 2004.

9. C.-L. Liu, H. Sako, H. Fujisawa, Discriminative learning quadratic discriminant function for handwriting recognition, IEEE Trans. Neural Networks, 15(2): 430-444, 2004.

10. C.-L. Liu, H. Hao, H. Sako, Confidence transformation for combining classifiers, Pattern AnalysisApplications, 7(1): 2-17, 2004.

11. C.-L. Liu, H. Sako, H. Fujisawa, Effects of classifier structurestraining regimes on integrated segmentationrecognition of handwrittennumeral strings, IEEE Trans. Pattern AnalysisMachine Intelligence, 26(11): 1395-1407, 2004.

12. C.-L. Liu, Classifier combination based on confidence transformation, Pattern Recognition, 38(1): 11-28, 2005.

13. C.-L. Liu, H. Sako, H. Fujisawa, Handwritten numeral string recognition: effects of character normalizationfeature extraction, IEICE Trans. InformationSystems, E88-D(8): 1791-1798, 2005.

14. C.-L. Liu, K. Marukawa, Pseudo two-dimensional shape nomalization methods for handwritten Chinese character recognition, Pattern Recognition, 38(12): 2242-2255, 2005.

15. C.-L. Liu, H. Sako, Class-specific feature polynomial classifier for pattern classificationits application to handwritten numeral recognition, Pattern Recognition, 39(4): 669-681, 2006.

16、手写字符串识别搜索算法 于金伦; 周祥东; 刘成林 模式识别与人工智能 2009-04-15

17、昆虫图像自动鉴别技术 陈小琳; 侯新文; 刘成林; 刘晓秋; 张知彬 昆虫知识 2008-03-15

18、简化的Wigner分布及其在笔迹鉴别中的应用 刘成林; 戴汝为; 刘迎建 计算机学报 1997-11-12

19、基于多通道分解与匹配的笔迹鉴别研究 刘成林; 刘迎建; 戴汝为 自动化学报 1997-01-19

资料更新中……

荣誉奖励:


1、2000年日立制作所技术开发三等奖。

2、2001年日立制作所技术开发一等奖。

3、2005年荣获青年科学家奖。

4、2008年获得国家杰出青年科学基金。

媒体报道:


“慧眼”识别世界

——记中国科学院自动化研究所模式识别国家重点实验室刘成林研究员

人类对世界的认知,归根到底来自外在的符号与内在的思维。那么怎样联接这两个世界呢?需要通过对感知信号的分析,这些信号以图像、视频、声音等形式存在着,被称为是模式。对这些模式的识别有助于人们实现获取外部环境知识并与环境进行交互的目的。这就涉及到了一个研究领域——模式识别。这,是一个崭新的认知领域。

模式识别(Pattern Recognition)是人类的一项基本智能,通过对表征事物或现象的各种形式(数值、文字和逻辑关系的)的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释,是信息科学和人工智能的重要组成部分。为了揭秘这个陌生的新世界,今天,我们走访了一位在这一领域默默耕耘了多年的科技工作者,从他那里更详细地了解模式识别的意义与作用。他,就是中国科学院自动化研究所模式识别国家重点实验室副主任——刘成林研究员。他,有一双可以识别特殊世界的“慧眼”。

一位治学严谨的老师

“我是加拿大Concordia大学Centre for Pattern Recognition and Machine Intelligence的一名博士生。今年5月份有幸来到中国科学院自动化研究所模式识别国家重点实验室开展学术交流,在刘成林教授指导的科研小组进行访问和学习。在访问期间,刘老师严谨的治学态度和渊博的专业知识给我留下了深刻印象。其实,早在我读硕士期间,就开始接触刘成林老师的文章,并且对其阐述的问题印象深刻。他的论文,无论是在理论还是在实践上,都具有很高的创新性和实用性。而此次访问中最大的感受就是刘老师对学生、学术的认真态度以及实验室里活跃的学术气氛,都给人一种富有朝气、活泼进取的感受。实验室工作人员和同学们的热心帮助更让我感激不已。从大事到小事,他们都认真对待,让我时刻有一种家的感觉。”刚来实验室不久的访问学生何春雷这样为我们介绍自己的新老师。

走进刘成林的办公室,我们看到办公桌上的“手写体”样张,这就是他平时做得最多的事情:研究中文手写体的识别。他告诉本刊记者,最近,他的研究课题组对“HIT—MW手写文本库”作了文本行的标记工作,并已经免费公开,而且与此相关的核心技术也已经发表在一期业内知名的学术杂志《Pattern Recognition》上。同时,他的课题组收集了一个新的大规模手写体样本库,即将向学术界公开。刘成林一边说着,一边向我们展示他的研究成果。

从学生的评价,从他对研究工作的那一份热爱与认真劲儿,我们看到了一位勤勤恳恳躬耕于模式识别领域的学者。刘成林今年只有42岁,在他面前的路还很宽阔。他对我们说:“模式识别是一个应用前景很广泛的领域。我的研究成果主要包括在手写字符识别的图像归一化、特征提取、分类器设计、手写字符串的切分与识别、手写文档分割等方面。研制的文字识别算法已经应用在日本的邮政分拣机、表格处理系统等产品中,尤其是用于邮政分拣的日文手写地址识别系统,是该领域第一个成功的案例。在此之前的日本邮政分拣机只能识别邮政编码和印刷地址,而不能识别手写地址。这一研究成果成功的解决了这一难题。”

近年来,刘成林的很多成果引起了业界的关注,其中重要的研究项目包括中科院“百人计划”项目1项,国家自然科学基金项目3项,国际合作项目3项。而当下,刘成林做的最重要的一件事情就是,积极努力地推进研究成果的转化和应用。

严谨是一位师者必备的品德。在刘成林那里,记者分明感到一种兢兢业业、淡泊如水般的感情,对研究的热爱全部浓缩在了那一份严谨与认真之中。

一片海阔天高的领地

1989年,刘成林本科毕业于武汉大学无线电信息工程系,获理学学士学位后继续深造,于1992年获北京工业大学电路与系统专业工学硕士学位。后又在1995年获中国科学院自动化研究所模式识别与智能控制专业工学博士学位。之后,刘成林先后在韩国科学技术院(KAIST)和日本东京农工大学从事博士后研究工作。1999年至2004年他在日立中央研究所先后任研究员和主任研究员,从事的也是模式识别的相关研究。2005年1月,刘成林回国,入选中国科学院“百人计划”(引进海外杰出人才计划),任中国科学院自动化研究所模式识别国家重点实验室研究员、副主任至今。按照刘成林的理解,他一路走来,感觉模式识别是一个很有发展前景和研究潜力的领域,这对于一个科研工作者的科研生涯来说是一笔难得的财富。

刘成林的研究方向为模式识别、图像处理、机器学习及在文字识别中的应用。在手写文字识别领域他已经取得了国际领先的研究成果,并因此还获得了2005年国际模式识别协会主办的国际文档分析与识别会议青年科学家奖(IAPR/ICDAR Young Investigator Award)。在国际期刊《IEEE Trans. on Pattern Analysis and Machine Intelligence》和《Pattern Recognition》等以及一些相关的国际学术会议上发表论文90余篇。2004年,刘成林当选美国电气电子工程师学会高级会员(IEEE Senior Member),2006年开始担任国际期刊《Pattern Recognition》的编委,2008年开始担任国际期刊《Image and Vision Computing》的编委。2008年获得国家杰出青年科学基金。

从2005年开始,刘成林完成的主要项目是中科院“百人计划”,并取得了丰硕的成果。他在模式分类和手写文档分析方面开展研究工作,对于有些类别部分重叠而又不需要完全分开的模式分类问题,提出一种部分判别学习方法,通过修改已有的判别学习准则(如MSE, MCE, one-versus-all SVM等),强化不同合并类之间的区分,弱化重叠类之间的区分,有效降低了合并类的分类错误率。在联机手写文档分析方面,提出了一种基于马尔科夫随机场(MRF)的笔划分类方法和一种充分利用时域和空间域信息的文字行分割方法,能够正确分割任意方向的文字行。在字符串识别方面,提出了利用几何上下文提高字符切分和识别精度的方法。为了更好地融合字符识别置信度和上下文信息,提出了基于条件随机场(CRF)的字符串识别方法,有效地克服了条件独立假设和置信度估计不准确的问题并能自动学习最优权值系数。而在脱机手写汉字识别方面,提出一种结合图像坐标变换的梯度方向特征提取方法,有效地克服非线性归一化和伪二维归一化带来的形变,从而提高识别精度。提出了一种基于线性判别分析(LDA)的复合距离方法用来区分手写汉字中的相似字。针对手写文字行具有倾斜、弯曲、行间距不明显等特点,提出了一种基于测度学习的最小生成树聚类算法,在无约束中文手写文档图像上取得了98.02%的文字行分割正确率。

刘成林带领着研究组在手写文档分析方面进行的工作系统而深入,在国际学术界有较大影响。比如,在2009年国际文档分析与识别会议(ICDAR)上,研究组投稿的6篇论文全部被接收,其中5篇为口头报告(口头报告论文接收率20%)。除了以上的方法和算法研究,他们已收集一个大规模的联机和脱机手写字符及连续书写文本的数据库。待标注完成后,可供学术界交流、研制新的方法并开发实用的手写文档识别系统。

一次难忘的获奖经历

2005年,在国际模式识别协会主办的国际文档分析与识别会议上,刘成林获得了IAPR/ICDAR Young Investigator Award(青年科学家奖)。这次获奖经历不仅让世界模式识别领域知道了中国模式识别研究的实力,还给刘成林带来了更大的动力。

国际文档分析与识别会议(ICDAR)1991年以来每两年举行一届,最近几年的举办中每一届的参加者都在300到400人之间。青年科学家奖自2007年设立以来每次授予1到2人(40岁以下)。这个奖引用刘成林的成绩如下:ICDAR Young Scientist Award for his outstanding research in Handwritten Kanji Character Recognition and its impact on industrial applications.

“在手写文字识别的归一化、特征提取、分类器设计、手写字符串识别等方面提出和实现了一系列有效的方法,有效地提高了手写文字识别和字符串识别的性能(提高精度、降低计算复杂度),这是当时获奖时主要的成就。在归一化方面,我提出了长宽比自适应归一化的思想,基于函数拟合的非线性归一化和伪二维归一化方法;在特征提取方面,提出了具有良好不变性的外围结构特征提取方法和连续的归一化协同特征提取方法;在分类器方面,设计了判别学习二次分类器和类特征多项式分类器,分类精度高于最好的人工神经网络。我还改进和完善了基于置信度估计的多分类器融合方法;在字符串识别方面,通过设计排斥非字符的分类器,明显提高了字符切分和字符串分类的正确率。”刘成林拿着当时获得的奖杯向本刊记者讲道。

当时,刘成林所研制的文字识别算法被应用于日立制作所的多种信息产品,包括邮政分拣机、表格处理系统、智能ATM机、移动电话等。2000年和2001年他分别获得日立制作所技术开发三等奖和一等奖。2002年,刘成林在《IEEE Trans. PAMI》上发表的“关于日文手写地址识别的成果”是国际上该领域首次成功的应用,并被《IEEE Spectrum》杂志2003年第2期摘录。国际著名学者Ching Y. Suen称该文为手写地址识别领域的“历史性论文”。2005年前,刘成林在国际刊物和学术会议上发表论文50多篇,包括模式识别领域的顶级刊物《IEEE Trans. PAMI》和《Pattern Recognition》上以第一作者发表的论文10篇。

一个充满机会与挑战的时代

“我在国外时,经常听人议论科研成果的意义。他们认为,如果一项成果解决了一个重要的理论问题或提出一个非常有效的方法,这样的成果在学术上有重要价值。如果一项成果解决了一个应用问题,如实现一个高性能的应用系统,得到了实际应用或即将得到应用,那么这项成果的价值同样是非凡的。反之,如果一项科研工作在理论或应用方面的影响都不突出,即使发表的文章再多,也没有太大意义。十几年前,国内学术界提出“顶天立地的”说法,即在理论上要顶天,在应用上要立地,意思是一样的。”在谈到刘成林获得2008年国家杰出青年科技基金的事情时说。

国家杰出青年科学基金的评审看重研究者在理论上或应用上的突出贡献。如果发表论文很多但却没有一篇有重大影响(受到正面评价或产生实际应用),其作者也难以获得杰出青年科学基金。2004年以前,国内学者发表的高水平论文还不太多,杰出青年科学基金的评审比较注重申请人的论文发表情况(论文的档次和数量)。近年来,随着高水平论文的增多以及国家对科学技术的应用越来越重视,杰出青年科学基金的评审也越来越重视申请人在应用方面的贡献以及潜在应用价值。其实,刘成林在日常生活中对青年人才的培养也实践了这种重视成果价值的理念。他在人才培养上认为,模式识别领域的人才应该注重三个方面的培养:基础知识、实践能力、敬业精神。在基础知识方面,只有注重深度与广度的结合,通过围绕自己的研究课题,对局部领域(如文字识别)的专业知识、研究状况和有关方法深入掌握;同时,对相关领域(如与文字识别相关的图像处理、计算机视觉、模式识别、机器学习等)的主要方法和进展要有一个全面了解。实践能力体现在灵活运用专业知识解决实际问题的能力、动手实验能力、在实验中发现问题和分析问题的能力、总结和写作能力等。而导师对学生兴趣的培养并在工作中严格要求也是一个很重要的促进因素。

在这种人才观念的影响下,刘成林与研究组里的科技工作者一起在模式识别的领地里披荆斩棘,开拓创新。目前,研究组拥有2名副研究员1名博士后、10名博士生和5名硕士生。他们与刘成林一起,在模式识别国家重点实验室这块“试验田”,书写着一代科技工作者的不朽梦想书写着“慧眼”识别外部世界的一段传奇。

来源:《科学中国人》2009年第10期

文章录入:zgkjcx    责任编辑:zgkjcx 
  • 上一篇文章:

  • 下一篇文章:
  •  

    关于我们 | 加入收藏 | 联系我们 | 设为首页 | 广告说明 | 合作项目

    名称:科技创新网 工信部备案号:京ICP备13040577号-2    公安备案号:11010802029847
    版权所有:未经授权禁止复制或建立镜像 E-Mail:zgkjcx08@126.com