信息处理中心
wish8088 · 2010-03-13 10:34 · 32047 次点击
目录
简介
研究内容
参考资料
简介
是指用计算机对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。
中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。
中文信息处理的文字。不仅包括简体汉字、繁体汉字,也包括藏文、蒙文、壮文、维吾尔文等大量少数民族的文字,还包括古汉语文字等。
研究内容
基础研究:汉字字频统计、词频统计、汉语自动分词、句法属性研究、汉字编码字符集、通用汉字样本库、汉字属性字典、语料库等
输入技术:中文输入法、中文手写输入、中文语音输入、文字识别等
输出技术:汉字字模技术(字型库)、汉字激光照排、汉语语音合成等
存储技术:汉字库标准等
转换技术:繁简转换等
信息处理:中文情报检索、中文文本校对、机器翻译、自然语言理解、中文人机界面等
参考资料
http://define.cnki.net/WebForms/WebDefines.aspx?searchword=%E4%BF%A1%E6%81%AF%E5%A4%84%E7%90%86%E4%B8%AD%E5%BF%83