30255字硕士毕业论文汉语词典编纂大型通用语料库建设研究

3.0 闻远设计 2023-07-19 96 4 17.25KB 3 页 免费
侵权投诉
30255 字硕士毕业论文汉语词典编纂大型通用
语料库建设研究
论文概述:
本文是语言学论文,笔者认为我国在面向辞书编纂的语料库建设这个领域还是相对比较薄弱,
并且所做的尝试也是非常有限的,要想理想而又相对比较成功的建设我们自己的面向辞书编纂
语料库
论文正文:
第一章引言 1.1 语料库建设的研究现状 1.1.1 中国语料库建设的研究现状中国语料库的发展呈现
出多元化趋势,特别是在过去十年中,不同类型的语料库发展迅速,包括普通语料库和特殊语
料库、文本语料库和语音语料库、古今汉语语料库、书面语料库和口语语料库、共时语料库和
历时语料库以及中介语语料库 近十年语料库发展的主要内容是普通语料库和特殊语料库的发展
在通用语料库中,影响最大、应用最广的是国家语委现代汉语语料库、北京大学现代汉语语料
库和北京大学现代汉语标记语料库。中国大陆、香港和台湾的汉语语料库在台湾海峡两岸三地
也发挥着重要作用。 1996 年,刘连元在《现代汉语语料库的发展》一书中详细介绍了现代汉
语语料库的建设 2004 年,金广金、肖航、丽芙和张云帆也在《现代汉语语料库的建设与深度
加工》中介绍了国家语委建立的现代汉语语料库的建设,强调从深度加工的角度进行分析和解
释。 国家语委《现代汉语语料库》建立于 2001 年初,是一个大型的全国平衡语料库,语料库
跨度近 100 年,数据库总容量为 1 亿字。 语料库包括三个广泛的领域:人文社会科学、自然科
学和综合,在这些领域下划分了 40 个子类别,涉及许多实际领域,如行政、礼仪和文件。
2002 年,俞石闻、段慧明、朱学峰和孙斌在《北京大学现代汉语语料库基本处理标准》中对北
京大学现代汉语语料库的建设进行了一定程度的解释 2009 年下半年,该库的总容量超过 7亿
字节。 它主要从口语和书面语的角度进行划分,还包括历史传记、应用文、报纸、电影、戏剧
等。 语料库也可以在互联网上自由共享,其检索方法也便于用户掌握与语料库来源相关的信
息。 本文描的语料库规模是一个2700 汉字的现代汉语语料库,在基本处理过程中
成了一定的标准。本文详细介绍了语料库的处理项目:词性名词(
组织机构名)) 、语子类标动词的特殊用法标等。 2000 年,段慧
明、石闻等人的《大规模汉语标语料库的发与使用》从语言源、作汉语标语料库
、大规模汉语标语料库的作、基于标语料库的汉语分词系统、实、准度的
提高以及标语料库的应用等个方面对语料库的建与使用进行了明的阐述1.2 研究的
意义价值 1.2.1 空怀(White to Fill the Theory of Chinese dictionary)从我国现有词典理论的角
度来,一些现有的词典理论建设研究取得大进展,微观角度来,这些理论大多是
“ ” “ ”在引进国外先进理论的基上进行的,有些研究是基于 模仿 追踪 性质。然而,在这些
理论引入后,我们不能结合我国词典的实际发展,对其进行合、化和创新出自己的
创性研究,建立一套适合我国词典编纂的现代原创性理论。 用观念演绎当词典的发展,在
一定程度上,一套系统的理论或观念支持将词典的发展起到至关重要的作用。 世界的发
已经信息时代,语言作为一非常重要的必将影响我们生活的方方面面。 为了进一
步提高中国文化的发展,我们不加大对语言源的发和用。 然而,汉语词典的编
纂不可以遵循统词典理论的规则定,还可以引入更的现代词典概念使词典编纂
成为发和用语言源的重要途径。 建立大型通用词典编纂语料库可以使汉语词典编纂进一
步吸收借鉴外先进的词典编纂理各种语言学理论。 在建语料库的过程中,我们不
可以更好地理解这些理论,还可以成功地这些理论应用中,并用它们来检它们是
合我国词典建设的实际情况。 从某种意义,本研究弥补了传统词典理论的不,为词典
编纂提供的理论支持努力实现词典编纂的现代化。 因此,建立大规模的汉语词典编纂通
用语料库可以进汉语词典的理论建设,填补空汉语词典理论的空白,不为汉语词典的编纂
开辟新的领域。 1.2.2 进中文信息处理的发展,中文信息处理主要是指利计算机技术
理中文字音和意义等信息。 换句话说让计算机知道汉语,然后更好地记汉语的
发展。 中文信息处理主要有两方法: 统计方法和理解方法 在语料库统计的基上,我们试
使计算机加深对汉语的理解,最渡到基于理解的方法,使计算机的信息处理方法逐渐
方法向理方法。 通过对标信息和语料库标方法的不研究,我们可以更好地理
解汉语和理解汉语。 在计算机技术飞速发展的今,为了更好计算机技术来理解、处理
成自然语言,首先要做的是使计算机能够正确理解和分析自然语言。 这也进了中国信息
处理的发展 中文语料库的建设,即计算机辅助词典的编,是中文信息处理的重要分。
摘要:

30255字硕士毕业论文汉语词典编纂大型通用语料库建设研究论文概述:本文是语言学论文,笔者认为我国在面向辞书编纂的语料库建设这个领域还是相对比较薄弱,并且所做的尝试也是非常有限的,要想理想而又相对比较成功的建设我们自己的面向辞书编纂语料库论文正文:第一章引言1.1语料库建设的研究现状1.1.1中国语料库建设的研究现状中国语料库的发展呈现出多元化趋势,特别是在过去十年中,不同类型的语料库发展迅速,包括普通语料库和特殊语料库、文本语料库和语音语料库、古今汉语语料库、书面语料库和口语语料库、共时语料库和历时语料库以及中介语语料库近十年语料库发展的主要内容是普通语料库和特殊语料库的发展在通用语料库中,...

展开>> 收起<<
30255字硕士毕业论文汉语词典编纂大型通用语料库建设研究.docx

共3页,预览1页

还剩页未读, 继续阅读

相关推荐

作者:闻远设计 分类:课程设计课件资料 价格:免费 属性:3 页 大小:17.25KB 格式:DOCX 时间:2023-07-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注