中国语料库研究的历史与现状-冯志伟教授

排行榜 收藏 打印 发给朋友 举报 来源: Journal of Chinese Language and Computing   发布者:冯志伟
热度1850票  浏览1240次 【共0条评论】【我要评论 时间:2011年4月14日 09:03
自然语言处理与信息检索共享平台7\Q5Mw?(gmd

中国语料库研究的历史与现状.pdf(419 KB)自然语言处理与信息检索共享平台-\0HfeA}J]+kC:_v

自然语言处理与信息检索共享平台 \KZ6SF3S8A

冯志伟、Journal of Chinese Language and Computing, 2002, Vol.12, No.1, pp.43-62自然语言处理与信息检索共享平台@1a$Wmv"c/J z

自然语言处理与信息检索共享平台4};Q;{(X4FV

摘要自然语言处理与信息检索共享平台 G;[!uq-X)Y
本文首先简要回顾了国外语料库的概况,然后,比较详细地介绍中国语料库的发展情况,包括早期的语料库、国家级语料库、大规模真实文本语料库、口语语料库、双语语料库、少数民族语言语料库等,接着介绍语料库的各种加工技术,如自动切分、自动词类标注、自动短语结构标注、自动双语对齐等,使我们对于语料库研究得到一个鸟瞰式的认识。最后讨论了当前语料库研究中的一些问题,如语料库的规范和标准问题,语言资源共享问题、知识产权问题等。自然语言处理与信息检索共享平台QSx2Yc s3_J?
关键词: 语料库;大规模真实文本;口语语料库;双语语料库;少数民族语言语料库;自动切分;自动词类标注;自动短语结构标注;双语对齐

{A^'`*Xb(k0
顶:100 踩:115
对本文中的事件或人物打分:
当前平均分:-0.43 (565次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.07 (498次打分)
【已经有572人表态】
110票
感动
62票
路过
68票
高兴
62票
难过
63票
搞笑
65票
愤怒
70票
无聊
72票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】