中国语料库研究的历史与现状-冯志伟教授 - 自然语言处理与信息检索共享平台 ICTCLAS 自然语言处理 信息检索 精准搜索 智能挖掘 NLPIR - Powered by SupeSite

中国语料库研究的历史与现状-冯志伟教授

排行榜 收藏 打印 发给朋友 举报 来源: Journal of Chinese Language and Computing   发布者:冯志伟
热度1909票  浏览1295次 【共0条评论】【我要评论 时间:2011年4月14日 09:03
自然语言处理与信息检索共享平台Z2GaAa/T(y

中国语料库研究的历史与现状.pdf(419 KB)自然语言处理与信息检索共享平台cJ^&e.qtD}*kX

7iu)O+zeX-e9P Xw0冯志伟、Journal of Chinese Language and Computing, 2002, Vol.12, No.1, pp.43-62自然语言处理与信息检索共享平台[9QE_;qX

自然语言处理与信息检索共享平台&I]/}y8D2`B

摘要自然语言处理与信息检索共享平台F8fy)^DBh#w.j
本文首先简要回顾了国外语料库的概况,然后,比较详细地介绍中国语料库的发展情况,包括早期的语料库、国家级语料库、大规模真实文本语料库、口语语料库、双语语料库、少数民族语言语料库等,接着介绍语料库的各种加工技术,如自动切分、自动词类标注、自动短语结构标注、自动双语对齐等,使我们对于语料库研究得到一个鸟瞰式的认识。最后讨论了当前语料库研究中的一些问题,如语料库的规范和标准问题,语言资源共享问题、知识产权问题等。
-f3WsM0owP0关键词: 语料库;大规模真实文本;口语语料库;双语语料库;少数民族语言语料库;自动切分;自动词类标注;自动短语结构标注;双语对齐自然语言处理与信息检索共享平台}w3A ZgOA n6P t

顶:108 踩:121
对本文中的事件或人物打分:
当前平均分:-0.4 (581次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.09 (514次打分)
【已经有585人表态】
114票
感动
62票
路过
70票
高兴
65票
难过
63票
搞笑
65票
愤怒
73票
无聊
73票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】