NLPIR新闻语料库-2400万字

热度2202票  浏览3729次 【共1条评论】【我要评论 时间:2011年4月13日 20:46
自然语言处理与信息检索共享平台-L y zS+F~

下载地址:http://www.nlpir.org/download/NLPIR-news-corpus.rar

c C rojBV0 自然语言处理与信息检索共享平台/}rqv&|C+D3cZ6Gs

NLPIR新闻语料库说明

d9EN~N9W)D+~.Dh0 自然语言处理与信息检索共享平台qU ns_1[4w$w*[

1.解压缩后数据量为48MB,大约2400万字的新闻;
Y+ZfAD-d02.采集的新闻时间跨度为2009年10月12日至2009年12月14日。
8zKg&`} Y&J+h BX#B03.文件名为新闻的时间;每个文件包括多个新闻正文内容(已经去除了新闻的垃圾信息);自然语言处理与信息检索共享平台 f k[ `s1|%hj*H(oT0i9L
4.新闻本身内容的版权属于原作者或者新闻机构;
0spS%g:s zO5]05.整理后的语料库版权属于www.NLPIR.org
7H8n3a:r9FW06.可供新闻分析、自然语言处理、搜索等应用提供测试数据场景;自然语言处理与信息检索共享平台3_GaL]*CS
如需更大规模的语料库,可以联系NLPIR.org管理员。自然语言处理与信息检索共享平台 UoJqk4f C

ap t{&e1}0
TAG: NLPIR 语料库 新闻
顶:142 踩:152
对本文中的事件或人物打分:
当前平均分:-0.27 (671次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.21 (615次打分)
【已经有622人表态】
112票
感动
61票
路过
77票
高兴
74票
难过
77票
搞笑
63票
愤怒
77票
无聊
81票
同情
上一篇 下一篇
自然语言处理与信息检索共享平台广东省广州市电信网友 [Abby] ip: 121.33.*.*
2012-03-23 00:49:57
谢谢! 请问老师有没有关于IT新闻语料库?
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有1位网友发表了看法】