NLPIR新闻语料库-2400万字

热度2300票  浏览4128次 【共1条评论】【我要评论 时间:2011年4月13日 20:46

sO/i%y(z(vY%C0下载地址:http://www.nlpir.org/download/NLPIR-news-corpus.rar自然语言处理与信息检索共享平台9|oRo.g B

@ N3}jR ES0NLPIR新闻语料库说明自然语言处理与信息检索共享平台}?%}7U%E

自然语言处理与信息检索共享平台)i(Dj/u!{.MHr

1.解压缩后数据量为48MB,大约2400万字的新闻;自然语言处理与信息检索共享平台t.Uafa
2.采集的新闻时间跨度为2009年10月12日至2009年12月14日。自然语言处理与信息检索共享平台dG/v"v1Ij
3.文件名为新闻的时间;每个文件包括多个新闻正文内容(已经去除了新闻的垃圾信息);
6Y\g"N;X7K'W04.新闻本身内容的版权属于原作者或者新闻机构;
ME/W.A,V05.整理后的语料库版权属于www.NLPIR.org自然语言处理与信息检索共享平台hD@%I*Y Yke
6.可供新闻分析、自然语言处理、搜索等应用提供测试数据场景;自然语言处理与信息检索共享平台k2W]H]c
如需更大规模的语料库,可以联系NLPIR.org管理员。自然语言处理与信息检索共享平台%vB Iy6d ~4x
自然语言处理与信息检索共享平台0aF+u8G? i'QE

TAG: NLPIR 语料库 新闻
顶:147 踩:161
对本文中的事件或人物打分:
当前平均分:-0.3 (699次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.22 (639次打分)
【已经有654人表态】
118票
感动
65票
路过
80票
高兴
78票
难过
81票
搞笑
65票
愤怒
81票
无聊
86票
同情
上一篇 下一篇
自然语言处理与信息检索共享平台广东省广州市电信网友 [Abby] ip: 121.33.*.*
2012-03-23 00:49:57
谢谢! 请问老师有没有关于IT新闻语料库?
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有1位网友发表了看法】