文本分类语料库(复旦)测试语料

热度2562票  浏览4735次 【共0条评论】【我要评论 时间:2011年4月21日 20:31
自然语言处理与信息检索共享平台9@[$uV-B-Ut-|

   由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。自然语言处理与信息检索共享平台9fO;B#Q`"q`

自然语言处理与信息检索共享平台q e#Y4_'_H_'r

下载地址:http://www.nlpir.org/download/tc-corpus-answer.rar

Wh:Zy h0pQ!t&{`0
TAG: 文本分类 语料库 复旦
顶:221 踩:142
对本文中的事件或人物打分:
当前平均分:0.03 (669次打分)
对本篇资讯内容的质量打分:
当前平均分:0.2 (653次打分)
【已经有877人表态】
305票
感动
76票
路过
73票
高兴
83票
难过
83票
搞笑
82票
愤怒
84票
无聊
91票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】