文本分类语料库(复旦)测试语料

热度2505票  浏览4568次 【共0条评论】【我要评论 时间:2011年4月21日 20:31
自然语言处理与信息检索共享平台Wk i&C#u6ZLO W_{

   由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。

dVO2Y%V\0 自然语言处理与信息检索共享平台C;d].w.?(qoNV%`

下载地址:http://www.nlpir.org/download/tc-corpus-answer.rar自然语言处理与信息检索共享平台4VC fk+D3q

TAG: 文本分类 语料库 复旦
顶:214 踩:139
对本文中的事件或人物打分:
当前平均分:0.02 (656次打分)
对本篇资讯内容的质量打分:
当前平均分:0.21 (642次打分)
【已经有854人表态】
298票
感动
73票
路过
72票
高兴
80票
难过
81票
搞笑
80票
愤怒
81票
无聊
89票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】