文本分类语料库(复旦)测试语料

热度2376票  浏览4372次 【共0条评论】【我要评论 时间:2011年4月21日 20:31

:DKr6U4U&a)fTH$v0   由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。自然语言处理与信息检索共享平台!AP$~-d H+BDD

C ba2a&z9GV0下载地址:http://www.nlpir.org/download/tc-corpus-answer.rar

+j+k5C'l!?\#]0
TAG: 文本分类 语料库 复旦
顶:202 踩:133
对本文中的事件或人物打分:
当前平均分:0.01 (622次打分)
对本篇资讯内容的质量打分:
当前平均分:0.22 (603次打分)
【已经有816人表态】
278票
感动
68票
路过
70票
高兴
78票
难过
78票
搞笑
78票
愤怒
79票
无聊
87票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】