NLPIR短文本语料库-40万字

 


NLPIR短文本语料库说明


1.解压缩后数据量为48万字,大约8704篇短文本内容;
2.整理后的语料库版权属于www.NLPIR.org
3.可供短文本自然语言处理、搜索、舆情分析等应用提供测试数据场景;


北京理工大学网络搜索挖掘与安全实验室 (SMS@BIT)
地址:北京海淀区中关村南大街5号北京理工大学中心教学楼10层  邮编:100081
Email:  kevinzhang (at) bit.edu.cn
MSN:  pipy_zhang (at) msn.com;
网站: http://www.nlpir.org/ 
微博: http://t.sina.com.com/drkevinzhang/


Web Search,Mining and Security Lab.
Beijing Institute of Technology (SMS@BIT)
Add: Floor 10, Teaching Center Building, No.5, South St.,Zhongguancun,Haidian District,Beijing,P.R.C  PC:100081
Email:  kevinzhang (at) bit.edu.cn
MSN:  pipy_zhang (at) msn.com;
Website: http://www.nlpir.org/ 
Twitter: http://t.sina.com.com/drkevinzhang/


NLPIR短文本语料库.rar(1.76 MB)

You May Also Like

About the Author: nlpir

发表评论