Resource资源 – 第 4 页 – 自然语言处理与信息检索共享平台

自然语言处理与信息检索共享平台 自然语言处理与信息检索共享平台

Home » Resource资源

大规模现代汉语标注语料库的加工规范

大规模现代汉语标注语料库的加工规范[1]   俞士汶 朱…

Read More »

中文分词测试标准?

最近看了中文分词的测试语料库,发现人名往往切分为“姓”和“名字”;如&#82…

Read More »

计算所汉语词性标记集

计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用…

Read More »

LJCluster汉语文档聚类

      LJ…

Read More »

商业搜索引擎新词发现基本原理

一般计算语言学方法:前提:一般只能拿到文本集合,而且往往是没有分词的;技术路…

Read More »

中国汉语方言分布图

Read More »

汉字常用编码的字符集

GBK字符集合: GBK编码表.TXT(93.2 KB) GBK字符集合(去…

Read More »

汉字的unicode、GB、GBK、BIG5编码

汉字编码问题 一、GB2312-80介绍 二、GB2312-80的扩展 三、…

Read More »