跳至正文
Home首页
Team研究队伍
Leader负责人
Experts专家
Research科研
开源情报
认知
大模型
量子NLP
多模态
多语种
具身智能
生成模型
Resource资源
Teaching教学
Corpus语料库
Tool工具
Demo演示
ICTCLAS分词
Paper论文
News新闻
Seminar研讨班
Update动态
Contact us联系我们
Join us加入我们
←
计算所汉语词性标记集
大规模现代汉语标注语料库的加工规范
→
中文分词测试标准?
发表于
2017-11-13
由
nlpir
最近看了中文分词的测试语料库,发现人名往往切分为“姓”和“名字”;如”黄昌元”被分为了黄/昌元;
但是在ICTCLAS中黄昌元是作为一个整体的。
问题:前者的标准需要修改?还是认为后者切分错误?
此条目发表在
Resource资源
分类目录。将
固定链接
加入收藏夹。
←
计算所汉语词性标记集
大规模现代汉语标注语料库的加工规范
→
发表回复
取消回复
要发表评论,您必须先
登录
。
近期文章
KDD 2026:从打分到符号化失败诊断,让大模型推理”可诊断、可解释”
ACL 2026 Findings:拒绝盲目采样,让大模型推理“精打细算”且“优胜劣汰”
ICML2026:让大模型多跳推理“有因有果”
IJCAI2026:用最弱维度优化提升多模态推理
复杂场景下多人3D人体运动重建取得新进展(CVPR 2026)
讲座:面向视频世界模型的记忆、结构与几何