中国外交部例行记者会语料库 – NLPIR自然语言处理与信息检索共享平台

自然语言处理与信息检索共享平台 自然语言处理与信息检索共享平台

中国外交部例行记者会语料库

1、本语料库包含自2017年6月9日至2021年9月29日的中国外交部例行记者会(共1000场)的全部数据。
2、在”https://www.fmprc.gov.cn/web/fyrbt_673021/jzhsl_673025/”后拼接语料库中”href”属性的值,即可得到每场记者会对应的链接。
3、外交部网站自2020-03-24及以后开始记录记者的单位,所以语料库中2020-03-24以前的”journal”属性值都为空。
4、本语料库由北京理工大学2021年秋季大数据分析与应用课程第四小组发布。
5、由于时间有限,语料库中部分日期的记者会格式存在一定问题。

You May Also Like

About the Author: gaoyuxiao

发表评论