采用《黄帝内经》语料构建中医领域理论本体的想法

热度1996票  浏览779次 【共1条评论】【我要评论 时间:2011年5月04日 15:40

采用《黄帝内经》语料构建中医领域理论本体的想法自然语言处理与信息检索共享平台j K wW(?"O

四川省绵阳市中医院 中医主任医师 彭明德自然语言处理与信息检索共享平台`^0I0@;GR0]:Y

 自然语言处理与信息检索共享平台%A'~0J-r ]/qy

在人类漫漫进化的历史长河中,《黄帝内经》通过2000年前的一个时间截面,汇总了人类与天地万物人事的相应关系及其阴阳属性度量的知识,肯定了人类在进化过程中,由于自然选择而遗传下来的趋利避害的本能,显性的表现为通过对生存环境、饮食、起居、人事等的喜好、乐见,或者恐惧、厌恶来作出应对。中医则通过医疗实践强化了这种能力,对于中医健康观的形成,疾病诊断,疗效评价和预后的理论体系的建立,起到了至关重要的作用。

Z {)s9B;]yKo)i+F0

很多年前曾通过文献计量学方法,探讨了我国中医药核心期刊测定和中医院基本藏书问题,在引文分析中发现在需要中医理论引证之处,大凡都直接引用《黄帝内经》,对其注疏、笺正、今释则很少引用。这至少说明两点,一是《黄帝内经》理论框架尚无重大突破,其二是中医博大精深,体系复杂,《黄帝内经》之后任何一家之言都难以取代。记得当时为了探讨《黄帝内经》的“望神”,把个《素问》从头翻到尾,工作量很大,还没有涉及到《灵枢》。以至于以后很多年都没有再做这样的笨事。可是当看到自然语言处理方法,及后又看到ICTCLAS自然语言处理共享平台,于是有了采用《黄帝内经》语料构建中医领域理论本体的想法,至少也要把中医领域知识中的概念标注出来。自然语言处理与信息检索共享平台 oe Eo J

初步的想法是:

k/Cd#\un1hx ~J0

1、应用ICTCLAS自然语言处理共享平台对《黄帝内经》,包括《素问》81篇,《灵枢》81篇。逐篇应用ICTCLAS分词和词性标注,然后手工校正,至少尽可能地把中医领域知识中的概念标注出来,比如人体形态结构功能,体质、疾病及治疗,及其相关的天文地理人事。至今,这一步已经完成,见http://hi.baidu.com/zyyxdhyjs/home。并打算把这162篇标注了文本汇集起来作为《黄帝内经》语料共享。自然语言处理与信息检索共享平台 Jz)ZxX5f+p w

2、抽取《黄帝内经》的中医领域概念进行整理,找出这些概念中的所有关系,构建中医领域理论本体。自然语言处理与信息检索共享平台)e^t;Y"s8u

3、建立《黄帝内经》中医领域语义词典。自然语言处理与信息检索共享平台'r6S*Hpf}&@

4、更新前述《黄帝内经》语料。

Ucb9F c F2n0

黄帝内经语料.txt(1.01 MB)

TAG: 黄帝内经
顶:131 踩:147
对本文中的事件或人物打分:
当前平均分:-0.1 (574次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.26 (540次打分)
【已经有604人表态】
95票
感动
58票
路过
62票
高兴
76票
难过
64票
搞笑
78票
愤怒
94票
无聊
77票
同情
上一篇 下一篇
自然语言处理与信息检索共享平台IANA网友 [张华平] ip: 115.171.*.*
2011-05-04 22:10:21
感谢彭大夫的工作,彭大夫刚退休,仍然孜孜不倦地为自己感兴趣的课题在耕耘,值得我们学习。
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有1位网友发表了看法】