王斌现代信息检索(Modern Information Retrieval)

热度1905票  浏览1197次 【共0条评论】【我要评论 时间:2011年4月21日 18:17

现代信息检索(Modern Information Retrieval)自然语言处理与信息检索共享平台PG/?8y&I Y;p

XeL(iV0二、教学目的和要求:自然语言处理与信息检索共享平台O(Chu"zz

    本课程为计算机科学与技术、图书情报等相关学科研究生的专业基础课,本课程不是讲授如何利用检索工具进行情报检索,而主要以互联网内容应用为背景讲授和讨论现代信息检索领域的主要思想和关键技术。课程的主要内容包括检索模型、检索评价、相关反馈、查询扩展、信息的组织和索引、文本处理、文本分类与聚类、信息过滤、WEB搜索引擎等等。

mH ?5SO m0

       通过本课程的学习,希望学生能了解信息检索的基本思想和概念,了解信息检索相关的最新研究成果,培养学生在信息检索相关领域的研究能力和在互联网内容应用上的知识运用能力。

.G,jf I;P0O b0 自然语言处理与信息检索共享平台"DG})l f s RG9R

 自然语言处理与信息检索共享平台.`VI1WV{

自然语言处理与信息检索共享平台(KEfE ^7b$UJ

三、课程内容:(课件下载地址 >>>>>>)自然语言处理与信息检索共享平台#TY.E1G)asPDEG

8Ps:|6X p0    第零  课程相关情况 

CU.N L6jCq0

第一章  绪论(1课时)

*R S(N6O/Qp0

信息检索的典型应用。信息检索的基本概念和发展历史。信息检索和其他相关学科(自然语言处理、机器学习、概率统计、模式识别、数据库、数据挖掘等等)的关系。信息检索系统的基本构架和一般流程。

*A X8nkVE[.sc*U W0

第二章 布尔检索及倒排索引(2课时)自然语言处理与信息检索共享平台Gc~MMv,sE`

字符串匹配及倒排索引。布尔查询处理及其优化。扩展的布尔操作。短语查询的处理。布尔检索模型及其扩展。自然语言处理与信息检索共享平台 DVp4cF.Cx%p_0m

第三章 词典查找及扩展的倒排索引 (3课时)自然语言处理与信息检索共享平台3XG EM zv

支持词典快速查找的数据结构(哈希表、二叉树等)。支持通配查询处理的索引结构。支持拼写或发音纠错处理的索引结构。自然语言处理与信息检索共享平台b)Lc,BgZ

第四章 索引构建(3课时)自然语言处理与信息检索共享平台kq{*N0pX P4}

文本预处理。一般构建过程。基于块排序的构建过程。单遍内存式扫描构建方法。分布式及动态索引方法。

/HUlf&\+[0

第五章 索引压缩(3课时)自然语言处理与信息检索共享平台{K!L]IcN`-`.k

词项的统计特性。词典的压缩。倒排记录表的压缩。

3{r#U0J H7NVV0

第六章 向量模型及检索系统(3课时)

J+OK[n.`[5W0

向量空间模型及词项权重计算机制。检索中的快速实现方法。检索系统的一般构成。隐性语义索引方法。基于开源工具搭建简单搜索引擎。

Y*Q3V_0BlR#m0

第七章 检索的评价(3课时)

R ah)K'P2Mz0

效率和效果的评价。查全率和查准率。其他效果评价方法。用户体验及结果摘要。相关评测语料和评测会议。自然语言处理与信息检索共享平台 nDP+rhE4Q

第八章 相关反馈和查询扩展(3课时)自然语言处理与信息检索共享平台:X'w ZNfB

相关反馈和伪相关反馈。查询扩展及重构。全局方法及局部方法。

^i(W(XL S\I7WL0

第九章 概率模型(3课时)

GuWc]0

概率排序原理。回归模型。二值独立概率模型。OKAPI BM25公式。自然语言处理与信息检索共享平台;zoR\0i/U H?'U`

第十章 基于语言建模的检索模型(3课时)自然语言处理与信息检索共享平台:PG!U5S(gjVrM

查询似然模型。其他语言模型。语言模型的相关反馈。

"z!S&L-`(^z],h0

第十一章 文本分类(3课时)自然语言处理与信息检索共享平台;pe%cfHAY_ K

文本分类的概念及评价方法。文本分类中的特征选择方法。

H@OZ H f(VB0

第十二章 文本聚类(3课时)自然语言处理与信息检索共享平台*q7N6aT_F*~

文本聚类的概念及评价方法。文本聚类算法。检索结果聚类的标签生成。

+oC lA.JPifd0

第十三章 Web搜索(3课时)自然语言处理与信息检索共享平台.Pj3Z gEK

Web结构。信息采集。网页查重方法。链接分析算法(PageRankHITS)

o'pgwaz L0k Y0

第十四章 其他应用简介(4课时)

*Mx&G/zvrN0

过滤及推送系统、XML检索、多媒体检索、跨语言检索、信息抽取、问答系统、互联网广告系统等等。自然语言处理与信息检索共享平台e6b5],r%W'c'k.K

直接访问:http://ir.ict.ac.cn/ircourse/自然语言处理与信息检索共享平台BE5HY2Y:j9u6{

TAG: 王斌 信息检索
顶:126 踩:129
对本文中的事件或人物打分:
当前平均分:-0.34 (567次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.34 (534次打分)
【已经有549人表态】
110票
感动
42票
路过
58票
高兴
62票
难过
58票
搞笑
71票
愤怒
79票
无聊
69票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】