王斌现代信息检索(Modern Information Retrieval)

热度1875票  浏览1182次 【共0条评论】【我要评论 时间:2011年4月21日 18:17

现代信息检索(Modern Information Retrieval)

ask^'mWK3A0 自然语言处理与信息检索共享平台$~0j]y&VH*Uf

二、教学目的和要求:自然语言处理与信息检索共享平台:V MNfe*i

    本课程为计算机科学与技术、图书情报等相关学科研究生的专业基础课,本课程不是讲授如何利用检索工具进行情报检索,而主要以互联网内容应用为背景讲授和讨论现代信息检索领域的主要思想和关键技术。课程的主要内容包括检索模型、检索评价、相关反馈、查询扩展、信息的组织和索引、文本处理、文本分类与聚类、信息过滤、WEB搜索引擎等等。

8j1g/IYmY(x P\l%RYP0

       通过本课程的学习,希望学生能了解信息检索的基本思想和概念,了解信息检索相关的最新研究成果,培养学生在信息检索相关领域的研究能力和在互联网内容应用上的知识运用能力。

*a"n7dT QRx_0

cB9h)a E0 自然语言处理与信息检索共享平台"R:MYD7wcS

iB$R,E5F-c*`'H0三、课程内容:(课件下载地址 >>>>>>)

i5I sya*`Gv0 自然语言处理与信息检索共享平台LT_G0cY

    第零  课程相关情况 

}I%_z NN-F7C0

第一章  绪论(1课时)

;L-a{d-w2y0

信息检索的典型应用。信息检索的基本概念和发展历史。信息检索和其他相关学科(自然语言处理、机器学习、概率统计、模式识别、数据库、数据挖掘等等)的关系。信息检索系统的基本构架和一般流程。

p_ Ri hjN0

第二章 布尔检索及倒排索引(2课时)自然语言处理与信息检索共享平台\T%oD&xn4jE

字符串匹配及倒排索引。布尔查询处理及其优化。扩展的布尔操作。短语查询的处理。布尔检索模型及其扩展。自然语言处理与信息检索共享平台"K ~M*Zc&v^+g5K

第三章 词典查找及扩展的倒排索引 (3课时)自然语言处理与信息检索共享平台j vSme,j

支持词典快速查找的数据结构(哈希表、二叉树等)。支持通配查询处理的索引结构。支持拼写或发音纠错处理的索引结构。自然语言处理与信息检索共享平台O+mfX)e;G2zqJf

第四章 索引构建(3课时)自然语言处理与信息检索共享平台 LN @ N)B8q

文本预处理。一般构建过程。基于块排序的构建过程。单遍内存式扫描构建方法。分布式及动态索引方法。

l3t `Y/fJ"@0

第五章 索引压缩(3课时)

!h:h8`0dRYr0

词项的统计特性。词典的压缩。倒排记录表的压缩。

R3k9]3@4bCk0

第六章 向量模型及检索系统(3课时)

p4Qw)l x/U0

向量空间模型及词项权重计算机制。检索中的快速实现方法。检索系统的一般构成。隐性语义索引方法。基于开源工具搭建简单搜索引擎。

xR_a a-r5c,ll6F&K0

第七章 检索的评价(3课时)

C-P t-Cw"p4Mk2u0

效率和效果的评价。查全率和查准率。其他效果评价方法。用户体验及结果摘要。相关评测语料和评测会议。

w8~\{(m3z;D0

第八章 相关反馈和查询扩展(3课时)自然语言处理与信息检索共享平台acb9D'ob3\

相关反馈和伪相关反馈。查询扩展及重构。全局方法及局部方法。

2k0C? b| hFLU6w0

第九章 概率模型(3课时)

a[@%K1u3i m `0

概率排序原理。回归模型。二值独立概率模型。OKAPI BM25公式。

p0y"r&wpL4?$^0

第十章 基于语言建模的检索模型(3课时)

e4t:L&Ko0

查询似然模型。其他语言模型。语言模型的相关反馈。

+IZT!{ E$}rL0y)_ }'b0

第十一章 文本分类(3课时)自然语言处理与信息检索共享平台+eI7DA1O3r+u:O5NP

文本分类的概念及评价方法。文本分类中的特征选择方法。自然语言处理与信息检索共享平台b,Q8XCf*q0^ CU

第十二章 文本聚类(3课时)自然语言处理与信息检索共享平台W9^TjF O

文本聚类的概念及评价方法。文本聚类算法。检索结果聚类的标签生成。自然语言处理与信息检索共享平台 F!zZ[pq%q]:q

第十三章 Web搜索(3课时)

0y!uL-gP9y a4|t0

Web结构。信息采集。网页查重方法。链接分析算法(PageRankHITS)自然语言处理与信息检索共享平台P0nIr3]MC

第十四章 其他应用简介(4课时)自然语言处理与信息检索共享平台)R/Of%U+d k

过滤及推送系统、XML检索、多媒体检索、跨语言检索、信息抽取、问答系统、互联网广告系统等等。自然语言处理与信息检索共享平台5s4`A8y5F6bhB#X w

直接访问:http://ir.ict.ac.cn/ircourse/自然语言处理与信息检索共享平台8DOOZ5K)t_

TAG: 王斌 信息检索
顶:124 踩:124
对本文中的事件或人物打分:
当前平均分:-0.34 (557次打分)
对本篇资讯内容的质量打分:
当前平均分:-0.33 (528次打分)
【已经有542人表态】
109票
感动
42票
路过
57票
高兴
62票
难过
57票
搞笑
71票
愤怒
77票
无聊
67票
同情
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】