基于文字密度的网页正文信息提取方法 – NLPIR自然语言处理与信息检索共享平台

自然语言处理与信息检索共享平台 自然语言处理与信息检索共享平台

基于文字密度的网页正文信息提取方法

本文提取了一种通过识别网页源码正文行中文字符密度的来自动提取中文网页正文信息的方法·,实验证明这种方法具有一定的实用价值。

You May Also Like

About the Author: nlpir

发表评论