大学图书馆学报

2004, (01) 50-55+64

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于知识库的网页自动标引和自动分类系统的设计
Design of Web Page Auto-indexing & Auto-classification System Based on the Knowledge Database

侯汉清,薛鹏军

摘要(Abstract):

针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。

关键词(KeyWords): 网页;自动标引;自动分类;概念语义网络;智能信息处理

Abstract:

Keywords:

基金项目(Foundation): 国家社科基金项目“基于知识库的中文信息自动分类和自动标引”(02BTQ012)的研究成果之一。

作者(Author): 侯汉清,薛鹏军

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享