文本信息处理技术有哪些?

1

研究现状

文本是历史悠久、应用广泛、使用灵活、认可度最高的信息载体。文本信息的处理研究主要包括分词研究文本信息抽取文本分类文本信息检索文本自动摘要等方面。所有这些研究的研究对象都是文本字串。


1. 分词

文本的最基本要素是字,但单一的字索然无味。符合语言习惯并能表达一定意义的字与字间的连接构成的词才是文本的有机要素。将一篇文档切割成不同的词称为分词

2

你好,很高兴能够你的问题。

文本信息处理技术有

1.自动标引技术。

2.标引词加权方法。

3.自动分类技术。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章