1
研究现状
文本是历史悠久、应用广泛、使用灵活、认可度最高的信息载体。文本信息的处理研究主要包括分词研究、文本信息抽取、文本分类、文本信息检索、文本自动摘要等方面。所有这些研究的研究对象都是文本字串。
1. 分词
文本的最基本要素是字,但单一的字索然无味。符合语言习惯并能表达一定意义的字与字间的连接构成的词才是文本的有机要素。将一篇文档切割成不同的词称为分词。
2
你好,很高兴能够你的问题。
文本信息处理技术有
1.自动标引技术。
2.标引词加权方法。
3.自动分类技术。
文本是历史悠久、应用广泛、使用灵活、认可度最高的信息载体。文本信息的处理研究主要包括分词研究、文本信息抽取、文本分类、文本信息检索、文本自动摘要等方面。所有这些研究的研究对象都是文本字串。
1. 分词
文本的最基本要素是字,但单一的字索然无味。符合语言习惯并能表达一定意义的字与字间的连接构成的词才是文本的有机要素。将一篇文档切割成不同的词称为分词。
你好,很高兴能够你的问题。
文本信息处理技术有
1.自动标引技术。
2.标引词加权方法。
3.自动分类技术。