感请。
楼主所说的舆情分析应该是与时下流行的机器学习相关的舆情分析吧,说说自己积累的一点经验。
1、首先是应该获取要分析的语料
2、人工为语料做标签,比如分析用户对产品的评价,首先应该针对一批评价,由用户做舆情分析,制作一些标签(比如分为:好评、中评、差评)
首先要说一下,舆情分析是一个复杂的工作,西盈舆情提醒舆情分析需要注意的方面如下:
1、舆情脉络清晰,能够按照时间节点和与舆情发展将事件清晰简练的描述出来。
2、相关数据的统计和收集要准确,比如发表时间、阅读数、转发数、评论数等,注意首发媒体要查找准,使用专门的舆情分析应用方便很多,因为重大舆情的信息量比较大。确。
3、多维度分析舆情,将舆情的多个方面影响和情感倾向等都能分析清楚。比如传播分析、重点分析、舆论倾向分析等。
舆情分析是自然语言处理技术(nlp)的一个应用场景。
中文nlp第一步是要进行分词,因为不像英文,词与词之间有天然的空格做分割。可以使用现成的分词器,比如hanlp,ansj,结巴分词。
如果简单来做舆情分析的话,可以维护一个词库,进行规则匹配。比如统计文章中消极词和积极词的比例,以此判断文章情感倾向。
复杂一点的话,可以用词向量(比如word2vec)表示词语,训练一个机器学习模型。这需要标注大量的语料。
一、如何分析网络舆情的方法
1.做好全网舆论的监测收集。网络舆情分析,毫无疑问是需要对全网的舆论进行分析,为此企业可以通过像识微商情监测系统这样的舆情监测系统对全网舆论进行实时监测,提高舆情信息的收集与整理效率。
2.网络舆情分析主要是对相关舆论话题的影响力、影响层面、传播动态、网民情绪等几个方面入手进行分析。
3.另外,在网络舆情的分析过程中还需要对媒介的传播情况进行分析,主要指的是舆情的传播途径、扩散速度、传播效果、传播受众等几个方面。
西盈网络舆情监测系统中的分析引擎模块主要功能是通过自动分词、自动聚类、自动分类/规则分类/混合分类、文本相似性检索(自动排重)、自动摘要+主题词标引(自由词+行业主题词)、常识校对、信息过滤、拼音/同音检索、相关短语检索、自然语言检索等文本挖掘技术,对采集数据进行研判,并结合全文检索技术实现结构化与非结构化的数据管理,支持结构化和非结构化数据的混合检索。
借助专业热点事件舆情分析平台,如识微商情监测系统,可帮助用户对全网舆情进行全面综合分析。可追踪已订阅主题的发展变化趋势,分析主题生命周期阶段以及各阶段的热点话题,挖掘主题演化过程中的传播网站、传播媒体、关键传播节点以及传播溯源,便于企业掌握商情发展的脉络,做出有效的预测。统计图表分类整合,自动生成日报周报和竞品分析报。
第一,通过设置关键词到舆情监测系统后,可以及时发现与关键词相关的舆情信息,负面信息、重大舆情及时预警,(前提是网络上有与设置关键词相关的信息);
第二,通过舆情监测系统可以了解哪些舆情成为了热点,转发量比较大,通过数据图,了解舆情的发展趋势;
第三,自动生成舆情报告和各种统计数据,提高舆情工作的质量和效率,辅助领导决策;
第四,代替人工搜索,节省人力物力,全面覆盖,重要信息及时预警实时监测,辅助舆情分析,方便舆情工作。