舆情系统
子系统
命名实体识别
实体关系抽取系统
热词提取系统
热点话题提取系统
关键短语提取系统
自动提取摘要系统
相似文本过滤系统
情感倾向分析系统
全文检索系统
网络数据爬虫系统
语料数量统计
数据文件添加
热点话题提取系统(Hot Topic Extraction System)
系统可以提取文本集的多个热点话题,并生成话题短语。
话题区分度高:采用短语挖掘算法和主题模型结合的方式,建立“bag-of-phrases”模型挖掘出热点话题,话题之间的区分度高,内聚性好;
可读性强:系统追求提取能表述完整意义的词或短语,常见方法一般只提取单个词汇,而大部分词汇没有表达出明确含义。
话题个数设定:
处理数据选择:
提取话题
编号
文件名
话题短语
×