【作者】 邓娜娜; 朱艺恺; 胡文俊;
【作者单位】 上海市计算技术研究所; 上海亿通国际股份有限公司; 上海申腾信息技术有限公司;
【文献出处】 计算机应用与软件 , Computer Applications and Software, 编辑部邮箱 2009年 12期
【摘要】 当前BBS论坛日益成为人们通过网络进行信息交换的中心,被越来越多的用户使用。为了营造一个健康的网络环境,从网页抓取、信息抽取到主要的文本挖掘技术中文分词、特征表示和提取、文本分类和聚类等方面进行了详细的介绍,同时阐述了其工作原理。此系统不仅可以防止恶意言论的传播,还大大节约了人力,极大地提高了工作效率。