您好,欢迎访问尊龙凯时·(中国)人生就是搏!

大数据实训平台课程案例丨新闻文本分类实践

发布日期:2024-08-04 01:03浏览次数:

  新闻是“对新近发生的事实的报道”,使用简练的文字概括了丰富的信息并频繁更新,且通过公开媒体传播。大数据时代的发展,网络丰富了新闻的来源,加速了新闻的传播。

  但面对爆炸式增长且杂乱无序的新闻,用户获取所需信息的难度增加,对新闻进行有效的信息组织是十分重要的。

  文本分类技术是信息组织、文本挖掘的重要基础,可以较大程度地解决信息紊乱的问题,帮助用户准确地定位所需的信息,是处理海量信息的有力手段。使用算法处理文本分类任务可以避免繁杂的人工特征工程。

  本文将利用EYEModel建模平台训练出一个新闻文本分类模型,以帮助新闻领域工作者了解新闻文本分类现状,促进新闻领域实现更加有效的信息组织和管理。

  来自搜狐新闻2012年6月—7月期间,新闻、体育、房产、金融及娱乐5个频道的部分数据。

  来源:新华网 新华网合肥6月24日电(记者蔡敏)记者从水利部淮河水利委员会了解到,6月20日-23日,淮河流域出现一次大到暴雨的降水过程......(责任编辑:黄芳)

  本报讯 尽管三巨头在联盟中的打拼时间都超过10年,但直到昨天,加内特、皮尔斯和雷·阿伦才第一次进军总决赛......(责任编辑:宋明珠)

  明星的一举一动自然逃不过狗仔的锐利双眼,就连镜头前无懈可击的大英雄也有失足的时候。近日,有型有款、行动敏捷的前邦德先生皮尔斯·布鲁斯南也一不小心,陷入了尴尬境地。......(责任编辑:Dawn)

  唯一编号 8185366933城区与地址 丰台区所在小区 万年花城,南北3居交通状况......在线帮助:梦源

  工业和信息化部:6月底前五成受灾企业可恢复生产,根据目前对灾区初步调查摸底掌握的情况,已恢复和在1个月内可以恢复的受灾企业约占51%,3个月内估计再有25%的企业可恢复生产......(据新华社电)(来源:上海证券报)

  不同的参数设置对模型的影响还是很大的,F1-score从最低的0.22到0.89,选择准确率最高的模型。

  现在我们在EYEModel中,把新闻文本导入到新闻文本分类模型里面进行分类。

  分类结果如图,新闻信息是社会信息资源的重要组成,对新闻信息进行分类有助于实现新闻序化、新闻挖掘,进而指导决策等,意义重大。

  而我们通过搜狐新闻文本数据集训练出的新闻文本分类模型,可以轻松分类新闻、体育、房产、金融及娱乐类的新闻。

  原本人工需要花费一天时间分类的文本信息,通过模型,不到五分钟就可按照训练的标准进行分类。同时,使用者还可依照使用需求、分类标准的不同训练不同的分类模型,不仅缩短了文本分类时间,而且大大节省企业人工成本。返回搜狐,查看更多尊龙凯时官方入口

产品推荐

Copyright © 2002-2024 尊龙凯时·(中国)人生就是搏! 版权所有 备案号:

020-88888888