新闻文本分类
前言 一个很粗糙的新闻文本分类项目,解决中国软件杯第九届新闻文本分类算法的问题,记录了项目的思路及问题解决方法 后续会进一步改进,包括: 丰富训练集的数据,避免军事类、房产类、体育类的新闻数据过少,影响精度 改用上限更高的Bert模型 优化exe文件的页面,使其能够分别处理识别短文本和excel文件 项目源码:https://github.com/bluehyssopu/NewSort 项目问题链接:http://cnsoftbei.com/plus/view.php?aid=599 文件结构图 code -pycache- —pyinstaller 打包生成的文件 build —pyinstaller 打包生成的文件 dist —pyinstaller 打包生成的文件(内有 软件test2.exe 可运行) showTest.ipynb —展示测试集处理的脚本 show ...
