text-classification中文文档分类数据集.zip
2 E币
成为会员,免费下载资料
文件大小:1.87 MB
上传者:海拥
时间:2023-04-04 10:12:37
下载量:1
中文文档分类数据集 配套陈旸老师的《人人都听得懂的清华大学数据挖掘》里的练习 数据说明: 1、文档共有4中类型:女生、体育、文学、校园 2、训练集放到train文件夹里,测试集放到test文件夹里。停用词放到stop文件夹里。 请使用朴素贝叶斯分类对训练集进行训练,并对测试集进行验证,并给出测试集的准确率。
展开》
折叠》