博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python_处理文本标签_遍历目录
阅读量:373 次
发布时间:2019-03-05

本文共 571 字,大约阅读时间需要 1 分钟。

python_处理文本标签_遍历目录

我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论

标签(正面 / 负面)转换成 labels 列表
遍历目录

import osimdb_dir = '/home/ubuntu/data/aclImdb'train_dir = os.path.join(imdb_dir, 'train')labels = []texts = []for label_type in ['neg', 'pos']:    dir_name = os.path.join(train_dir, label_type)    for fname in os.listdir(dir_name):        if fname[-4:] == '.txt':            f = open(os.path.join(dir_name, fname))            texts.append(f.read())            f.close()            if label_type == 'neg':                labels.append(0)            else:                labels.append(1)

转载地址:http://zmrg.baihongyu.com/

你可能感兴趣的文章