本文共 571 字,大约阅读时间需要 1 分钟。
python_处理文本标签_遍历目录
我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论
标签(正面 / 负面)转换成 labels 列表 遍历目录import osimdb_dir = '/home/ubuntu/data/aclImdb'train_dir = os.path.join(imdb_dir, 'train')labels = []texts = []for label_type in ['neg', 'pos']: dir_name = os.path.join(train_dir, label_type) for fname in os.listdir(dir_name): if fname[-4:] == '.txt': f = open(os.path.join(dir_name, fname)) texts.append(f.read()) f.close() if label_type == 'neg': labels.append(0) else: labels.append(1)
转载地址:http://zmrg.baihongyu.com/