1. 首页 > python

网站伪原创工具-python-批量替换关键词,同义词

import os
import synonyms
import jieba.posseg as jp

# 指定文件夹路径
folder_path = 'D:\\360MoveData\\Users\\pc\\Desktop\\采集1\\要伪原创\\'

# 获取文件夹中所有的文件名
file_names = os.listdir(folder_path)

for file_name in file_names:
    # 拼接文件路径
    file_path = os.path.join(folder_path, file_name)

    # 打开文件并读取内容
    with open(file_path, encoding='utf-8') as f:
        file_content = f.read()

    # 进行关键词替换
    article = file_content
    _word_dict = dict()

    for word, flag in jp.cut(article):
        if len(word) < 2:
            continue
        _word_list, word_count = synonyms.nearby(word)
        for _word in _word_list:
            if word == _word:
                continue
            _word_dict[word] = _word
            break

    for word, _word in _word_dict.items():
        article = article.replace(word, _word)

    # 生成新的文件名
    new_file_name = os.path.splitext(file_name)[0] + '.txt'
    new_file_path = os.path.join("D:\\360MoveData\\Users\\pc\\Desktop\\采集1\\伪原创的结果\\", new_file_name)

    print(new_file_path)
    print(type(new_file_path))

    # 将替换后的内容保存到新文件中
    with open(new_file_path, 'w', encoding='utf-8') as f:
        f.write(article)

    print(f"替换后的内容已保存到文件:{new_file_name}")