Subtitle data from here
wget https://github.com/fateleak/dgk_lost_conv/raw/master/dgk_shooter_min.conv.zip
输出:dgk_shooter_min.conv.zip
unzip dgk_shooter_min.conv.zip
输出:dgk_shooter_min.conv
https://github.com/facebookresearch/fastText/blob/master/pretrained-vectors.md
注意是文本格式的
wget https://s3-us-west-1.amazonaws.com/fasttext-vectors/wiki.zh.vec
得到 wiki.zh.vec
文件
运行
python3 read_vector.py
得到 word_vec.pkl
文件在目录下
python3 extract_conv.py
输出:chatbot.pkl
运行 python3 train.py
训练(默认到./s2ss_chatbot.ckpt
)
或者!
运行 python3 train_anti.py
训练抗语言模型(默认到./s2ss_chatbot_anti.ckpt
)
运行 python3 test.py
查看测试结果,需要提前训练普通模型
或者!
运行 python3 test_anti.py
查看抗语言模型的测试结果,需要提前训练抗语言模型
或者!
运行 python3 test_compare.py
查看普通模型和抗语言模型的对比测试结果,
需要提前训练两个模型