随机数种子固定实验结果的一个坑
用随机数种子来固定实验结果应该是一种可选的方案。
def seed_torch(seed=2022):
random.seed(seed)
os.environ['PYTHONHASHSEED'] = str(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
torch.cuda.manual_seed_all(seed)
torch.backends.cudnn.benchmark = False
torch.backends.cudnn.deterministic = True
我在使用nltk获取同义词的时候写的这玩意 synonyms = get_synonym_set(word, text_pos_tag[aug_idx][1])
然后我将这个set转化为list后random.choice来获取随机的一个同义词。
但是通过测试发现,我得到的list并不相同,这也导致了我实验结果的不一致,所以将这个list排个序就可以了。
我做了一个排查,问题不是出在set转化为list这一步,而是出在了得到的set中元素顺序并不一致,因为并不想知道nltk是怎么实现,所以我没有深入下去。
启发就是如果固定了随机数种子,实验结果仍然不一致的话,就要盯着从其他库拿到的东西是否也是固定的。
|