2021SC@SDUSC
本文章将对 vectorize.py中的代码部分内容进一步分析。重点在于对如何生成矩阵的代码分析
代码Link:https://github.com/rikdz/GraphWriter
def vec_ents(self,ex,field): ? ? # returns tensor and lens ? ? ex = [[field.stoi[x] if x in field.stoi else 0 for x in y.strip().split(" ")] for y in ex.split(";")] ? ? return self.pad_list(ex,1)
定义了一个vec_ents函数,实现一种映射关系:当变量存在于变量池中,将该坐标对应的变量池中的数据值赋值给ex,若不存在,则赋值为零,并用;分割,存储于pad_list中,相当于创建了一个三元组,分别用“ ”和;分词。(返回张量和透镜)
? def mkGraphs(self,r,ent): ? ? #convert triples to entlist with adj and rel matrices ? ? pieces = r.strip().split(';') ? ? x = [[int(y) for y in z.strip().split()] for z in pieces] ? ? rel = [2] ? ? #global root node ? ? adjsize = ent+1+(2*len(x)) ? ? adj = torch.zeros(adjsize,adjsize) ? ? for i in range(ent): ? ? ? #adj[i,0]=1 ? ? ? adj[ent+1,i]=1 ? ? for i in range(adjsize): ? ? ? adj[i,i]=1 ? ? for y in x: ? ? ? rel.extend([y[1]+3,y[1]+3+self.REL.size]) ? ? ? a = y[0] ? ? ? b = y[2] ? ? ? c = ent+len(rel)-2 ? ? ? d = ent+len(rel)-1 ? ? ? adj[a,c] = 1? ? ? ? adj[c,b] = 1 ? ? ? adj[b,d] = 1? ? ? ? adj[d,a] = 1 ? ? rel = torch.LongTensor(rel) ? ? return (adj,rel)
该函数mkGraph的主要功能是将上面函数创建的三元组转化为矩阵,即entlist与adj和rel矩阵。
pieces = r.strip().split(';') x = [[int(y) for y in z.strip().split()] for z in pieces] rel = [2]
首先,该函数对局部变量进行定义,pieces为以;分割的维度,x为分为pieces(降维)后的横坐标,rel是一个列表(仅含2)
#global root node ? ? adjsize = ent+1+(2*len(x)) ? ? adj = torch.zeros(adjsize,adjsize)
对全部节点进行定义,adjsize计算出矩阵的大小,torch.zeros函数全例为torch.zeros(*size, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) -> Tensor 返回一个全为标量 0 的张量,形状由可变参数 *size 定义。该返回结果为一个行列数目均为adjsize的全0矩阵。
for i in range(ent): ? ? ? #adj[i,0]=1 ? ? ? adj[ent+1,i]=1 for i in range(adjsize): ? ? ? adj[i,i]=1
将adj矩阵中横坐标为ent+1位置的所有数据变为1,再对adj矩阵中对角线上的所有数据变为1.
for y in x: ? ? ? rel.extend([y[1]+3,y[1]+3+self.REL.size]) ? ? ? a = y[0] ? ? ? b = y[2] ? ? ? c = ent+len(rel)-2 ? ? ? d = ent+len(rel)-1 ? ? ? adj[a,c] = 1? ? ? ? adj[c,b] = 1 ? ? ? adj[b,d] = 1? ? ? ? adj[d,a] = 1
?遍历每个降维后的单个列表,再rel中添加新的列表[y[1]+3,y[1]+3+self.REL.size],且对0和2位置进行初始化,得到a ,b,同时c,d是第三维初始值,将adj矩阵剩余无实值部分填充为1.
rel = torch.LongTensor(rel)
?return (adj,rel)
torch.LongTensor() 会调用Tensor类的构造函数__init__,生成64位整型类型的张量。?然后返回计算出的adj和rel矩阵张量。
|