code/SIGN_main.py

from dataloader import Dataset
from SIGN_model import SIGN
import argparse
from torch_geometric.data import DataLoader
from sklearn.model_selection import train_test_split
from SIGN_train import train


parser = argparse.ArgumentParser()
parser.add_argument('--dataset', type=str, default='frappe', help='which dataset to use')
parser.add_argument('--dim', type=int, default=8, help='dimension of entity and relation embeddings')
parser.add_argument('--l0_weight', type=float, default=0.001, help='weight of the l2 regularization term')
parser.add_argument('--l2_weight', type=float, default=0.001, help='weight of the l2 regularization term')
parser.add_argument('--lr', type=float, default=0.05, help='learning rate')
parser.add_argument('--batch_size', type=int, default=1024, help='batch size')
parser.add_argument('--n_epoch', type=int, default=500, help='the number of epochs')
parser.add_argument('--l0_para', nargs='?', default='[0.66, -0.1, 1.1]',
                        help="l0 parameters, which are beta (temprature), \
                            zeta (interval_min) and gama (interval_max).")
parser.add_argument('--hidden_layer', type=int, default=32, help='neural hidden layer')
parser.add_argument('--pred_edges', type=int, default=1, help='!=0: use edges in dataset, 0: predict edges \
                                                                using L_0')
parser.add_argument('--random_seed', type=int, default=2019, help='size of common item be counted')
parser.add_argument('--use_cuda', type=bool, default=True, help='whether to use gpu')
args = parser.parse_args()

dataset = Dataset('../data/', args.dataset, pred_edges=args.pred_edges)
num_feature = dataset.node_M() 
data_num = dataset.data_N()

dataset.shuffle()
train_index = int(len(dataset)* 0.7)
test_index = int(len(dataset) * 0.85)
train_dataset = dataset[:train_index]
test_dataset = dataset[train_index:test_index]
val_dataset = dataset[test_index:]

#train_dataset, rest_dataset = train_test_split(dataset, test_size=0.3, random_state=args.random_seed)
#val_dataset, test_dataset = train_test_split(rest_dataset, test_size=0.5, random_state=args.random_seed)

train_loader = DataLoader(train_dataset, batch_size=args.batch_size)
test_loader = DataLoader(test_dataset, batch_size=args.batch_size)
val_loader = DataLoader(val_dataset, batch_size=args.batch_size)

show_loss = False
print(f"""
datast: {args.dataset}
vector dim: {args.dim}
batch_size: {args.batch_size}
lr: {args.lr}
""")

datainfo = [train_loader, val_loader, test_loader, num_feature]
train(args, datainfo, show_loss, [len(train_dataset), len(val_dataset), len(test_dataset)])