print MMD/JMMD loss

sy565612345 · sy565612345 · commit adc1cdc419c9 · 2019-10-15T11:06:43.000+08:00
diff --git a/pytorch/src/loss.py b/pytorch/src/loss.py
@@ -30,15 +30,6 @@ def DAN(source, target, kernel_mul=2.0, kernel_num=5, fix_sigma=None):
     kernels = guassian_kernel(source, target,
         kernel_mul=kernel_mul, kernel_num=kernel_num, fix_sigma=fix_sigma)
 
-    # Linear version
-    # loss = 0
-    # for i in range(batch_size):
-    #     s1, s2 = i, (i+1)%batch_size
-    #     t1, t2 = s1+batch_size, s2+batch_size
-    #     loss += kernels[s1, s2] + kernels[t1, t2]
-    #     loss -= kernels[s1, t2] + kernels[s2, t1]
-    # return loss / float(batch_size)
-
     loss1 = 0
     for s1 in range(batch_size):
         for s2 in range(s1+1, batch_size):
@@ -54,6 +45,21 @@ def DAN(source, target, kernel_mul=2.0, kernel_num=5, fix_sigma=None):
     loss2 = loss2 / float(batch_size * batch_size)
     return loss1 + loss2
 
+def DAN_Linear(source, target, kernel_mul=2.0, kernel_num=5, fix_sigma=None):
+    batch_size = int(source.size()[0])
+    kernels = guassian_kernel(source, target,
+        kernel_mul=kernel_mul, kernel_num=kernel_num, fix_sigma=fix_sigma)
+
+    # Linear version
+    loss = 0
+    for i in range(batch_size):
+        s1, s2 = i, (i+1)%batch_size
+        t1, t2 = s1+batch_size, s2+batch_size
+        loss += kernels[s1, s2] + kernels[t1, t2]
+        loss -= kernels[s1, t2] + kernels[s2, t1]
+    return loss / float(batch_size)
+
+
 def RTN():
     pass  
     
@@ -75,15 +81,6 @@ def JAN(source_list, target_list, kernel_muls=[2.0, 2.0], kernel_nums=[5, 1], fi
         else:
             joint_kernels = kernels
 
-    # Linear version
-    # loss = 0
-    # for i in range(batch_size):
-    #     s1, s2 = i, (i+1)%batch_size
-    #     t1, t2 = s1+batch_size, s2+batch_size
-    #     loss += joint_kernels[s1, s2] + joint_kernels[t1, t2]
-    #     loss -= joint_kernels[s1, t2] + joint_kernels[s2, t1]
-    # return loss / float(batch_size)
-
     loss1 = 0
     for s1 in range(batch_size):
         for s2 in range(s1 + 1, batch_size):
@@ -99,5 +96,31 @@ def JAN(source_list, target_list, kernel_muls=[2.0, 2.0], kernel_nums=[5, 1], fi
     loss2 = loss2 / float(batch_size * batch_size)
     return loss1 + loss2
 
+def JAN_Linear(source_list, target_list, kernel_muls=[2.0, 2.0], kernel_nums=[5, 1], fix_sigma_list=[None, 1.68]):
+    batch_size = int(source_list[0].size()[0])
+    layer_num = len(source_list)
+    joint_kernels = None
+    for i in range(layer_num):
+        source = source_list[i]
+        target = target_list[i]
+        kernel_mul = kernel_muls[i]
+        kernel_num = kernel_nums[i]
+        fix_sigma = fix_sigma_list[i]
+        kernels = guassian_kernel(source, target,
+            kernel_mul=kernel_mul, kernel_num=kernel_num, fix_sigma=fix_sigma)
+        if joint_kernels is not None:
+            joint_kernels = joint_kernels * kernels
+        else:
+            joint_kernels = kernels
+
+    # Linear version
+    loss = 0
+    for i in range(batch_size):
+        s1, s2 = i, (i+1)%batch_size
+        t1, t2 = s1+batch_size, s2+batch_size
+        loss += joint_kernels[s1, s2] + joint_kernels[t1, t2]
+        loss -= joint_kernels[s1, t2] + joint_kernels[s2, t1]
+    return loss / float(batch_size)
+
 
-loss_dict = {"DAN":DAN, "RTN":RTN, "JAN":JAN}
+loss_dict = {"DAN":DAN, "DAN_Linear":DAN_Linear, "RTN":RTN, "JAN":JAN, "JAN_Linear":JAN_Linear}
diff --git a/pytorch/src/run.sh b/pytorch/src/run.sh
@@ -1,14 +1,8 @@
 ###
 
-#python train.py --gpu_id 6 --source amazon --target webcam --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
+python train.py --gpu_id 0 --source amazon --target webcam --loss_name JAN_Linear --tradeoff 1.0 --using_bottleneck 1
 
-python train.py --gpu_id 6 --source webcam --target amazon --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
+#python train.py --gpu_id 0 --source webcam --target amazon --loss_name DAN --tradeoff 1.0 --using_bottleneck 1
 
-#python train.py --gpu_id 6 --source amazon --target dslr --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
 
-#python train.py --gpu_id 6 --source dslr --target amazon --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
-
-#python train.py --gpu_id 6 --source webcam --target dslr --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
-
-#python train.py --gpu_id 6 --source dslr --target webcam --loss_name JAN --tradeoff 1.0 --using_bottleneck 1 
 
diff --git a/pytorch/src/train.py b/pytorch/src/train.py
@@ -15,6 +15,23 @@
 
 optim_dict = {"SGD": optim.SGD}
 
+class AverageMeter(object):
+    """Computes and stores the average and current value"""
+    def __init__(self):
+        self.reset()
+
+    def reset(self):
+        self.val = 0
+        self.avg = 0
+        self.sum = 0
+        self.count = 0
+
+    def update(self, val, n=1):
+        self.val = val
+        self.sum += val * n
+        self.count += n
+        self.avg = self.sum / self.count
+
 def image_classification_predict(loader, model, test_10crop=True, gpu=True):
     start_test = True
     if test_10crop:
@@ -104,7 +121,8 @@ def image_classification_test(loader, model, test_10crop=True, gpu=True):
                 all_label = torch.cat((all_label, labels.data.float()), 0)
        
     _, predict = torch.max(all_output, 1)
-    accuracy = torch.sum(torch.squeeze(predict).float() == all_label).item() / float(all_label.size()[0])
+    # accuracy = torch.sum(torch.squeeze(predict).float() == all_label).item() / float(all_label.size()[0])
+    accuracy = torch.sum(torch.squeeze(predict).float() == all_label) / float(all_label.size()[0])
     return accuracy
 
 
@@ -192,7 +210,7 @@ def transfer_classification(config):
         parameter_list = [{"params":classifier_layer.parameters(), "lr":10}]
 
     ## add additional network for some methods
-    if loss_config["name"] == "JAN":
+    if loss_config["name"] == "JAN" or loss_config["name"] == "JAN_Linear":
         softmax_layer = nn.Softmax()
         if use_gpu:
             softmax_layer = softmax_layer.cuda()
@@ -211,20 +229,22 @@ def transfer_classification(config):
     ## train   
     len_train_source = len(dset_loaders["source"]["train"]) - 1
     len_train_target = len(dset_loaders["target"]["train"]) - 1
-    transfer_loss_value = classifier_loss_value = total_loss_value = 0.0
+    mmd_meter = AverageMeter()
     for i in range(config["num_iterations"]):
         ## test in the train
         if i % config["test_interval"] == 0:
             base_network.train(False)
             classifier_layer.train(False)
             if net_config["use_bottleneck"]:
                 bottleneck_layer.train(False)
-                print image_classification_test(dset_loaders["target"], nn.Sequential(base_network, bottleneck_layer, classifier_layer), test_10crop=prep_dict["target"]["test_10crop"], gpu=use_gpu)
+                test_acc =  image_classification_test(dset_loaders["target"], nn.Sequential(base_network, bottleneck_layer, classifier_layer), test_10crop=prep_dict["target"]["test_10crop"], gpu=use_gpu)
 
             else:
-                print image_classification_test(dset_loaders["target"], nn.Sequential(base_network, classifier_layer), test_10crop=prep_dict["target"]["test_10crop"], gpu=use_gpu)
+                test_acc = image_classification_test(dset_loaders["target"], nn.Sequential(base_network, classifier_layer), test_10crop=prep_dict["target"]["test_10crop"], gpu=use_gpu)
+
+            print('Iter: %d, mmd = %.4f, test_acc = %.3f' % (i, mmd_meter.avg, test_acc))
+            mmd_meter.reset()
 
-        loss_test = nn.BCELoss()
         ## train one iter
         if net_config["use_bottleneck"]:
             bottleneck_layer.train(True)
@@ -251,15 +271,17 @@ def transfer_classification(config):
 
         classifier_loss = class_criterion(outputs.narrow(0, 0, inputs.size(0)/2), labels_source)
         ## switch between different transfer loss
-        if loss_config["name"] == "DAN":
+        if loss_config["name"] == "DAN" or loss_config["name"] == "DAN_Linear":
             transfer_loss = transfer_criterion(features.narrow(0, 0, features.size(0)/2), features.narrow(0, features.size(0)/2, features.size(0)/2), **loss_config["params"])
         elif loss_config["name"] == "RTN":
             ## RTN is still under developing
             transfer_loss = 0
-        elif loss_config["name"] == "JAN":
+        elif loss_config["name"] == "JAN" or loss_config["name"] == "JAN_Linear":
             softmax_out = softmax_layer(outputs)
             transfer_loss = transfer_criterion([features.narrow(0, 0, features.size(0)/2), softmax_out.narrow(0, 0, softmax_out.size(0)/2)], [features.narrow(0, features.size(0)/2, features.size(0)/2), softmax_out.narrow(0, softmax_out.size(0)/2, softmax_out.size(0)/2)], **loss_config["params"])
 
+        # mmd_meter.update(transfer_loss.item(), inputs_source.size(0))
+        mmd_meter.update(transfer_loss.data[0], inputs_source.size(0))
         total_loss = loss_config["trade_off"] * transfer_loss + classifier_loss
         total_loss.backward()
         optimizer.step()