v0

bl0 · bl0 · commit 4e4f7a66c04b · 2018-11-24T14:41:53.000+08:00
diff --git a/README.md b/README.md
@@ -6,7 +6,7 @@ Code for ["HashGAN: Deep Learning to Hash with Pair Conditional Wasserstein GAN"
 
 ## Prerequisites
 
-- Python3, NumPy, TensorFlow, SciPy, Matplotlib
+- Python3, NumPy, TensorFlow-gpu, SciPy, Matplotlib, easydict, yacs 
 - A recent NVIDIA GPU
 
 ## Data Preparation
diff --git a/config_yaml/cifar_step_1.yaml b/config_yaml/cifar_step_1.yaml
@@ -1,20 +1,18 @@
 MODEL:
-    ARCHITECTURE: "NORM"
+    G_ARCHITECTURE: "NORM"
+    D_ARCHITECTURE: "NORM"
+    G_PRETRAINED_MODEL_PATH: ''
+    D_PRETRAINED_MODEL_PATH: ''
 DATA:
     USE_DATASET: "cifar10"  # "cifar10", "nuswide81", "coco"
     LABEL_DIM: 10
     DB_SIZE: 54000
     TEST_SIZE: 1000
     WIDTH_HEIGHT: 32
-    OUTPUT_DIM: 3072 # Number of pixels (32*32*3)
     MAP_R: 54000  
     LIST_ROOT: "./data_list/cifar10"
     DATA_ROOT: "./data/cifar10"
-    OUTPUT_DIR: "./output/cifar10_step_1"
-    IMAGE_DIR: "./output/cifar10_step_1/images"
-    MODEL_DIR: "./output/cifar10_step_1/models"
-    LOG_DIR: "./output/cifar10_step_1/logs"
-
+    OUTPUT_DIR: "./output/cifar10_step_1_ACGAN_SCALE_G_10.0"
 TRAIN:
     BATCH_SIZE: 64
     ITERS: 100000
@@ -24,7 +22,8 @@ TRAIN:
     DECAY: True  # Whether to decay LR over learning
     N_CRITIC: 5 # Critic steps per generator steps
     EVAL_FREQUENCY: 20000  # How frequently to evaluate and save model
+    CHECKPOINT_FREQUENCY: 1000
     ACGAN_SCALE: 1.0
-    ACGAN_SCALE_G: 0.1
+    ACGAN_SCALE_G: 10.0
     WGAN_SCALE: 1.0  
     WGAN_SCALE_G: 1.0
diff --git a/config_yaml/cifar_step_2.yaml b/config_yaml/cifar_step_2.yaml
@@ -1,32 +1,32 @@
 MODEL:
-    ARCHITECTURE: "ALEXNET"
-    PRETRAINED_MODEL_PATH: "output/cifar10_step_1/models/iteration_79999.ckpt"
-    ALEXNET_PRETRAINED_MODEL_PATH: "pretrained_models/reference_pretrain.npy"
+    G_ARCHITECTURE: "NORM"
+    D_ARCHITECTURE: "ALEXNET"
+    G_PRETRAINED_MODEL_PATH: ""
+    D_PRETRAINED_MODEL_PATH: "pretrained_models/reference_pretrain.npy"
 DATA:
     USE_DATASET: "cifar10"  # "cifar10", "nuswide81", "coco"
     LABEL_DIM: 10
     DB_SIZE: 54000
     TEST_SIZE: 1000
     WIDTH_HEIGHT: 32
-    OUTPUT_DIM: 3072 # Number of pixels (32*32*3)
     MAP_R: 54000
     LIST_ROOT: "./data_list/cifar10"
     DATA_ROOT: "./data/cifar10"
-    OUTPUT_DIR: "./output/cifar10_finetune"
-    IMAGE_DIR: "./output/cifar10_finetune/images"
-    MODEL_DIR: "./output/cifar10_finetune/models"
-    LOG_DIR: "./output/cifar10_finetune/logs"
+    OUTPUT_DIR: "./output/cifar10_finetune_acgan_scale_fake_0"
 
 TRAIN:
     BATCH_SIZE: 128
     ITERS: 10000
-    CROSS_ENTROPY_ALPHA: 5
+    CROSS_ENTROPY_ALPHA: 10
     LR: 1e-4  # Initial learning rate
     G_LR: 0.0  # 1e-4
     DECAY: True  # Whether to decay LR over learning
     N_CRITIC: 1  # Critic steps per generator steps
-    EVAL_FREQUENCY: 2000  # How frequently to save model
+    EVAL_FREQUENCY: 2000
+    SAMPLE_FREQUENCY: 1
     ACGAN_SCALE: 1.0
-    ACGAN_SCALE_G: 0.0
+    ACGAN_SCALE_FAKE: 0.0 # 1.0
     WGAN_SCALE: 0.0  
-    WGAN_SCALE_G: 0.0
+    WGAN_SCALE_GP: 10.0
+    ACGAN_SCALE_G: 0.1
+    WGAN_SCALE_G: 1.0
diff --git a/lib/architecture.py b/lib/architecture.py
@@ -202,6 +202,7 @@ def good_discriminator(inputs, cfg):
 
 def alexnet_discriminator(inputs, cfg, stage="train"):
     # noinspection PyTypeChecker
+    # TODO: don't load imagenet pretrained model when D_PRETRAINED_MODEL_PATH is given
     net_data = dict(np.load(cfg.MODEL.ALEXNET_PRETRAINED_MODEL_PATH, encoding='latin1').item())
 
     if inputs.shape[1] != 256:
@@ -399,16 +400,16 @@ def convolve(i, k): return tf.nn.conv2d(i, k, [1, 1, 1, 1], padding='SAME')
 
 
 def generator(n_samples, labels, cfg, noise=None):
-    if cfg.MODEL.ARCHITECTURE == "GOOD":
+    if cfg.MODEL.G_ARCHITECTURE == "GOOD":
         return good_generator(n_samples, labels, noise=noise, cfg=cfg)
     else:
         return old_generator(n_samples, labels, noise=noise, cfg=cfg)
 
 
 def discriminator(inputs, cfg, stage="train"):
-    if cfg.MODEL.ARCHITECTURE == "GOOD":
+    if cfg.MODEL.D_ARCHITECTURE == "GOOD":
         return good_discriminator(inputs, cfg=cfg)
-    elif cfg.MODEL.ARCHITECTURE == "ALEXNET":
+    elif cfg.MODEL.D_ARCHITECTURE == "ALEXNET":
         return alexnet_discriminator(inputs, stage=stage, cfg=cfg)
     else:
         return old_discriminator(inputs, cfg=cfg)
diff --git a/lib/config.py b/lib/config.py
@@ -1,49 +1,69 @@
 from yacs.config import CfgNode
-import os.path as osp
-
-_C = CfgNode()
-
-_C.MODEL = CfgNode()
-_C.MODEL.ARCHITECTURE = "NORM"  # GOOD, NORM
-_C.MODEL.DIM_G = 128  # generator dimensionality
-_C.MODEL.DIM_D = 128  # Critic dimensionality
-_C.MODEL.DIM = 64  # DIM for good generator and discriminator
-_C.MODEL.HASH_DIM = 64
-_C.MODEL.PRETRAINED_MODEL_PATH = ""
-_C.MODEL.ALEXNET_PRETRAINED_MODEL_PATH = "pretrained_models/reference_pretrain.npy"
-
-_C.DATA = CfgNode()
-_C.DATA.USE_DATASET = "cifar10"  # "cifar10", "nuswide81", "coco"
-_C.DATA.LIST_ROOT = "./data/cifar10"
-_C.DATA.DATA_ROOT = "./data_list/cifar10"
-_C.DATA.LABEL_DIM = 10
-_C.DATA.DB_SIZE = 54000
-_C.DATA.TEST_SIZE = 1000
-_C.DATA.WIDTH_HEIGHT = 32
-_C.DATA.OUTPUT_DIM = 32 * 32 * 3  # Number of pixels (32*32*3)
-_C.DATA.MAP_R = 54000
-
-_C.DATA.OUTPUT_DIR = "./output/cifar10_step_1"
-_C.DATA.IMAGE_DIR = osp.join(_C.DATA.OUTPUT_DIR, "images")
-_C.DATA.MODEL_DIR = osp.join(_C.DATA.OUTPUT_DIR, "models")
-_C.DATA.LOG_DIR = osp.join(_C.DATA.OUTPUT_DIR, "logs")
-
-_C.TRAIN = CfgNode()
-_C.TRAIN.BATCH_SIZE = 64
-_C.TRAIN.ITERS = 100000
-_C.TRAIN.CROSS_ENTROPY_ALPHA = 5
-_C.TRAIN.LR = 1e-4  # Initial learning rate
-_C.TRAIN.G_LR = 1e-4  # 1e-4
-_C.TRAIN.DECAY = True  # Whether to decay LR over learning
-_C.TRAIN.N_CRITIC = 5  # Critic steps per generator steps
-_C.TRAIN.EVAL_FREQUENCY = 20000  # How frequently to evaluate and save model
-_C.TRAIN.RUNTIME_MEASURE_FREQUENCY = 20  # How frequently to evaluate and save model
-_C.TRAIN.SAMPLE_FREQUENCY = 1000  # How frequently to evaluate and save model
-_C.TRAIN.ACGAN_SCALE = 1.0
-_C.TRAIN.ACGAN_SCALE_G = 0.1
-_C.TRAIN.WGAN_SCALE = 1.0
-_C.TRAIN.WGAN_SCALE_G = 1.0
-_C.TRAIN.NORMED_CROSS_ENTROPY = True
-_C.TRAIN.FAKE_RATIO = 1.0
-
-config = _C
+import os
+
+config = CfgNode()
+
+config.MODEL = CfgNode()
+config.MODEL.DIM_G = 128  # generator dimensionality
+config.MODEL.DIM_D = 128  # Critic dimensionality
+config.MODEL.DIM = 64  # DIM for good generator and discriminator
+config.MODEL.HASH_DIM = 64
+config.MODEL.G_ARCHITECTURE = "NORM"  # GOOD, NORM
+config.MODEL.D_ARCHITECTURE = "NORM"  # GOOD, NORM, ALEXNET
+config.MODEL.G_PRETRAINED_MODEL_PATH = ""
+config.MODEL.D_PRETRAINED_MODEL_PATH = ""
+# TODO: merge ALEXNET_PRETRAINED_MODEL_PATH  and D_PRETRAINED_MODEL_PATH
+config.MODEL.ALEXNET_PRETRAINED_MODEL_PATH = "./pretrained_models/reference_pretrain.npy"
+
+config.DATA = CfgNode()
+config.DATA.USE_DATASET = "cifar10"  # "cifar10", "nuswide81", "coco"
+config.DATA.LIST_ROOT = "./data/cifar10"
+config.DATA.DATA_ROOT = "./data_list/cifar10"
+config.DATA.LABEL_DIM = 10
+config.DATA.DB_SIZE = 54000
+config.DATA.TEST_SIZE = 1000
+config.DATA.WIDTH_HEIGHT = 32
+config.DATA.OUTPUT_DIM = 3 * (config.DATA.WIDTH_HEIGHT ** 2)  # Number of pixels (32*32*3)
+config.DATA.MAP_R = 54000
+config.DATA.OUTPUT_DIR = "./output/cifar10_step_1"
+config.DATA.IMAGE_DIR = os.path.join(config.DATA.OUTPUT_DIR, "images")
+config.DATA.MODEL_DIR = os.path.join(config.DATA.OUTPUT_DIR, "models")
+config.DATA.LOG_DIR = os.path.join(config.DATA.OUTPUT_DIR, "logs")
+
+config.TRAIN = CfgNode()
+config.TRAIN.EVALUATE_MODE = False
+config.TRAIN.BATCH_SIZE = 64
+config.TRAIN.ITERS = 100000
+config.TRAIN.CROSS_ENTROPY_ALPHA = 5
+config.TRAIN.LR = 1e-4  # Initial learning rate
+config.TRAIN.G_LR = 1e-4  # 1e-4
+config.TRAIN.DECAY = True  # Whether to decay LR over learning
+config.TRAIN.N_CRITIC = 5  # Critic steps per generator steps
+config.TRAIN.EVAL_FREQUENCY = 20000  # How frequently to evaluate and save model
+config.TRAIN.CHECKPOINT_FREQUENCY = 2000  # How frequently to evaluate and save model
+config.TRAIN.RUNTIME_MEASURE_FREQUENCY = 200  # How frequently to evaluate and save model
+config.TRAIN.SAMPLE_FREQUENCY = 1000  # How frequently to evaluate and save model
+config.TRAIN.ACGAN_SCALE = 1.0
+config.TRAIN.ACGAN_SCALE_FAKE = 1.0
+config.TRAIN.WGAN_SCALE = 1.0
+config.TRAIN.WGAN_SCALE_GP = 10.0
+config.TRAIN.ACGAN_SCALE_G = 0.1
+config.TRAIN.WGAN_SCALE_G = 1.0
+config.TRAIN.NORMED_CROSS_ENTROPY = True
+config.TRAIN.FAKE_RATIO = 1.0
+
+
+def update_and_inference_config(cfg_file):
+    config.merge_from_file(cfg_file)
+
+    config.DATA.IMAGE_DIR = os.path.join(config.DATA.OUTPUT_DIR, "images")
+    config.DATA.MODEL_DIR = os.path.join(config.DATA.OUTPUT_DIR, "models")
+    config.DATA.LOG_DIR = os.path.join(config.DATA.OUTPUT_DIR, "logs")
+    config.DATA.OUTPUT_DIM = 3 * (config.DATA.WIDTH_HEIGHT ** 2)  # Number of pixels (32*32*3)
+
+    os.makedirs(config.DATA.IMAGE_DIR, exist_ok=True)
+    os.makedirs(config.DATA.MODEL_DIR, exist_ok=True)
+    os.makedirs(config.DATA.LOG_DIR, exist_ok=True)
+
+    config.freeze()
+    return config
diff --git a/lib/metric.py b/lib/metric.py
@@ -13,7 +13,6 @@ def get_maps_by_feature(self, database, query):
         ips = np.dot(query.output, database.output.T)
         ids = np.argsort(-ips, 1)
         apx = []
-        print("#calc mAPs# calculating mAPs")
         for i in range(ips.shape[0]):
             label = query.label[i, :].copy()
             label[label == 0] = -1
@@ -22,5 +21,4 @@ def get_maps_by_feature(self, database, query):
             px = np.cumsum(imatch).astype(float) / np.arange(1, self.R + 1, 1)
             if rel != 0:
                 apx.append(np.sum(px * imatch) / rel)
-        print("mAPs: ", np.mean(np.array(apx)))
         return np.mean(np.array(apx))
diff --git a/main.py b/main.py