caomw
diff --git a/‎Chapter10/10_deep_learning/01_ann/src/layer.cu‎
Lines changed: 76 additions & 20 deletions b/‎Chapter10/10_deep_learning/01_ann/src/layer.cu‎
Lines changed: 76 additions & 20 deletions
diff --git a/‎Chapter10/10_deep_learning/01_ann/src/layer.h‎
Lines changed: 26 additions & 14 deletions b/‎Chapter10/10_deep_learning/01_ann/src/layer.h‎
Lines changed: 26 additions & 14 deletions
@@ -28,13 +28,13 @@ Layer::~Layer()
 	std::cout << "Destroy Layer: " << name_ << std::endl;
 #endif
 
-	if (output_       != nullptr)  delete output_;
-	if (grad_input_   != nullptr)  delete grad_input_;
+	if (output_       != nullptr) { delete output_;       output_       = nullptr; }
+	if (grad_input_   != nullptr) { delete grad_input_;   grad_input_   = nullptr; }
 
-	if (weights_      != nullptr)  delete weights_;
-	if (biases_       != nullptr)  delete biases_;
-	if (grad_weights_ != nullptr)  delete grad_weights_;
-	if (grad_biases_  != nullptr)  delete grad_biases_;
+	if (weights_      != nullptr) { delete weights_;      weights_	    = nullptr; }
+	if (biases_       != nullptr) { delete biases_;	      biases_       = nullptr; }
+	if (grad_weights_ != nullptr) { delete grad_weights_; grad_weights_ = nullptr; }
+	if (grad_biases_  != nullptr) { delete grad_biases_;  grad_biases_  = nullptr; }
 }
 
 void Layer::init_weight_bias(unsigned int seed)
@@ -179,8 +179,7 @@ Dense::Dense(std::string name, int output_size)
 
 Dense::~Dense()
 {
-	if (d_one_vec != nullptr) 
-		cudaFree(d_one_vec);
+	if (d_one_vec != nullptr) { cudaFree(d_one_vec); d_one_vec = nullptr; }
 }
 
 __global__ void init_one_vec(float* d_one_vec, size_t length)
@@ -192,8 +191,10 @@ __global__ void init_one_vec(float* d_one_vec, size_t length)
 	d_one_vec[i] = 1.f;
 }
 
-Blob<float> *Dense::forward(Blob<float> *input)
+bool Dense::fwd_initialize(Blob<float> *input)
 {
+	bool is_initialize = false;
+
 	// initialize weights and biases
 	if (weights_ == nullptr)
 	{
@@ -204,6 +205,7 @@ Blob<float> *Dense::forward(Blob<float> *input)
 		weights_ = new Blob<float>(1, 1, input_size_, output_size_);
 		biases_  = new Blob<float>(1, 1, output_size_);
 
+		is_initialize = true;
 	}
 
 	// initilaize input and output
@@ -241,9 +243,15 @@ Blob<float> *Dense::forward(Blob<float> *input)
 		{
 			/* do nothing */
 		}
+
+		is_initialize = true;
 	}
 
+	return is_initialize;
+}
 
+Blob<float> *Dense::forward(Blob<float> *input)
+{
 	// output = weights^T * input (without biases)
 	checkCublasErrors(
 		cublasSgemm(cuda_->cublas(),
@@ -275,12 +283,16 @@ Blob<float> *Dense::forward(Blob<float> *input)
 	return output_;
 }
 
-Blob<float> *Dense::backward(Blob<float> *grad_output)
+bool Dense::bwd_initialize(Blob<float> *grad_output)
 {
+	bool is_initialize = false;
+
 	if (grad_weights_ == nullptr)
 	{
 		grad_weights_ = new Blob<float>(weights_->shape());
 		grad_biases_  = new Blob<float>(biases_->shape());
+
+		is_initialize = true;
 	}
 
 	if (grad_input_ == nullptr || batch_size_ != grad_output->n())
@@ -291,8 +303,15 @@ Blob<float> *Dense::backward(Blob<float> *grad_output)
 			grad_input_   = new Blob<float>(input_->shape());
 		else
 			grad_input_->reset(input_->shape());
+
+		is_initialize = true;
 	}
 
+	return is_initialize;
+}
+
+Blob<float> *Dense::backward(Blob<float> *grad_output)
+{
 	// db = (dy) * d_one_vec
 	cublasSgemv(cuda_->cublas(),
 			CUBLAS_OP_N,
@@ -343,20 +362,22 @@ Blob<float> *Dense::backward(Blob<float> *grad_output)
 Activation::Activation(std::string name, cudnnActivationMode_t mode, float coef)
 {
 	name_ = name;
-	mode_ = mode;
-	coef_ = coef;
+	act_mode_ = mode;
+	act_coef_ = coef;
 
 	cudnnCreateActivationDescriptor(&act_desc_);
-	cudnnSetActivationDescriptor(act_desc_, mode, CUDNN_PROPAGATE_NAN, coef);
+	cudnnSetActivationDescriptor(act_desc_, act_mode_, CUDNN_PROPAGATE_NAN, act_coef_);
 }
 
 Activation::~Activation()
 {
 	cudnnDestroyActivationDescriptor(act_desc_);
 }
 
-Blob<float> *Activation::forward(Blob<float> *input)
+bool Activation::fwd_initialize(Blob<float> *input)
 {
+	bool is_initialize = false;
+
 	if (input_ == nullptr || batch_size_ != input->n())
 	{
 		input_ = input;
@@ -369,8 +390,18 @@ Blob<float> *Activation::forward(Blob<float> *input)
 			output_->reset(input->shape());
 
 		output_desc_ = output_->tensor();
+
+		// input_->print( name_ + "::input", false);
+		// output_desc_->print( name_ + "::output", false);
+
+		is_initialize = true;
 	}
 
+	return is_initialize;
+}
+
+Blob<float> *Activation::forward(Blob<float> *input)
+{
 	cudnnActivationForward(cuda_->cudnn(),
 		act_desc_,
 		&cuda_->one,
@@ -383,18 +414,27 @@ Blob<float> *Activation::forward(Blob<float> *input)
 	return output_;
 }
 
-Blob<float> *Activation::backward(Blob<float> *grad_output)
+bool Activation::bwd_initialize(Blob<float> *grad_output)
 {
+	bool is_initialize = false;
+
 	if (grad_input_ == nullptr || batch_size_ != grad_output->n())
 	{
 		grad_output_ = grad_output;
 
 		if (grad_input_ == nullptr)
 			grad_input_ = new Blob<float>(input_->shape());
 		else
-			grad_input_->reset(input_->shape());		
+			grad_input_->reset(input_->shape());
+		
+		is_initialize = true;
 	}
 
+	return is_initialize;
+}
+
+Blob<float> *Activation::backward(Blob<float> *grad_output)
+{
 	cudnnActivationBackward(cuda_->cudnn(),
 		act_desc_,
 		&cuda_->one, 
@@ -418,11 +458,13 @@ Softmax::Softmax(std::string name)
 
 Softmax::~Softmax()
 {
-
+	// do nothing
 }
 
-Blob<float> *Softmax::forward(Blob<float> *input)
+bool Softmax::fwd_initialize(Blob<float> *input)
 {
+	bool is_initialize = false;
+
 	if (input_ == nullptr || batch_size_ != input->n())
 	{
 		input_ = input;
@@ -435,8 +477,15 @@ Blob<float> *Softmax::forward(Blob<float> *input)
 			output_->reset(input->shape());		
 
 		output_desc_ = output_->tensor();
+
+		is_initialize = false;
 	}
 
+	return is_initialize;
+}
+
+Blob<float> *Softmax::forward(Blob<float> *input)
+{
 #if (DEBUG_SOFTMAX & 0x01)
 	std::cout << name_ << "[FORWARD]" << std::endl;
 	input_->print(name_ + "::input", true, input->n());
@@ -454,18 +503,25 @@ Blob<float> *Softmax::forward(Blob<float> *input)
 	return output_;
 }
 
-Blob<float> *Softmax::backward(Blob<float> *target)
+bool Softmax::bwd_initialize(Blob<float> *target)
 {
-	checkCudaErrors(cudaDeviceSynchronize());
+	bool is_initialize = false;
 
 	if (grad_input_ == nullptr || batch_size_ != target->n())
 	{
 		if (grad_input_ == nullptr)
 			grad_input_ = new Blob<float>(input_->shape());
 		else
 		 	grad_input_->reset(input_->shape());
+
+		is_initialize = true;
 	}
 
+	return is_initialize;
+}
+
+Blob<float> *Softmax::backward(Blob<float> *target)
+{
 	// set grad_input_ as predict
 	checkCudaErrors(cudaMemcpyAsync(grad_input_->cuda(), 
 		output_->cuda(), output_->buf_size(), 
 
@@ -16,7 +16,7 @@ class Layer
 {
 public:
     Layer();
-    ~Layer();
+    virtual ~Layer();
 
     virtual Blob<float> *forward(Blob<float> *input) = 0;
     virtual Blob<float> *backward(Blob<float> *grad_input) = 0;
@@ -36,6 +36,9 @@ class Layer
     void unfreeze() { freeze_ = false;}
 
 protected:
+    virtual bool fwd_initialize(Blob<float> *input) = 0;
+    virtual bool bwd_initialize(Blob<float> *grad_output) = 0;
+
     // name of layer
     std::string name_;
 
@@ -83,12 +86,15 @@ class Dense: public Layer
 {
     public:
     Dense(std::string name, int out_size);
-    ~Dense();
+    virtual ~Dense();
+
+    virtual Blob<float> *forward(Blob<float> *input);
+    virtual Blob<float> *backward(Blob<float> *grad_input);
 
-    Blob<float> *forward(Blob<float> *input);
-    Blob<float> *backward(Blob<float> *grad_input);
+    private:
+    bool fwd_initialize(Blob<float> *input);
+    bool bwd_initialize(Blob<float> *grad_output);
 
-    private: 
     int input_size_ = 0;
     int output_size_= 0;
 
@@ -99,30 +105,36 @@ class Activation: public Layer
 {
     public:
     Activation(std::string name, cudnnActivationMode_t mode, float coef = 0.f);
-    ~Activation();
+    virtual ~Activation();
 
-    Blob<float> *forward(Blob<float> *input);
-    Blob<float> *backward(Blob<float> *grad_input);
+    virtual Blob<float> *forward(Blob<float> *input);
+    virtual Blob<float> *backward(Blob<float> *grad_input);
 
     private:
+    bool fwd_initialize(Blob<float> *input);
+    bool bwd_initialize(Blob<float> *grad_output);
+
     cudnnActivationDescriptor_t act_desc_;
-    cudnnActivationMode_t mode_;
-    float coef_;
+    cudnnActivationMode_t       act_mode_;
+    float                       act_coef_;
 };
 
 class Softmax: public Layer
 {
     public:
     Softmax(std::string name);
-    ~Softmax();
+    virtual ~Softmax();
 
-    Blob<float> *forward(Blob<float> *input);
-    Blob<float> *backward(Blob<float> *grad_input);
+    virtual Blob<float> *forward(Blob<float> *input);
+    virtual Blob<float> *backward(Blob<float> *grad_input);
 
     float get_loss(Blob<float> *target);
     int   get_accuracy(Blob<float> *target);
 
-    private:
+    protected:
+    bool fwd_initialize(Blob<float> *input);
+    bool bwd_initialize(Blob<float> *grad_output);
+
     CrossEntropyLoss loss_;
 };