From cccccbf6cca94a3eaf813b4468453160e91c332b Mon Sep 17 00:00:00 2001
From: Joe Zhao <ztuowen@gmail.com>
Date: Mon, 14 Apr 2014 08:14:45 +0800
Subject: First commit

---
 src/CuTNetLib/cuDiscreteLinearity.cc | 160 +++++++++++++++++++++++++++++++++++
 1 file changed, 160 insertions(+)
 create mode 100644 src/CuTNetLib/cuDiscreteLinearity.cc

(limited to 'src/CuTNetLib/cuDiscreteLinearity.cc')
diff --git a/src/CuTNetLib/cuDiscreteLinearity.cc b/src/CuTNetLib/cuDiscreteLinearity.cc
new file mode 100644
index 0000000..befde24
--- /dev/null
+++ b/src/CuTNetLib/cuDiscreteLinearity.cc
@@ -0,0 +1,160 @@
+
+
+#include "cuDiscreteLinearity.h"
+#include "cumath.h"
+
+namespace TNet
+{
+
+  void 
+  CuDiscreteLinearity::
+  PropagateFnc(const CuMatrix<BaseFloat>& X, CuMatrix<BaseFloat>& Y)
+  {
+    //Y.SetConst(0.0);
+
+    //precopy bias
+    Y.AddScaledRow(1.0,mBias,0.0);
+
+    //mulitply with the matrices
+    int offset_in=0, offset_out=0;
+    for (int i=0; i<mNBlocks; i++) {
+      CuMath<BaseFloat>::OffsetGemm('N','N', 1.0, X, mLinearity[i], 1.0, Y, 
+                                    offset_in, 0, offset_out);
+      offset_in += mLinearity[i].Rows();
+      offset_out += mLinearity[i].Cols();
+    }
+  }
+
+
+  void 
+  CuDiscreteLinearity::
+  BackpropagateFnc(const CuMatrix<BaseFloat>& X, CuMatrix<BaseFloat>& Y)
+  {
+    //Y.SetConst(0.0);
+
+    int offset_in=0, offset_out=0;
+    for(int i=0; i<mNBlocks; i++) {
+      CuMath<BaseFloat>::OffsetGemm('N', 'T', 1.0, X, mLinearity[i], 0.0, Y,
+                                    offset_in, 0, offset_out);
+      offset_in += mLinearity[i].Cols();
+      offset_out += mLinearity[i].Rows();
+    }
+  }
+
+  
+  void 
+  CuDiscreteLinearity::
+  Update() 
+  {
+    //new implementation
+    BaseFloat N = 1; 
+    if(mGradDivFrm) {
+      N = static_cast<BaseFloat>(GetInput().Rows());
+    }
+    BaseFloat mmt_gain = static_cast<BaseFloat>(1.0/(1.0-mMomentum));
+    N *= mmt_gain; //compensate higher gradient estimates due to momentum 
+
+    //get gradients of discrete linearities
+    int offset_in=0, offset_out=0;
+    for(int i=0; i<mNBlocks; i++) {
+      CuMath<BaseFloat>::OffsetGemm('T','N',1.0,
+                        GetInput(),GetErrorInput(),
+                        mMomentum, mLinearityCorrection[i],
+                        offset_in,offset_out,0);
+      offset_in += mLinearity[i].Rows();
+      offset_out += mLinearity[i].Cols();
+    }
+    for(int i=0; i<mNBlocks; i++) {
+      //perform update 
+      mLinearity[i].AddScaled(-mLearningRate/N,mLinearityCorrection[i],1.0);
+      //regularization weight decay
+      mLinearity[i].AddScaled(-mLearningRate*mWeightcost,mLinearity[i],1.0);
+    }
+
+    //get gradient of bias
+    mBiasCorrection.AddColSum(1.0,GetErrorInput(),mMomentum);
+    //update biases
+    mBias.AddScaled(-mLearningRate/N,mBiasCorrection,1.0);
+  }
+
+
+  void
+  CuDiscreteLinearity::
+  ReadFromStream(std::istream& rIn)
+  {
+    rIn >> std::ws >> mNBlocks;
+    if(mNBlocks < 1) {
+      KALDI_ERR << "Bad number of blocks:" << mNBlocks;
+    }
+
+    mLinearity.resize(mNBlocks);
+    mLinearityCorrection.resize(mNBlocks);
+
+    int in_dim = 0, out_dim = 0;
+    for(int i=0; i<mNBlocks; i++) {
+      //matrix is stored transposed as SNet does
+      BfMatrix transpose;
+      rIn >> transpose;
+      mLinearity[i].CopyFrom(BfMatrix(transpose, TRANS));
+      
+      if(transpose.Cols()*transpose.Rows() == 0) {
+        Error("Missing linearity matrix in network file");
+      }
+      //allocate training buffers
+      mLinearityCorrection[i].Init(mLinearity[i].Rows(),mLinearity[i].Cols());
+      mLinearityCorrection[i].SetConst(0.0);
+
+      in_dim += transpose.Cols();
+      out_dim += transpose.Rows();
+    }
+    
+    //biases stored normally
+    BfVector bias;
+    rIn >> bias;
+    mBias.CopyFrom(bias);
+    if(bias.Dim() == 0) {
+      Error("Missing bias vector in network file");
+    }
+    mBiasCorrection.Init(mBias.Dim());
+    mBiasCorrection.SetConst(0.0);
+
+    if(out_dim != GetNOutputs() || 
+       in_dim != GetNInputs() ||
+       mBias.Dim() != GetNOutputs()
+    ){
+      std::ostringstream os;
+      os << "Wrong dimensionalities of matrix/vector in network file\n"
+         << "Inputs:" << GetNInputs()
+         << "Outputs:" << GetNOutputs()
+         << "\n"
+         << "linearityCols:" << in_dim
+         << "linearityRows:" << out_dim
+         << "biasDims:" << mBias.Dim()
+         << "\n";
+      Error(os.str());
+    }
+  }
+
+   
+  void
+  CuDiscreteLinearity::
+  WriteToStream(std::ostream& rOut)
+  {
+    rOut << mNBlocks << "\n";
+    for(int i=0; i< mNBlocks; i++) {
+      //matrix is stored transposed as SNet does
+      BfMatrix tmp;
+      mLinearity[i].CopyTo(tmp);
+      BfMatrix transpose(tmp, TRANS);
+      rOut << transpose;
+    }
+    //biases stored normally
+    BfVector vec;
+    mBias.CopyTo(vec);
+    rOut << vec;
+    rOut << std::endl;
+  }
+
+ 
+} //namespace
+
-- 
cgit v1.2.3-70-g09d2