GenSVM/gensvm__optimize_8c_source.html

 #include "gensvm_optimize.h"

 #ifndef GENSVM_PRINT_ITER
   #define GENSVM_PRINT_ITER 100
 #endif

 void gensvm_optimize(struct GenModel *model, struct GenData *data)
 {
     long it = 0;
     double L, Lbar;

     long n = model->n;
     long m = model->m;
     long K = model->K;

     // initialize the workspace
     struct GenWork *work = gensvm_init_work(model);

     // print some info on the dataset and model configuration
     note("Starting main loop.\n");
     note("Dataset:\n");
     note("\tn = %i\n", n);
     note("\tm = %i\n", m);
     note("\tK = %i\n", K);
     note("Parameters:\n");
     note("\tkappa = %f\n", model->kappa);
     note("\tp = %f\n", model->p);
     note("\tlambda = %15.16f\n", model->lambda);
     note("\tepsilon = %g\n", model->epsilon);
     note("\n");

     // compute necessary simplex vectors
     gensvm_simplex(model);
     gensvm_simplex_diff(model);

     // get initial loss
     L = gensvm_get_loss(model, data, work);
     Lbar = L + 2.0*model->epsilon*L;

     // run main loop
     while ((it < model->max_iter) && (Lbar - L)/L > model->epsilon)
     {
         // ensures V contains newest V and Vbar contains V from
         // previous
         gensvm_get_update(model, data, work);
         if (it > 50)
             gensvm_step_doubling(model);

         Lbar = L;
         L = gensvm_get_loss(model, data, work);

         if (it % GENSVM_PRINT_ITER == 0)
             note("iter = %li, L = %15.16f, Lbar = %15.16f, "
                  "reldiff = %15.16f\n", it, L, Lbar, (Lbar - L)/L);
         it++;
     }

     // status == 0 means training was successful
     model->status = 0;

     // print warnings if necessary
     if (L > Lbar) {
         err("[GenSVM Warning]: Negative step occurred in "
                 "majorization.\n");
         model->status = 1;
     }

     if (it >= model->max_iter) {
         err("[GenSVM Warning]: maximum number of iterations "
                 "reached.\n");
         model->status = 2;
     }

     // print final iteration count and loss
     note("Optimization finished, iter = %li, loss = %15.16f, "
             "rel. diff. = %15.16f\n", it-1, L,
             (Lbar - L)/L);

     // compute and print the number of SVs in the model
     note("Number of support vectors: %li\n", gensvm_num_sv(model));

     // store the training error in the model
     model->training_error = (Lbar - L)/L;

     // store the iteration count in the model
     model->elapsed_iter = it - 1;

     // free the workspace
     gensvm_free_work(work);
 }

 double gensvm_get_loss(struct GenModel *model, struct GenData *data,
         struct GenWork *work)
 {
     long i, j;
     long n = model->n;
     long K = model->K;
     long m = model->m;

     double value, rowvalue, loss = 0.0;

     gensvm_calculate_errors(model, data, work->ZV);
     gensvm_calculate_huber(model);

     for (i=0; i<n; i++) {
         rowvalue = 0;
         value = 0;
         for (j=0; j<K; j++) {
             if (j == (data->y[i]-1))
                 continue;
             value = matrix_get(model->H, K, i, j);
             value = pow(value, model->p);
             rowvalue += value;
         }
         rowvalue = pow(rowvalue, 1.0/(model->p));
         rowvalue *= model->rho[i];
         loss += rowvalue;
     }
     loss /= ((double) n);

     value = 0;
     for (i=1; i<m+1; i++) {
         for (j=0; j<K-1; j++) {
             value += pow(matrix_get(model->V, K-1, i, j), 2.0);
         }
     }
     loss += model->lambda * value;

     return loss;
 }

 void gensvm_step_doubling(struct GenModel *model)
 {
     long i, j;
     double value;

     long m = model->m;
     long K = model->K;

     for (i=0; i<m+1; i++) {
         for (j=0; j<K-1; j++) {
             matrix_mul(model->V, K-1, i, j, 2.0);
             value = - matrix_get(model->Vbar, K-1, i, j);
             matrix_add(model->V, K-1, i, j, value);
         }
     }
 }

 void gensvm_calculate_huber(struct GenModel *model)
 {
     long i, j;
     double q, value;

     for (i=0; i<model->n; i++) {
         for (j=0; j<model->K; j++) {
             q = matrix_get(model->Q, model->K, i, j);
             value = 0.0;
             if (q <= -model->kappa) {
                 value = 1.0 - q - (model->kappa+1.0)/2.0;
             } else if (q <= 1.0) {
                 value = 1.0/(2.0*model->kappa+2.0)*pow(1.0 - q,
                             2.0);
             }
             matrix_set(model->H, model->K, i, j, value);
         }
     }
 }

 void gensvm_calculate_errors(struct GenModel *model, struct GenData *data,
         double *ZV)
 {
     long i, j;
     double q, *uu_row = NULL;

     long n = model->n;
     long K = model->K;

     gensvm_calculate_ZV(model, data, ZV);

     for (i=0; i<n; i++) {
         for (j=0; j<K; j++) {
             if (j == (data->y[i]-1))
                 continue;
             uu_row = &model->UU[((data->y[i]-1)*K+j)*(K-1)];
             q = cblas_ddot(K-1, &ZV[i*(K-1)], 1, uu_row, 1);
             matrix_set(model->Q, K, i, j, q);
         }
     }
 }

gensvm_calculate_huber
void gensvm_calculate_huber(struct GenModel *model)
Calculate the Huber hinge errors.
Definition: gensvm_optimize.c:242

GenWork::K
long K
number of classes for the workspace
Definition: gensvm_base.h:156

GenModel::H
double * H
Huber weighted error matrix.
Definition: gensvm_base.h:126

GenModel::epsilon
double epsilon
stopping criterion for the IM algorithm.
Definition: gensvm_base.h:101

err
void err(const char *fmt,...)
Parse a formatted string and write it to standard error.
Definition: gensvm_print.c:84

GenModel::training_error
double training_error
loss function value after training has finished
Definition: gensvm_base.h:130

gensvm_simplex
void gensvm_simplex(struct GenModel *model)
Generate matrix of simplex vertex coordinates.
Definition: gensvm_simplex.c:44

gensvm_get_update
void gensvm_get_update(struct GenModel *model, struct GenData *data, struct GenWork *work)
Perform a single step of the majorization algorithm to update V.
Definition: gensvm_update.c:323

GenWork::m
long m
number of features for the workspace
Definition: gensvm_base.h:154

GenModel::p
double p
parameter for the L-p norm in the loss function
Definition: gensvm_base.h:103

GenModel::UU
double * UU
simplex difference matrix
Definition: gensvm_base.h:122

gensvm_calculate_errors
void gensvm_calculate_errors(struct GenModel *model, struct GenData *data, double *ZV)
Calculate the scalar errors.
Definition: gensvm_optimize.c:277

matrix_get
#define matrix_get(M, cols, i, j)
Definition: gensvm_globals.h:111

GenWork::ZV
double * ZV
n x (K-1) working matrix for the Z * V calculation
Definition: gensvm_base.h:169

gensvm_free_work
void gensvm_free_work(struct GenWork *work)
Free an allocated GenWork instance.
Definition: gensvm_base.c:277

GenWork
A structure to hold the GenSVM workspace.
Definition: gensvm_base.h:151

GenModel::status
int status
status of the model after training
Definition: gensvm_base.h:143

gensvm_num_sv
long gensvm_num_sv(struct GenModel *model)
Calculate the number of support vectors in a model.
Definition: gensvm_sv.c:46

gensvm_init_work
struct GenWork * gensvm_init_work(struct GenModel *model)
Initialize the workspace structure.
Definition: gensvm_base.c:245

GenModel::V
double * V
augmented weight matrix
Definition: gensvm_base.h:115

matrix_add
#define matrix_add(M, cols, i, j, val)
Definition: gensvm_globals.h:116

GenModel::Q
double * Q
error matrix
Definition: gensvm_base.h:124

GenData::y
long * y
array of class labels, 1..K
Definition: gensvm_base.h:66

gensvm_simplex_diff
void gensvm_simplex_diff(struct GenModel *model)
Generate the simplex difference matrix.
Definition: gensvm_simplex.c:82

GenData
A structure to represent the data.
Definition: gensvm_base.h:57

GenModel
A structure to represent a single GenSVM model.
Definition: gensvm_base.h:92

gensvm_step_doubling
void gensvm_step_doubling(struct GenModel *model)
Use step doubling.
Definition: gensvm_optimize.c:206

gensvm_calculate_ZV
void gensvm_calculate_ZV(struct GenModel *model, struct GenData *data, double *ZV)
Wrapper around sparse/dense versions of this function.
Definition: gensvm_zv.c:50

GenModel::Vbar
double * Vbar
Definition: gensvm_base.h:117

gensvm_get_loss
double gensvm_get_loss(struct GenModel *model, struct GenData *data, struct GenWork *work)
Calculate the current value of the loss function.
Definition: gensvm_optimize.c:155

GenModel::n
long n
number of instances in the dataset
Definition: gensvm_base.h:97

GenModel::max_iter
long max_iter
maximum number of iterations of the algorithm
Definition: gensvm_base.h:141

GenModel::rho
double * rho
vector of instance weights
Definition: gensvm_base.h:128

GenModel::elapsed_iter
long elapsed_iter
number of elapsed iterations in training
Definition: gensvm_base.h:132

gensvm_optimize.h
Header file for gensvm_optimize.c.

gensvm_optimize
void gensvm_optimize(struct GenModel *model, struct GenData *data)
The main training loop for GenSVM.
Definition: gensvm_optimize.c:56

GenModel::kappa
double kappa
parameter for the Huber hinge function
Definition: gensvm_base.h:105

GenModel::K
long K
number of classes in the dataset
Definition: gensvm_base.h:95

matrix_set
#define matrix_set(M, cols, i, j, val)
Definition: gensvm_globals.h:106

matrix_mul
#define matrix_mul(M, cols, i, j, val)
Definition: gensvm_globals.h:121

GENSVM_PRINT_ITER
#define GENSVM_PRINT_ITER
Definition: gensvm_optimize.c:37

GenWork::n
long n
number of instances for the workspace
Definition: gensvm_base.h:152

GenModel::m
long m
number of predictor variables in the dataset
Definition: gensvm_base.h:99

GenModel::lambda
double lambda
regularization parameter in the loss function
Definition: gensvm_base.h:107

note
void note(const char *fmt,...)
Parse a formatted string and write to the output stream.
Definition: gensvm_print.c:62