commit
d8b3c3c7db
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG m, FLOAT *a, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG m, FLOAT *a, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dp1 = 1.;
|
||||
// const static FLOAT dp1 = 1.;
|
||||
|
||||
int CNAME(BLASLONG n, BLASLONG k, FLOAT *a, BLASLONG lda, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -40,7 +40,7 @@
|
|||
#include <ctype.h>
|
||||
#include "common.h"
|
||||
|
||||
const static FLOAT dm1 = -1.;
|
||||
// const static FLOAT dm1 = -1.;
|
||||
|
||||
int CNAME(BLASLONG m, FLOAT *a, FLOAT *b, BLASLONG incb, void *buffer){
|
||||
|
||||
|
|
|
@ -974,7 +974,7 @@ static int gemm_driver(blas_arg_t *args, BLASLONG *range_m, BLASLONG
|
|||
int CNAME(blas_arg_t *args, BLASLONG *range_m, BLASLONG *range_n, FLOAT *sa, FLOAT *sb, BLASLONG mypos){
|
||||
|
||||
BLASLONG m = args -> m;
|
||||
BLASLONG n = args -> n;
|
||||
// BLASLONG n = args -> n;
|
||||
BLASLONG nthreads = args -> nthreads;
|
||||
BLASLONG divN, divT;
|
||||
int mode;
|
||||
|
@ -985,13 +985,14 @@ int CNAME(blas_arg_t *args, BLASLONG *range_m, BLASLONG *range_n, FLOAT *sa, FLO
|
|||
|
||||
m = m_to - m_from;
|
||||
}
|
||||
|
||||
/*
|
||||
if (range_n) {
|
||||
BLASLONG n_from = *(((BLASLONG *)range_n) + 0);
|
||||
BLASLONG n_to = *(((BLASLONG *)range_n) + 1);
|
||||
|
||||
n = n_to - n_from;
|
||||
}
|
||||
*/
|
||||
|
||||
if ((args -> m < nthreads * SWITCH_RATIO) || (args -> n < nthreads * SWITCH_RATIO)) {
|
||||
GEMM3M_LOCAL(args, range_m, range_n, sa, sb, 0);
|
||||
|
|
|
@ -719,10 +719,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
|
||||
if (m & 1){
|
||||
aoffset1 = aoffset;
|
||||
aoffset += lda;
|
||||
// aoffset += lda;
|
||||
|
||||
boffset1 = boffset;
|
||||
boffset += 8;
|
||||
// boffset += 8;
|
||||
|
||||
i = (n >> 3);
|
||||
if (i > 0){
|
||||
|
@ -762,7 +762,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset2 + 1) = ctemp02;
|
||||
*(boffset2 + 2) = ctemp03;
|
||||
*(boffset2 + 3) = ctemp04;
|
||||
boffset2 += 4;
|
||||
// boffset2 += 4;
|
||||
}
|
||||
|
||||
if (n & 2){
|
||||
|
@ -772,7 +772,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
|
||||
*(boffset3 + 0) = ctemp01;
|
||||
*(boffset3 + 1) = ctemp02;
|
||||
boffset3 += 2;
|
||||
// boffset3 += 2;
|
||||
}
|
||||
|
||||
if (n & 1){
|
||||
|
|
|
@ -121,12 +121,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data03;
|
||||
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -141,8 +141,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data03;
|
||||
#endif
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
}
|
||||
}
|
||||
|
@ -191,7 +191,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -237,24 +237,24 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1;
|
||||
ao3 += 1;
|
||||
ao4 += 1;
|
||||
ao4 += 1; */
|
||||
b += 4;
|
||||
}
|
||||
|
||||
} else
|
||||
if (X < posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
|
||||
b += 8;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -414,12 +414,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -477,7 +477,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -608,16 +608,16 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} else
|
||||
if (X < posY) {
|
||||
if (m & 4) {
|
||||
ao1 += 4 * lda;
|
||||
/* ao1 += 4 * lda;
|
||||
ao2 += 4 * lda;
|
||||
ao3 += 4 * lda;
|
||||
ao4 += 4 * lda;
|
||||
ao4 += 4 * lda; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
// ao1 += 2 * lda;
|
||||
b += 16;
|
||||
}
|
||||
|
||||
|
@ -1018,7 +1018,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} else
|
||||
if (X < posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
// ao1 += 2 * lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
|
|
@ -116,8 +116,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (m & 1) {
|
||||
|
||||
if (X > posY) {
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X < posY) {
|
||||
|
@ -126,7 +126,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -141,7 +141,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
#endif
|
||||
ao1 += 2;
|
||||
// ao1 += 2;
|
||||
b += 2;
|
||||
}
|
||||
}
|
||||
|
@ -190,7 +190,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -204,18 +204,18 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X > posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1;
|
||||
ao3 += 1;
|
||||
ao4 += 1;
|
||||
ao4 += 1; */
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -241,7 +241,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 7] = data08;
|
||||
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
// ao2 += 2 * lda;
|
||||
|
||||
b += 8;
|
||||
}
|
||||
|
@ -257,7 +257,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -412,8 +412,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (i) {
|
||||
|
||||
if (X > posY) {
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
|
||||
b += 2;
|
||||
} else
|
||||
|
@ -423,7 +423,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -481,7 +481,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -443,27 +443,27 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X > posY) {
|
||||
|
||||
if (m & 4) {
|
||||
ao1 += 4;
|
||||
/* ao1 += 4;
|
||||
ao2 += 4;
|
||||
ao3 += 4;
|
||||
ao4 += 4;
|
||||
ao5 += 4;
|
||||
ao6 += 4;
|
||||
ao7 += 4;
|
||||
ao8 += 4;
|
||||
ao8 += 4; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao5 += 2;
|
||||
ao6 += 2;
|
||||
ao7 += 2;
|
||||
ao8 += 2;
|
||||
ao8 += 2; */
|
||||
|
||||
b += 16;
|
||||
}
|
||||
|
@ -548,8 +548,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
ao1 += 4 * lda;
|
||||
ao2 += 4 * lda;
|
||||
ao3 += 4 * lda;
|
||||
ao4 += 4 * lda;
|
||||
/* ao3 += 4 * lda;
|
||||
ao4 += 4 * lda; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
@ -964,10 +964,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X > posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
|
||||
b += 8;
|
||||
}
|
||||
|
|
|
@ -122,12 +122,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data03;
|
||||
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -142,7 +142,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data03;
|
||||
#endif
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
}
|
||||
}
|
||||
|
|
|
@ -241,23 +241,23 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data05;
|
||||
b[ 3] = data07;
|
||||
|
||||
ao1 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1;
|
||||
ao3 += 1;
|
||||
ao4 += 1;
|
||||
ao4 += 1; */
|
||||
b += 4;
|
||||
}
|
||||
|
||||
} else
|
||||
if (X > posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -418,13 +418,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
b[ 0] = data01;
|
||||
b[ 1] = data05;
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += lda;
|
||||
ao2 += lda;
|
||||
/* ao1 += lda;
|
||||
ao2 += lda; */
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -438,8 +438,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data05;
|
||||
#endif
|
||||
ao1 += lda;
|
||||
ao2 += lda;
|
||||
/* ao1 += lda;
|
||||
ao2 += lda; */
|
||||
b += 2;
|
||||
}
|
||||
}
|
||||
|
|
|
@ -610,16 +610,16 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} else
|
||||
if (X > posY) {
|
||||
if (m & 4) {
|
||||
ao1 += 4 * lda;
|
||||
/* ao1 += 4 * lda;
|
||||
ao2 += 4 * lda;
|
||||
ao3 += 4 * lda;
|
||||
ao4 += 4 * lda;
|
||||
ao4 += 4 * lda; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
// ao1 += 2 * lda;
|
||||
b += 16;
|
||||
}
|
||||
|
||||
|
@ -1019,7 +1019,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} else
|
||||
if (X > posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
// ao1 += 2 * lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
|
|
@ -117,8 +117,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (m & 1) {
|
||||
|
||||
if (X < posY) {
|
||||
ao1 += 1;
|
||||
ao2 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1; */
|
||||
b += 2;
|
||||
} else
|
||||
if (X > posY) {
|
||||
|
@ -127,7 +127,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -139,7 +139,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = ZERO;
|
||||
#endif
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
}
|
||||
}
|
||||
|
|
|
@ -201,18 +201,18 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X < posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += 1;
|
||||
/* ao1 += 1;
|
||||
ao2 += 1;
|
||||
ao3 += 1;
|
||||
ao4 += 1;
|
||||
ao4 += 1; */
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -238,7 +238,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 7] = data08;
|
||||
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
// ao2 += 2 * lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -253,7 +253,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
}
|
||||
|
||||
|
@ -401,7 +401,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (i) {
|
||||
|
||||
if (X < posY) {
|
||||
ao1 += 2;
|
||||
// ao1 += 2;
|
||||
b += 2;
|
||||
} else
|
||||
if (X > posY) {
|
||||
|
@ -411,7 +411,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 0] = data01;
|
||||
b[ 1] = data02;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 2;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
|
|
@ -501,27 +501,27 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X < posY) {
|
||||
|
||||
if (m & 4) {
|
||||
ao1 += 4;
|
||||
/* ao1 += 4;
|
||||
ao2 += 4;
|
||||
ao3 += 4;
|
||||
ao4 += 4;
|
||||
ao5 += 4;
|
||||
ao6 += 4;
|
||||
ao7 += 4;
|
||||
ao8 += 4;
|
||||
ao8 += 4; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao5 += 2;
|
||||
ao6 += 2;
|
||||
ao7 += 2;
|
||||
ao8 += 2;
|
||||
ao8 += 2; */
|
||||
|
||||
b += 16;
|
||||
}
|
||||
|
@ -606,8 +606,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
ao1 += 4 * lda;
|
||||
ao2 += 4 * lda;
|
||||
ao3 += 4 * lda;
|
||||
ao4 += 4 * lda;
|
||||
/* ao3 += 4 * lda;
|
||||
ao4 += 4 * lda; */
|
||||
|
||||
b += 32;
|
||||
}
|
||||
|
@ -1022,10 +1022,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X < posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
|
||||
b += 8;
|
||||
}
|
||||
|
|
|
@ -206,7 +206,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 8;
|
||||
|
||||
ii += 2;
|
||||
|
|
|
@ -487,8 +487,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
|
||||
a1 += 4 * lda;
|
||||
a2 += 4 * lda;
|
||||
a3 += 4 * lda;
|
||||
a4 += 4 * lda;
|
||||
/* a3 += 4 * lda;
|
||||
a4 += 4 * lda; */
|
||||
b += 32;
|
||||
|
||||
ii += 4;
|
||||
|
@ -574,7 +574,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 16;
|
||||
|
||||
ii += 2;
|
||||
|
@ -779,7 +779,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 8;
|
||||
ii += 2;
|
||||
}
|
||||
|
|
|
@ -646,7 +646,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 7) = data57;
|
||||
}
|
||||
b += 8;
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 8 * lda;
|
||||
|
@ -835,7 +835,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 3) = data25;
|
||||
}
|
||||
b += 4;
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 4 * lda;
|
||||
|
@ -908,7 +908,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 1) = data09;
|
||||
}
|
||||
b += 2;
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 2 * lda;
|
||||
|
|
|
@ -194,7 +194,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 8;
|
||||
|
||||
ii += 2;
|
||||
|
|
|
@ -453,8 +453,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
|
||||
a1 += 4 * lda;
|
||||
a2 += 4 * lda;
|
||||
a3 += 4 * lda;
|
||||
a4 += 4 * lda;
|
||||
/* a3 += 4 * lda;
|
||||
a4 += 4 * lda; */
|
||||
b += 32;
|
||||
ii += 4;
|
||||
}
|
||||
|
@ -513,7 +513,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 16;
|
||||
ii += 2;
|
||||
}
|
||||
|
@ -680,7 +680,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 8;
|
||||
ii += 2;
|
||||
}
|
||||
|
|
|
@ -1044,7 +1044,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda,
|
|||
*(b_offset2 + 3) = CMULT(a7, a8);
|
||||
|
||||
a_offset1 += 8;
|
||||
b_offset2 += 4;
|
||||
// b_offset2 += 4;
|
||||
}
|
||||
|
||||
if (n & 2){
|
||||
|
@ -1057,7 +1057,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda,
|
|||
*(b_offset3 + 1) = CMULT(a3, a4);
|
||||
|
||||
a_offset1 += 4;
|
||||
b_offset3 += 2;
|
||||
// b_offset3 += 2;
|
||||
}
|
||||
|
||||
if (n & 1){
|
||||
|
|
|
@ -225,10 +225,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset + 6) = ctemp07;
|
||||
*(boffset + 7) = ctemp08;
|
||||
|
||||
aoffset1 += 2;
|
||||
/* aoffset1 += 2;
|
||||
aoffset2 += 2;
|
||||
aoffset3 += 2;
|
||||
aoffset4 += 2;
|
||||
aoffset4 += 2; */
|
||||
boffset += 8;
|
||||
}
|
||||
j--;
|
||||
|
@ -323,8 +323,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset + 2) = ctemp03;
|
||||
*(boffset + 3) = ctemp04;
|
||||
|
||||
aoffset1 += 2;
|
||||
aoffset2 += 2;
|
||||
/* aoffset1 += 2;
|
||||
aoffset2 += 2; */
|
||||
boffset += 4;
|
||||
}
|
||||
}
|
||||
|
|
|
@ -140,7 +140,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(b_offset1 + 6) = ctemp11;
|
||||
*(b_offset1 + 7) = ctemp12;
|
||||
|
||||
b_offset1 += m * 4;
|
||||
// b_offset1 += m * 4;
|
||||
a_offset1 += 4;
|
||||
a_offset2 += 4;
|
||||
}
|
||||
|
@ -204,7 +204,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(b_offset + 2) = ctemp3;
|
||||
*(b_offset + 3) = ctemp4;
|
||||
|
||||
b_offset += m * 4;
|
||||
// b_offset += m * 4;
|
||||
a_offset += 4;
|
||||
}
|
||||
|
||||
|
|
|
@ -233,10 +233,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset3 + 6) = ctemp07;
|
||||
*(boffset3 + 7) = ctemp08;
|
||||
|
||||
aoffset1 += 2;
|
||||
/* aoffset1 += 2;
|
||||
aoffset2 += 2;
|
||||
aoffset3 += 2;
|
||||
aoffset4 += 2;
|
||||
aoffset4 += 2; */
|
||||
|
||||
boffset3 += 8;
|
||||
}
|
||||
|
@ -338,8 +338,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset3 + 2) = ctemp03;
|
||||
*(boffset3 + 3) = ctemp04;
|
||||
|
||||
aoffset1 += 2;
|
||||
aoffset2 += 2;
|
||||
/* aoffset1 += 2;
|
||||
aoffset2 += 2; */
|
||||
boffset3 += 4;
|
||||
}
|
||||
}
|
||||
|
@ -387,7 +387,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
*(boffset2 + 3) = ctemp04;
|
||||
|
||||
aoffset1 += 4;
|
||||
boffset2 += 4;
|
||||
// boffset2 += 4;
|
||||
}
|
||||
|
||||
if (n & 1){
|
||||
|
|
|
@ -324,7 +324,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
if (n & 1){
|
||||
aoffset1 = aoffset;
|
||||
aoffset2 = aoffset + lda;
|
||||
aoffset += 2;
|
||||
// aoffset += 2;
|
||||
|
||||
i = (m >> 1);
|
||||
if (i > 0){
|
||||
|
@ -353,7 +353,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, FLOAT *b){
|
|||
|
||||
*(boffset + 0) = ctemp01;
|
||||
*(boffset + 1) = ctemp02;
|
||||
boffset += 2;
|
||||
// boffset += 2;
|
||||
}
|
||||
}
|
||||
|
||||
|
|
|
@ -148,12 +148,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -224,7 +224,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
return 0;
|
||||
}
|
||||
|
|
|
@ -355,23 +355,23 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 6] = data25;
|
||||
b[ 7] = data26;
|
||||
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
} else
|
||||
if (X < posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 16;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -586,12 +586,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data09;
|
||||
b[ 3] = data10;
|
||||
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -657,7 +657,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -350,14 +350,14 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
}
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += i * lda;
|
||||
/* ao1 += i * lda;
|
||||
ao2 += i * lda;
|
||||
ao3 += i * lda;
|
||||
ao4 += i * lda;
|
||||
ao5 += i * lda;
|
||||
ao6 += i * lda;
|
||||
ao7 += i * lda;
|
||||
ao8 += i * lda;
|
||||
ao8 += i * lda; */
|
||||
b += 16 * i;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -675,10 +675,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
}
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += i * lda;
|
||||
/* ao1 += i * lda;
|
||||
ao2 += i * lda;
|
||||
ao3 += i * lda;
|
||||
ao4 += i * lda;
|
||||
ao4 += i * lda; */
|
||||
b += 8 * i;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -804,13 +804,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 1] = *(ao1 + 1);
|
||||
b[ 2] = *(ao2 + 0);
|
||||
b[ 3] = *(ao2 + 1);
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X < posY) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
|
|
@ -141,8 +141,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (m & 1) {
|
||||
|
||||
if (X > posY) {
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
|
||||
} else
|
||||
|
@ -157,7 +157,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data3;
|
||||
b[ 3] = data4;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -233,7 +233,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -292,18 +292,18 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X > posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 4;
|
||||
/* ao1 += 4;
|
||||
ao2 += 4;
|
||||
ao3 += 4;
|
||||
ao4 += 4;
|
||||
ao4 += 4; */
|
||||
b += 16;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -347,7 +347,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[15] = data16;
|
||||
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
// ao2 += 2 * lda;
|
||||
|
||||
b += 16;
|
||||
}
|
||||
|
@ -371,7 +371,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 6] = data07;
|
||||
b[ 7] = data08;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -588,8 +588,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (i) {
|
||||
|
||||
if (X > posY) {
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
|
||||
b += 4;
|
||||
} else
|
||||
|
@ -604,7 +604,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
|
||||
} else {
|
||||
|
@ -678,7 +678,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
} while (i > 0);
|
||||
}
|
||||
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -317,14 +317,14 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
i = (m & 7);
|
||||
if (i > 0) {
|
||||
if (X > posY) {
|
||||
a01 += 2 * i;
|
||||
/* a01 += 2 * i;
|
||||
a02 += 2 * i;
|
||||
a03 += 2 * i;
|
||||
a04 += 2 * i;
|
||||
a05 += 2 * i;
|
||||
a06 += 2 * i;
|
||||
a07 += 2 * i;
|
||||
a08 += 2 * i;
|
||||
a08 += 2 * i; */
|
||||
b += 16 * i;
|
||||
} else
|
||||
if (X < posY) {
|
||||
|
@ -661,10 +661,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
i = (m & 3);
|
||||
if (i > 0) {
|
||||
if (X > posY) {
|
||||
a01 += 2 * i;
|
||||
/* a01 += 2 * i;
|
||||
a02 += 2 * i;
|
||||
a03 += 2 * i;
|
||||
a04 += 2 * i;
|
||||
a04 += 2 * i; */
|
||||
b += 8 * i;
|
||||
} else
|
||||
if (X < posY) {
|
||||
|
@ -802,8 +802,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
i = (m & 1);
|
||||
if (i > 0) {
|
||||
if (X > posY) {
|
||||
a01 += 2;
|
||||
a02 += 2;
|
||||
/* a01 += 2;
|
||||
a02 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X < posY) {
|
||||
|
@ -812,8 +812,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = *(a01 + 2);
|
||||
b[ 3] = *(a01 + 3);
|
||||
|
||||
a01 += lda;
|
||||
a02 += lda;
|
||||
/* a01 += lda;
|
||||
a02 += lda; */
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -869,7 +869,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
i --;
|
||||
} while (i > 0);
|
||||
}
|
||||
posY += 1;
|
||||
// posY += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -153,12 +153,12 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data03;
|
||||
b[ 3] = data04;
|
||||
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
|
|
@ -354,23 +354,23 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 6] = data25;
|
||||
b[ 7] = data26;
|
||||
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
} else
|
||||
if (X > posY) {
|
||||
if (m & 2) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 16;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -596,13 +596,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 1] = data02;
|
||||
b[ 2] = data09;
|
||||
b[ 3] = data10;
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -624,8 +624,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data09;
|
||||
b[ 3] = data10;
|
||||
#endif
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
}
|
||||
}
|
||||
|
|
|
@ -350,14 +350,14 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
}
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += i * lda;
|
||||
/* ao1 += i * lda;
|
||||
ao2 += i * lda;
|
||||
ao3 += i * lda;
|
||||
ao4 += i * lda;
|
||||
ao5 += i * lda;
|
||||
ao6 += i * lda;
|
||||
ao7 += i * lda;
|
||||
ao8 += i * lda;
|
||||
ao8 += i * lda; */
|
||||
b += 16 * i;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -677,10 +677,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
}
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += i * lda;
|
||||
/* ao1 += i * lda;
|
||||
ao2 += i * lda;
|
||||
ao3 += i * lda;
|
||||
ao4 += i * lda;
|
||||
ao4 += i * lda; */
|
||||
b += 8 * i;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
@ -807,13 +807,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 1] = *(ao1 + 1);
|
||||
b[ 2] = *(ao2 + 0);
|
||||
b[ 3] = *(ao2 + 1);
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X > posY) {
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
/* ao1 += 2 * lda;
|
||||
ao2 += 2 * lda; */
|
||||
b += 4;
|
||||
} else {
|
||||
#ifdef UNIT
|
||||
|
|
|
@ -142,8 +142,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
if (m & 1) {
|
||||
if (X < posY) {
|
||||
ao1 += 2;
|
||||
ao2 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2; */
|
||||
b += 4;
|
||||
} else
|
||||
if (X > posY) {
|
||||
|
@ -157,7 +157,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 2] = data3;
|
||||
b[ 3] = data4;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 4;
|
||||
|
||||
} else {
|
||||
|
|
|
@ -294,18 +294,18 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (X < posY) {
|
||||
|
||||
if (m & 2) {
|
||||
ao1 += 4;
|
||||
/* ao1 += 4;
|
||||
ao2 += 4;
|
||||
ao3 += 4;
|
||||
ao4 += 4;
|
||||
ao4 += 4; */
|
||||
b += 16;
|
||||
}
|
||||
|
||||
if (m & 1) {
|
||||
ao1 += 2;
|
||||
/* ao1 += 2;
|
||||
ao2 += 2;
|
||||
ao3 += 2;
|
||||
ao4 += 2;
|
||||
ao4 += 2; */
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
@ -349,7 +349,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[15] = data16;
|
||||
|
||||
ao1 += 2 * lda;
|
||||
ao2 += 2 * lda;
|
||||
// ao2 += 2 * lda;
|
||||
b += 16;
|
||||
}
|
||||
|
||||
|
@ -372,7 +372,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
b[ 6] = data07;
|
||||
b[ 7] = data08;
|
||||
|
||||
ao1 += lda;
|
||||
// ao1 += lda;
|
||||
b += 8;
|
||||
}
|
||||
|
||||
|
|
|
@ -320,14 +320,14 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
|
||||
if (X < posY) {
|
||||
|
||||
a01 += 2 * i;
|
||||
/* a01 += 2 * i;
|
||||
a02 += 2 * i;
|
||||
a03 += 2 * i;
|
||||
a04 += 2 * i;
|
||||
a05 += 2 * i;
|
||||
a06 += 2 * i;
|
||||
a07 += 2 * i;
|
||||
a08 += 2 * i;
|
||||
a08 += 2 * i; */
|
||||
b += 16 * i;
|
||||
} else
|
||||
if (X > posY) {
|
||||
|
@ -664,10 +664,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG posX, BLASLON
|
|||
if (i) {
|
||||
|
||||
if (X < posY) {
|
||||
a01 += 2 * i;
|
||||
/* a01 += 2 * i;
|
||||
a02 += 2 * i;
|
||||
a03 += 2 * i;
|
||||
a04 += 2 * i;
|
||||
a04 += 2 * i; */
|
||||
b += 8 * i;
|
||||
} else
|
||||
if (X > posY) {
|
||||
|
|
|
@ -313,13 +313,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 7) = data26;
|
||||
}
|
||||
|
||||
a1 += 2;
|
||||
/* a1 += 2;
|
||||
a2 += 2;
|
||||
a3 += 2;
|
||||
a4 += 2;
|
||||
a4 += 2; */
|
||||
b += 8;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
a += 4 * lda;
|
||||
jj += 4;
|
||||
|
@ -410,11 +410,11 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 3) = data10;
|
||||
}
|
||||
|
||||
a1 += 2;
|
||||
a2 += 2;
|
||||
/* a1 += 2;
|
||||
a2 += 2; */
|
||||
b += 4;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
a += 2 * lda;
|
||||
jj += 2;
|
||||
|
@ -451,8 +451,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
ii += 1;
|
||||
}
|
||||
|
||||
a += lda;
|
||||
jj += 1;
|
||||
// a += lda;
|
||||
// jj += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -286,7 +286,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 16;
|
||||
|
||||
ii += 2;
|
||||
|
@ -335,9 +335,9 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 7) = data08;
|
||||
}
|
||||
|
||||
a1 += lda;
|
||||
// a1 += lda;
|
||||
b += 8;
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 8;
|
||||
|
@ -430,9 +430,9 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 3) = data04;
|
||||
}
|
||||
|
||||
a1 += lda;
|
||||
// a1 += lda;
|
||||
b += 4;
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 4;
|
||||
|
@ -471,8 +471,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
ii += 1;
|
||||
}
|
||||
|
||||
a += 2;
|
||||
jj += 1;
|
||||
// a += 2;
|
||||
// jj += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -344,13 +344,13 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 7) = data26;
|
||||
}
|
||||
|
||||
a1 += 2;
|
||||
/* a1 += 2;
|
||||
a2 += 2;
|
||||
a3 += 2;
|
||||
a4 += 2;
|
||||
a4 += 2; */
|
||||
b += 8;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 4 * lda;
|
||||
|
@ -444,11 +444,11 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 3) = data10;
|
||||
}
|
||||
|
||||
a1 += 2;
|
||||
a2 += 2;
|
||||
/* a1 += 2;
|
||||
a2 += 2; */
|
||||
b += 4;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 2 *lda;
|
||||
|
@ -488,8 +488,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
ii += 1;
|
||||
}
|
||||
|
||||
a += lda;
|
||||
jj += 1;
|
||||
// a += lda;
|
||||
// jj += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -266,7 +266,7 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
}
|
||||
|
||||
a1 += 2 * lda;
|
||||
a2 += 2 * lda;
|
||||
// a2 += 2 * lda;
|
||||
b += 16;
|
||||
|
||||
ii += 2;
|
||||
|
@ -303,10 +303,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 7) = data08;
|
||||
}
|
||||
|
||||
a1 += lda;
|
||||
// a1 += lda;
|
||||
b += 8;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 8;
|
||||
|
@ -394,10 +394,10 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
*(b + 3) = data04;
|
||||
}
|
||||
|
||||
a1 += lda;
|
||||
// a1 += lda;
|
||||
b += 4;
|
||||
|
||||
ii += 1;
|
||||
// ii += 1;
|
||||
}
|
||||
|
||||
a += 4;
|
||||
|
@ -436,8 +436,8 @@ int CNAME(BLASLONG m, BLASLONG n, FLOAT *a, BLASLONG lda, BLASLONG offset, FLOAT
|
|||
ii += 1;
|
||||
}
|
||||
|
||||
a += 2;
|
||||
jj += 1;
|
||||
// a += 2;
|
||||
// jj += 1;
|
||||
}
|
||||
|
||||
return 0;
|
||||
|
|
|
@ -313,7 +313,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha_r, FLOAT alpha_i,
|
|||
|
||||
for( i = 0; i < n1 ; i++)
|
||||
{
|
||||
memset(ybuffer,0,64);
|
||||
memset(ybuffer,0,sizeof(ybuffer));
|
||||
zgemv_kernel_4x4(NB,ap,xbuffer,ybuffer,alpha);
|
||||
ap[0] += lda4;
|
||||
ap[1] += lda4;
|
||||
|
@ -338,7 +338,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha_r, FLOAT alpha_i,
|
|||
|
||||
for( i = 0; i < n2 ; i++)
|
||||
{
|
||||
memset(ybuffer,0,64);
|
||||
memset(ybuffer,0,sizeof(ybuffer));
|
||||
zgemv_kernel_4x1(NB,a_ptr,xbuffer,ybuffer,alpha);
|
||||
a_ptr += lda;
|
||||
y_ptr[0] += ybuffer[0];
|
||||
|
|
|
@ -518,7 +518,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha_r, FLOAT alpha_i,
|
|||
|
||||
for( i = 0; i < n1 ; i++)
|
||||
{
|
||||
memset(ybuffer,0,64);
|
||||
memset(ybuffer,0,sizeof(ybuffer));
|
||||
zgemv_kernel_4x4(NB,ap,xbuffer,ybuffer,alpha);
|
||||
ap[0] += lda4;
|
||||
ap[1] += lda4;
|
||||
|
@ -543,7 +543,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha_r, FLOAT alpha_i,
|
|||
|
||||
for( i = 0; i < n2 ; i++)
|
||||
{
|
||||
memset(ybuffer,0,64);
|
||||
memset(ybuffer,0,sizeof(ybuffer));
|
||||
zgemv_kernel_4x1(NB,a_ptr,xbuffer,ybuffer,alpha);
|
||||
a_ptr += lda;
|
||||
y_ptr[0] += ybuffer[0];
|
||||
|
|
Loading…
Reference in New Issue