Merge pull request #2010 from martin-frbg/issue2009
Fix declaration of input arguments in x86_64 GEMV, SYMV and DSCAL
This commit is contained in:
commit
63d7bad8a5
|
@ -111,9 +111,9 @@ static void dgemv_kernel_4x2( BLASLONG n, FLOAT **ap, FLOAT *x, FLOAT *y, FLOAT
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (ap[0]), // 4
|
"r" (ap[0]), // 4
|
||||||
|
@ -166,9 +166,9 @@ static void dgemv_kernel_4x1(BLASLONG n, FLOAT *ap, FLOAT *x, FLOAT *y, FLOAT *a
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (ap), // 4
|
"r" (ap), // 4
|
||||||
|
|
|
@ -127,9 +127,9 @@ static void dgemv_kernel_4x2(BLASLONG n, FLOAT *ap0, FLOAT *ap1, FLOAT *x, FLOAT
|
||||||
"movsd %%xmm11,8(%2) \n\t"
|
"movsd %%xmm11,8(%2) \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (y), // 2
|
"r" (y), // 2
|
||||||
"r" (ap0), // 3
|
"r" (ap0), // 3
|
||||||
"r" (ap1), // 4
|
"r" (ap1), // 4
|
||||||
|
@ -195,9 +195,9 @@ static void dgemv_kernel_4x1(BLASLONG n, FLOAT *ap, FLOAT *x, FLOAT *y)
|
||||||
"movsd %%xmm10, (%2) \n\t"
|
"movsd %%xmm10, (%2) \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (y), // 2
|
"r" (y), // 2
|
||||||
"r" (ap), // 3
|
"r" (ap), // 3
|
||||||
"r" (x) // 4
|
"r" (x) // 4
|
||||||
|
@ -259,9 +259,9 @@ static void add_y(BLASLONG n, FLOAT da , FLOAT *src, FLOAT *dest, BLASLONG inc_d
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (&da), // 2
|
"r" (&da), // 2
|
||||||
"r" (src), // 3
|
"r" (src), // 3
|
||||||
"r" (dest) // 4
|
"r" (dest) // 4
|
||||||
|
|
|
@ -136,8 +136,8 @@ static void dscal_kernel_inc_8(BLASLONG n, FLOAT *alpha, FLOAT *x, BLASLONG inc_
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (n) // 0
|
||||||
:
|
:
|
||||||
"r" (n), // 0
|
|
||||||
"r" (x), // 1
|
"r" (x), // 1
|
||||||
"r" (x1), // 2
|
"r" (x1), // 2
|
||||||
"r" (alpha), // 3
|
"r" (alpha), // 3
|
||||||
|
|
|
@ -113,8 +113,8 @@ static void dsymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -105,8 +105,8 @@ static void dsymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -108,8 +108,8 @@ static void dsymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -114,8 +114,8 @@ static void dsymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -106,9 +106,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -107,9 +107,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -101,9 +101,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -116,9 +116,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -149,9 +149,9 @@ static void sgemv_kernel_4x2( BLASLONG n, FLOAT **ap, FLOAT *x, FLOAT *y, FLOAT
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (ap[0]), // 4
|
"r" (ap[0]), // 4
|
||||||
|
@ -223,9 +223,9 @@ static void sgemv_kernel_4x1(BLASLONG n, FLOAT *ap, FLOAT *x, FLOAT *y, FLOAT *a
|
||||||
|
|
||||||
"3: \n\t"
|
"3: \n\t"
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n1) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n1), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (ap), // 4
|
"r" (ap), // 4
|
||||||
|
@ -277,9 +277,9 @@ static void add_y(BLASLONG n, FLOAT *src, FLOAT *dest, BLASLONG inc_dest)
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (src), // 2
|
"r" (src), // 2
|
||||||
"r" (dest) // 3
|
"r" (dest) // 3
|
||||||
: "cc",
|
: "cc",
|
||||||
|
|
|
@ -139,9 +139,9 @@ static void sgemv_kernel_4x2(BLASLONG n, FLOAT *ap0, FLOAT *ap1, FLOAT *x, FLOAT
|
||||||
"movss %%xmm11,4(%2) \n\t"
|
"movss %%xmm11,4(%2) \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (y), // 2
|
"r" (y), // 2
|
||||||
"r" (ap0), // 3
|
"r" (ap0), // 3
|
||||||
"r" (ap1), // 4
|
"r" (ap1), // 4
|
||||||
|
@ -208,9 +208,9 @@ static void sgemv_kernel_4x1(BLASLONG n, FLOAT *ap, FLOAT *x, FLOAT *y)
|
||||||
"movss %%xmm10, (%2) \n\t"
|
"movss %%xmm10, (%2) \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (y), // 2
|
"r" (y), // 2
|
||||||
"r" (ap), // 3
|
"r" (ap), // 3
|
||||||
"r" (x) // 4
|
"r" (x) // 4
|
||||||
|
@ -272,9 +272,9 @@ static void add_y(BLASLONG n, FLOAT da , FLOAT *src, FLOAT *dest, BLASLONG inc_d
|
||||||
"jnz 1b \n\t"
|
"jnz 1b \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (&da), // 2
|
"r" (&da), // 2
|
||||||
"r" (src), // 3
|
"r" (src), // 3
|
||||||
"r" (dest) // 4
|
"r" (dest) // 4
|
||||||
|
|
|
@ -98,8 +98,8 @@ static void ssymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -99,8 +99,8 @@ static void ssymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -113,8 +113,8 @@ static void ssymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, F
|
||||||
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -109,8 +109,8 @@ static void ssymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
@ -217,8 +217,8 @@ static void ssymv_kernel_4x4(BLASLONG from, BLASLONG to, FLOAT **a, FLOAT *x, FL
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (from) // 0
|
||||||
"r" (from), // 0
|
:
|
||||||
"r" (to), // 1
|
"r" (to), // 1
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
|
|
|
@ -90,9 +90,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -112,9 +112,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -106,9 +106,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -120,9 +120,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
:
|
"+r" (i), // 0
|
||||||
"r" (i), // 0
|
"+r" (n) // 1
|
||||||
"r" (n), // 1
|
:
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
Loading…
Reference in New Issue