Fix declaration of assembly arguments in SSYMV and DSYMV microkernels
Arguments 0 and 1 are both input and output
This commit is contained in:
parent
91481a3e4e
commit
b824fa70eb
|
@ -106,9 +106,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
"vmovsd %%xmm3 ,24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -107,9 +107,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -101,9 +101,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
"movsd %%xmm3 , 24(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -116,9 +116,9 @@ static void dsymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -90,9 +90,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
"vmovss %%xmm3 ,12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -112,9 +112,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -106,9 +106,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
"movss %%xmm3 , 12(%9) \n\t" // save temp2
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
|
@ -120,9 +120,9 @@ static void ssymv_kernel_4x4(BLASLONG n, FLOAT *a0, FLOAT *a1, FLOAT *a2, FLOAT
|
||||||
"vzeroupper \n\t"
|
"vzeroupper \n\t"
|
||||||
|
|
||||||
:
|
:
|
||||||
|
"+r" (i), // 0
|
||||||
|
"+r" (n) // 1
|
||||||
:
|
:
|
||||||
"r" (i), // 0
|
|
||||||
"r" (n), // 1
|
|
||||||
"r" (x), // 2
|
"r" (x), // 2
|
||||||
"r" (y), // 3
|
"r" (y), // 3
|
||||||
"r" (a0), // 4
|
"r" (a0), // 4
|
||||||
|
|
Loading…
Reference in New Issue