Fix declaration of input arguments in the x86_64 SCAL microkernels (#1966)
* Tag arguments 0 and 1 as both input and output (see #1964)
This commit is contained in:
parent
d5e6940253
commit
b495e54310
|
@ -116,11 +116,11 @@ static void cscal_kernel_16( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -208,11 +208,11 @@ static void cscal_kernel_16_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -285,11 +285,11 @@ static void cscal_kernel_16_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -330,11 +330,11 @@ static void cscal_kernel_16_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
|
|
@ -116,11 +116,11 @@ static void cscal_kernel_16( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"0", "1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -208,9 +208,9 @@ static void cscal_kernel_16_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", // "0", "1",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
|
@ -285,9 +285,9 @@ static void cscal_kernel_16_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
|
@ -329,12 +329,12 @@ static void cscal_kernel_16_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
:
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"0", "1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
|
|
@ -117,11 +117,11 @@ static void cscal_kernel_16( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"0", "1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -208,12 +208,12 @@ static void cscal_kernel_16_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"0", "1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -286,11 +286,11 @@ static void cscal_kernel_16_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -331,11 +331,11 @@ static void cscal_kernel_16_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"0", "1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
|
|
@ -122,9 +122,9 @@ static void dscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
@ -188,9 +188,9 @@ static void dscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
|
|
@ -122,9 +122,9 @@ static void dscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
@ -187,10 +187,10 @@ static void dscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
|
|
@ -122,9 +122,9 @@ static void dscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
@ -187,10 +187,10 @@ static void dscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
"+r" (n1), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
:
|
||||
"r" (n1), // 0
|
||||
"r" (x), // 1
|
||||
"r" (alpha), // 2
|
||||
"r" (n2) // 3
|
||||
: "cc",
|
||||
|
|
|
@ -116,11 +116,11 @@ static void zscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -208,11 +208,11 @@ static void zscal_kernel_8_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -285,9 +285,9 @@ static void zscal_kernel_8_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
|
@ -329,10 +329,10 @@ static void zscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
|
|
|
@ -116,11 +116,11 @@ static void zscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -208,11 +208,11 @@ static void zscal_kernel_8_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -285,11 +285,11 @@ static void zscal_kernel_8_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -330,11 +330,11 @@ static void zscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
|
|
@ -116,12 +116,12 @@ static void zscal_kernel_8( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
|
||||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -209,11 +209,11 @@ static void zscal_kernel_8_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -286,11 +286,11 @@ static void zscal_kernel_8_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
@ -331,11 +331,11 @@ static void zscal_kernel_8_zero( BLASLONG n, FLOAT *alpha, FLOAT *x)
|
|||
"vzeroupper \n\t"
|
||||
|
||||
:
|
||||
:
|
||||
"r" (n), // 0
|
||||
"r" (x), // 1
|
||||
"+r" (n), // 0
|
||||
"+r" (x) // 1
|
||||
:
|
||||
"r" (alpha) // 2
|
||||
: "cc", //"%0", "%1",
|
||||
: "cc",
|
||||
"%xmm0", "%xmm1", "%xmm2", "%xmm3",
|
||||
"%xmm4", "%xmm5", "%xmm6", "%xmm7",
|
||||
"%xmm8", "%xmm9", "%xmm10", "%xmm11",
|
||||
|
|
Loading…
Reference in New Issue