Merge pull request #386 from wernsaar/develop
Some enhancements for dynamic_arch and some warning fixes
This commit is contained in:
commit
d52863cfd7
|
@ -116,18 +116,24 @@ extern void openblas_warning(int verbose, const char * msg);
|
||||||
|
|
||||||
static int get_vendor(void){
|
static int get_vendor(void){
|
||||||
int eax, ebx, ecx, edx;
|
int eax, ebx, ecx, edx;
|
||||||
char vendor[13];
|
|
||||||
|
union
|
||||||
|
{
|
||||||
|
char vchar[16];
|
||||||
|
int vint[4];
|
||||||
|
} vendor;
|
||||||
|
|
||||||
cpuid(0, &eax, &ebx, &ecx, &edx);
|
cpuid(0, &eax, &ebx, &ecx, &edx);
|
||||||
|
|
||||||
*(int *)(&vendor[0]) = ebx;
|
*(&vendor.vint[0]) = ebx;
|
||||||
*(int *)(&vendor[4]) = edx;
|
*(&vendor.vint[1]) = edx;
|
||||||
*(int *)(&vendor[8]) = ecx;
|
*(&vendor.vint[2]) = ecx;
|
||||||
vendor[12] = (char)0;
|
|
||||||
|
|
||||||
if (!strcmp(vendor, "GenuineIntel")) return VENDOR_INTEL;
|
vendor.vchar[12] = '\0';
|
||||||
if (!strcmp(vendor, "AuthenticAMD")) return VENDOR_AMD;
|
|
||||||
if (!strcmp(vendor, "CentaurHauls")) return VENDOR_CENTAUR;
|
if (!strcmp(vendor.vchar, "GenuineIntel")) return VENDOR_INTEL;
|
||||||
|
if (!strcmp(vendor.vchar, "AuthenticAMD")) return VENDOR_AMD;
|
||||||
|
if (!strcmp(vendor.vchar, "CentaurHauls")) return VENDOR_CENTAUR;
|
||||||
|
|
||||||
if ((eax == 0) || ((eax & 0x500) != 0)) return VENDOR_INTEL;
|
if ((eax == 0) || ((eax & 0x500) != 0)) return VENDOR_INTEL;
|
||||||
|
|
||||||
|
@ -232,7 +238,7 @@ static gotoblas_t *get_coretype(void){
|
||||||
if (family <= 0xe) {
|
if (family <= 0xe) {
|
||||||
// Verify that CPU has 3dnow and 3dnowext before claiming it is Athlon
|
// Verify that CPU has 3dnow and 3dnowext before claiming it is Athlon
|
||||||
cpuid(0x80000000, &eax, &ebx, &ecx, &edx);
|
cpuid(0x80000000, &eax, &ebx, &ecx, &edx);
|
||||||
if (eax & 0xffff >= 0x01) {
|
if ( (eax & 0xffff) >= 0x01) {
|
||||||
cpuid(0x80000001, &eax, &ebx, &ecx, &edx);
|
cpuid(0x80000001, &eax, &ebx, &ecx, &edx);
|
||||||
if ((edx & (1 << 30)) == 0 || (edx & (1 << 31)) == 0)
|
if ((edx & (1 << 30)) == 0 || (edx & (1 << 31)) == 0)
|
||||||
return NULL;
|
return NULL;
|
||||||
|
@ -333,11 +339,79 @@ char *gotoblas_corename(void) {
|
||||||
return corename[0];
|
return corename[0];
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
||||||
|
static gotoblas_t *force_coretype(char *coretype){
|
||||||
|
|
||||||
|
int i ;
|
||||||
|
int found = -1;
|
||||||
|
char message[128];
|
||||||
|
char mname[20];
|
||||||
|
|
||||||
|
for ( i=1 ; i <= 20; i++)
|
||||||
|
{
|
||||||
|
if (!strncasecmp(coretype,corename[i],20))
|
||||||
|
{
|
||||||
|
found = i;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if (found < 0)
|
||||||
|
{
|
||||||
|
strncpy(mname,coretype,20);
|
||||||
|
sprintf(message, "Core not found: %s\n",mname);
|
||||||
|
openblas_warning(1, message);
|
||||||
|
return(NULL);
|
||||||
|
}
|
||||||
|
|
||||||
|
switch (found)
|
||||||
|
{
|
||||||
|
|
||||||
|
case 20: return (&gotoblas_HASWELL);
|
||||||
|
case 19: return (&gotoblas_PILEDRIVER);
|
||||||
|
case 18: return (&gotoblas_BULLDOZER);
|
||||||
|
case 17: return (&gotoblas_BOBCAT);
|
||||||
|
case 16: return (&gotoblas_SANDYBRIDGE);
|
||||||
|
case 15: return (&gotoblas_NANO);
|
||||||
|
case 14: return (&gotoblas_BARCELONA);
|
||||||
|
case 13: return (&gotoblas_OPTERON);
|
||||||
|
case 12: return (&gotoblas_OPTERON_SSE3);
|
||||||
|
case 11: return (&gotoblas_ATHLON);
|
||||||
|
case 10: return (&gotoblas_NEHALEM);
|
||||||
|
case 9: return (&gotoblas_DUNNINGTON);
|
||||||
|
case 8: return (&gotoblas_PENRYN);
|
||||||
|
case 7: return (&gotoblas_CORE2);
|
||||||
|
case 6: return (&gotoblas_ATOM);
|
||||||
|
case 5: return (&gotoblas_BANIAS);
|
||||||
|
case 4: return (&gotoblas_PRESCOTT);
|
||||||
|
case 3: return (&gotoblas_NORTHWOOD);
|
||||||
|
case 2: return (&gotoblas_COPPERMINE);
|
||||||
|
case 1: return (&gotoblas_KATMAI);
|
||||||
|
}
|
||||||
|
return(NULL);
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
void gotoblas_dynamic_init(void) {
|
void gotoblas_dynamic_init(void) {
|
||||||
|
|
||||||
|
char coremsg[128];
|
||||||
|
char coren[22];
|
||||||
|
char *p;
|
||||||
|
|
||||||
|
|
||||||
if (gotoblas) return;
|
if (gotoblas) return;
|
||||||
|
|
||||||
gotoblas = get_coretype();
|
p = getenv("OPENBLAS_CORETYPE");
|
||||||
|
if ( p )
|
||||||
|
{
|
||||||
|
gotoblas = force_coretype(p);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
gotoblas = get_coretype();
|
||||||
|
}
|
||||||
|
|
||||||
#ifdef ARCH_X86
|
#ifdef ARCH_X86
|
||||||
if (gotoblas == NULL) gotoblas = &gotoblas_KATMAI;
|
if (gotoblas == NULL) gotoblas = &gotoblas_KATMAI;
|
||||||
|
@ -355,6 +429,9 @@ void gotoblas_dynamic_init(void) {
|
||||||
#endif
|
#endif
|
||||||
|
|
||||||
if (gotoblas && gotoblas -> init) {
|
if (gotoblas && gotoblas -> init) {
|
||||||
|
strncpy(coren,gotoblas_corename(),20);
|
||||||
|
sprintf(coremsg, "Core: %s\n",coren);
|
||||||
|
openblas_warning(2, coremsg);
|
||||||
gotoblas -> init();
|
gotoblas -> init();
|
||||||
} else {
|
} else {
|
||||||
openblas_warning(0, "OpenBLAS : Architecture Initialization failed. No initialization function found.\n");
|
openblas_warning(0, "OpenBLAS : Architecture Initialization failed. No initialization function found.\n");
|
||||||
|
|
|
@ -61,7 +61,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha, FLOAT *a, BLASLO
|
||||||
a_ptr += lda;
|
a_ptr += lda;
|
||||||
ix += inc_x;
|
ix += inc_x;
|
||||||
}
|
}
|
||||||
|
return(0);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
||||||
|
|
|
@ -61,6 +61,7 @@ int CNAME(BLASLONG m, BLASLONG n, BLASLONG dummy1, FLOAT alpha, FLOAT *a, BLASLO
|
||||||
iy += inc_y;
|
iy += inc_y;
|
||||||
a_ptr += lda;
|
a_ptr += lda;
|
||||||
}
|
}
|
||||||
|
return(0);
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
Loading…
Reference in New Issue