From d206e094f0ebc3c73ecfe93f82a915e3f52cccfc Mon Sep 17 00:00:00 2001
From: Michele Calgaro <michele.calgaro@yahoo.it>
Date: Wed, 6 Mar 2024 10:13:02 +0900
Subject: [PATCH] Removed old special asm code.

Likely the code was added to take advantage of MMX extensions when they
first came out. Modern ix86 processors and all amd64 processors include
those instructions by default (and more), so it is quite likely that the
code generated by the compiler for the C version of the same function is
as good (or better) than the specialized assembly version.

Signed-off-by: Michele Calgaro <michele.calgaro@yahoo.it>
---
 src/imageutils/Makefile.am |   1 -
 src/imageutils/asm_scale.S | 810 -------------------------------------
 src/imageutils/scale.cpp   |  32 +-
 3 files changed, 6 insertions(+), 837 deletions(-)
 delete mode 100644 src/imageutils/asm_scale.S

diff --git a/src/imageutils/Makefile.am b/src/imageutils/Makefile.am
index fc5413c..3cb11c8 100644
--- a/src/imageutils/Makefile.am
+++ b/src/imageutils/Makefile.am
@@ -10,7 +10,6 @@ libgvimageutils_la_SOURCES = \
 	jpegcontent.cpp \
 	scale.cpp \
 	transupp.c \
-	asm_scale.S \
 	croppedqimage.cpp
 
 libgvimageutils_la_LIBADD = $(LIB_TDECORE) $(LIBTQT) $(LIBJPEG) $(LIB_EXIV2)
diff --git a/src/imageutils/asm_scale.S b/src/imageutils/asm_scale.S
deleted file mode 100644
index 08b43da..0000000
--- a/src/imageutils/asm_scale.S
+++ /dev/null
@@ -1,810 +0,0 @@
-#ifdef HAVE_X86_MMX
-
-#ifdef __EMX__
-/* Due to strange behaviour of as.exe we use this macros */
-/* For all OS/2 coders - please use PGCC to compile this code */
-#define PR_(foo) ___##foo
-#define PT_(foo,func) ___##foo,func
-#define SIZE(sym)                              \
-	.___end_##sym:;                        \
-	.size ___##sym,.___end_##sym-___##sym; \
-	.align 8;
-#else
-#define PR_(foo) __##foo
-#define PT_(foo,func) __##foo,func
-#define SIZE(sym)                           \
-	.__end_##sym:;                      \
-	.size __##sym,.__end_##sym-__##sym; \
-	.align 8;
-#endif
-
-/*\ 
-|*| MMX assembly scaling routine for Imlib2
-|*| Written by Willem Monsuwe <willem@stack.nl>
-\*/
-
-.text
-        .align 8
-.globl PR_(mimageScale_mmx_AARGBA)
-/*	.type PT_(mimageScale_mmx_AARGBA,@function) */ 
-
-
-/*\ Prototype: __mimageScale_mmx_AARGBA(ImlibScaleInfo *isi, DATA32 *dest,
-|*|	int dxx, int dyy, int dx, int dy, int dw, int dh, int dow, int sow)
-\*/
-
-#define isi	8(%ebp)
-#define dest	12(%ebp)
-#define dxx	16(%ebp)
-#define dyy	20(%ebp)
-#define dx	24(%ebp)
-#define dy	28(%ebp)
-#define dw	32(%ebp)
-#define dh	36(%ebp)
-#define dow	40(%ebp)
-#define sow	44(%ebp)
-
-/*\ Local variables that didn't fit in registers \*/
-#define y	-4(%ebp)
-#define yp	-8(%ebp)
-#define yap	-12(%ebp)
-#define xp	-16(%ebp)
-#define xap	-20(%ebp)
-#define Cx	-24(%ebp)
-#define Mx	-28(%ebp)
-#define Cy	-32(%ebp)
-#define My	-36(%ebp)
-#define sow_4	-40(%ebp)
-
-/*\ When %edx points to ImlibScaleInfo, these are the members \*/
-#define xpoints		(%edx)
-#define ypoints		4(%edx)
-#define xapoints	8(%edx)
-#define yapoints	12(%edx)
-#define xup_yup		16(%edx)
-
-PR_(mimageScale_mmx_AARGBA):
-	pushl %ebp
-	movl %esp, %ebp
-	subl $40, %esp
-	pushl %ebx
-	pushl %ecx
-	pushl %edx
-	pushl %edi
-	pushl %esi
-	movl isi, %edx
-
-	/*\ Check (dw > 0) && (dh > 0) \*/
-	cmpl $0, dw
-	jle .scale_leave
-	cmpl $0, dh
-	jle .scale_leave
-
-	/*\ X-based array pointers point to the end; we're looping up to 0 \*/
-	/*\ %edi = dest + dow * dy + dx + dw \*/
-	movl dow, %eax
-	imull dy, %eax
-	addl dx, %eax
-	addl dw, %eax
-	movl dest, %edi
-	leal (%edi, %eax, 4), %edi
-	/*\ xp = xpoints + dxx + dw \*/
-	movl dxx, %ebx
-	addl dw, %ebx
-	movl xpoints, %eax
-	leal (%eax, %ebx, 4), %eax
-	movl %eax, xp
-	/*\ xap = xapoints + dxx + dw \*/
-	movl xapoints, %eax
-	leal (%eax, %ebx, 4), %eax
-	movl %eax, xap
-	/*\ y = dh \*/
-	movl dh, %eax
-	movl %eax, y
-	/*\ yp = ypoints + dyy \*/
-	movl dyy, %ebx
-	movl ypoints, %eax
-	leal (%eax, %ebx, 4), %eax
-	movl %eax, yp
-	/*\ yap = yapoints + dyy \*/
-	movl yapoints, %eax
-	leal (%eax, %ebx, 4), %eax
-	movl %eax, yap
-
-	pxor %mm7, %mm7
-
-	/*\ Test xup bit \*/
-	movl xup_yup, %eax
-	sarl $1, %eax
-	jnc .scale_x_down
-
-.scale_x_up:
-	/*\ Test yup bit \*/
-	sarl $1, %eax
-	jnc .scale_x_up_y_down
-
-
-/*\ Scaling up both ways \*/
-
-.scale_x_up_y_up:
-	movl sow, %ebx
-
-.up_up_loop_y:
-
-	/*\ x = -dw \*/
-	movl dw, %ecx
-	negl %ecx
-
-	/*\ %eax = *yap << 4 \*/
-	movl yap, %eax
-	movl (%eax), %eax
-	sall $4, %eax
-	jz .up_up_yap_0
-	movd %eax, %mm1
-	punpcklwd %mm1, %mm1
-	punpckldq %mm1, %mm1
-
-.up_up_loop1_x:
-	/*\ %esi = *yp + xp[x] \*/
-	movl yp, %eax
-	movl (%eax), %esi
-	movl xp, %eax
-	movl (%eax, %ecx, 4), %eax
-	leal (%esi, %eax, 4), %esi
-
-	/*\ %eax = xap[x] << 4 \*/
-	movl xap, %eax
-	movl (%eax, %ecx, 4), %eax
-	sall $4, %eax
-	jz .up_up_xap_0
-
-	/*\ %mm0 = xap[x] << 4 \*/
-	movd %eax, %mm0
-	punpcklwd %mm0, %mm0
-	punpckldq %mm0, %mm0
-
-	/*\ Load and unpack four pixels in parralel
-	|*| %mm2 = ptr[0],   %mm3 = ptr[1]
-	|*| %mm4 = ptr[sow], %mm5 = ptr[sow + 1]
-	\*/
-	movq (%esi), %mm2
-	movq (%esi, %ebx, 4), %mm4
-	movq %mm2, %mm3
-	movq %mm4, %mm5
-	punpcklbw %mm7, %mm2
-	punpcklbw %mm7, %mm4
-	punpckhbw %mm7, %mm3
-	punpckhbw %mm7, %mm5
-
-	/*\ X interpolation: r = l + (r - l) * xap \*/
-	psubw %mm2, %mm3
-	psubw %mm4, %mm5
-	psllw $4, %mm3
-	psllw $4, %mm5
-	pmulhw %mm0, %mm3
-	pmulhw %mm0, %mm5
-	paddw %mm2, %mm3
-	paddw %mm4, %mm5
-	/*\ Now %mm3 = I(ptr[0], ptr[1]), %mm5 = I(ptr[sow], ptr[sow + 1]) \*/
-	jmp .up_up_common
-.up_up_xap_0:
-	/*\ Load and unpack two pixels
-	|*| %mm3 = ptr[0], %mm5 = ptr[sow]
-	\*/
-	movd (%esi), %mm3
-	movd (%esi, %ebx, 4), %mm5
-	punpcklbw %mm7, %mm3
-	punpcklbw %mm7, %mm5
-.up_up_common:
-	/*\ Y interpolation: d = u + (d - u) * yap \*/
-	psubw %mm3, %mm5
-	psllw $4, %mm5
-	pmulhw %mm1, %mm5
-	paddw %mm3, %mm5
-	packuswb %mm5, %mm5
-	movd %mm5, (%edi, %ecx, 4)
-
-	/*\ while (++x) \*/
-	incl %ecx
-	jnz .up_up_loop1_x
-	jmp .up_up_yap_end
-.up_up_yap_0:
-
-.up_up_loop2_x:
-	/*\ %esi = *yp + xp[x] \*/
-	movl yp, %eax
-	movl (%eax), %esi
-	movl xp, %eax
-	movl (%eax, %ecx, 4), %eax
-	leal (%esi, %eax, 4), %esi
-
-	/*\ %eax = xap[x] << 4 \*/
-	movl xap, %eax
-	movl (%eax, %ecx, 4), %eax
-	sall $4, %eax
-	jz .up_up_0
-
-	/*\ %mm0 = xap[x] << 4 \*/
-	movd %eax, %mm0
-	punpcklwd %mm0, %mm0
-	punpckldq %mm0, %mm0
-
-	/*\ Load and unpack two pixels in parralel
-	|*| %mm2 = ptr[0], %mm3 = ptr[1]
-	\*/
-	movq (%esi), %mm2
-	movq %mm2, %mm3
-	punpcklbw %mm7, %mm2
-	punpckhbw %mm7, %mm3
-
-	/*\ X interpolation: r = l + (r - l) * xap \*/
-	psubw %mm2, %mm3
-	psllw $4, %mm3
-	pmulhw %mm0, %mm3
-	paddw %mm2, %mm3
-	packuswb %mm3, %mm3
-	movd %mm3, (%edi, %ecx, 4)
-	jmp .up_up_1
-.up_up_0:
-	/*\ dptr[x] = *sptr \*/
-	movl (%esi), %eax
-	movl %eax, (%edi, %ecx, 4)
-.up_up_1:
-	incl %ecx
-	jnz .up_up_loop2_x
-
-.up_up_yap_end:
-	/*\ dptr += dow \*/
-	movl dow, %eax
-	leal (%edi, %eax, 4), %edi
-	/*\ yap++; yp++ \*/
-	addl $4, yap
-	addl $4, yp
-	/*\ while (y--) \*/
-	decl y
-	jnz .up_up_loop_y
-
-	jmp .scale_leave
-
-
-/*\ Scaling down vertically \*/
-
-.scale_x_up_y_down:
-	/*\ sow_4 = sow * 4 \*/
-	movl sow, %eax
-	sall $2, %eax
-	movl %eax, sow_4
-
-.up_down_loop_y:
-
-	/*\ Setup My and Cy \*/
-	movl yap, %eax
-	movzwl (%eax), %ebx
-	movl %ebx, My
-	movzwl 2(%eax), %eax
-	movl %eax, Cy
-
-	/*\ mm4 = Cy \*/
-	movd %eax, %mm4
-	punpcklwd %mm4, %mm4
-	punpckldq %mm4, %mm4
-	/*\ mm5 = My \*/
-	movd %ebx, %mm5
-	punpcklwd %mm5, %mm5
-	punpckldq %mm5, %mm5
-
-	/*\ x = -dw \*/
-	movl dw, %ecx
-	negl %ecx
-.up_down_loop_x:
-	/*\ %esi = *yp + xp[x] \*/
-	movl yp, %eax
-	movl (%eax), %esi
-	movl xp, %eax
-	movl (%eax, %ecx, 4), %eax
-	leal (%esi, %eax, 4), %esi
-
-	movl %esi, %eax
-	/*\ v = (*p * My) >> 10 \*/
-	movd (%eax), %mm0
-	punpcklbw %mm7, %mm0
-	psllw $6, %mm0
-	pmulhw %mm5, %mm0
-	
-	/*\ i = 0x4000 - My \*/
-	movl $0x4000, %ebx
-	subl My, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ p += sow; v += (*p * Cy) >> 10 \*/
-	addl sow_4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm0
-	
-	/*\ i -= Cy; while (i > Cy) \*/
-	subl Cy, %ebx
-2:
-	cmpl Cy, %ebx
-	jg 1b
-	
-	/*\ mm6 = i \*/
-	movd %ebx, %mm6
-	punpcklwd %mm6, %mm6
-	punpckldq %mm6, %mm6
-	
-	/*\ p += sow; v += (*p * i) >> 10 \*/
-	addl sow_4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm6, %mm1
-	paddw %mm1, %mm0
-5:
-	/*\ %eax = xap[x] << 5 \*/
-	movl xap, %eax
-	movl (%eax, %ecx, 4), %eax
-	sall $5, %eax
-	jz 6f
-	/*\ mm3 = xap[x] << 5 \*/
-	movd %eax, %mm3
-	punpcklwd %mm3, %mm3
-	punpckldq %mm3, %mm3
-	
-	/*\ p + 1 \*/
-	movl %esi, %eax
-	addl $4, %eax
-	/*\ vv = (*p * My) >> 10 \*/
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $6, %mm2
-	pmulhw %mm5, %mm2
-	
-	/*\ i = 0x4000 - My \*/
-	movl $0x4000, %ebx
-	subl My, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ p += sow; vv += (*p * Cy) >> 10 \*/
-	addl sow_4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm2
-	
-	/*\ i -= Cy; while (i > Cy) \*/
-	subl Cy, %ebx
-2:
-	cmpl Cy, %ebx
-	jg 1b
-	
-	/*\ p += sow; v += (*p * i) >> 10 \*/
-	addl sow_4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm6, %mm1
-	paddw %mm1, %mm2
-5:
-	/*\ v = v + (vv - v) * xap \*/
-	psubw %mm0, %mm2
-	psllw $3, %mm2
-	pmulhw %mm3, %mm2
-	paddw %mm2, %mm0
-6:
-	/*\ dest[x] = v >> 4 \*/
-	psrlw $4, %mm0
-	packuswb %mm0, %mm0
-	movd %mm0, (%edi, %ecx, 4)
-
-	/*\ while (++x) \*/
-	incl %ecx
-	jnz .up_down_loop_x
-
-	/*\ dptr += dow \*/
-	movl dow, %eax
-	leal (%edi, %eax, 4), %edi
-	/*\ yap++; yp++ \*/
-	addl $4, yap
-	addl $4, yp
-	/*\ while (y--) \*/
-	decl y
-	jnz .up_down_loop_y
-
-	jmp .scale_leave
-
-.scale_x_down:
-	/*\ Test yup bit \*/
-	sarl $1, %eax
-	jnc .scale_x_down_y_down
-
-
-/*\ Scaling down horizontally \*/
-
-.scale_x_down_y_up:
-	/*\ sow_4 = sow * 4 \*/
-	movl sow, %eax
-	sall $2, %eax
-	movl %eax, sow_4
-
-.down_up_loop_y:
-
-	/*\ %eax = *yap << 5 \*/
-	movl yap, %eax
-	movl (%eax), %eax
-	sall $5, %eax
-	/*\ mm3 = *yap << 5 \*/
-	movd %eax, %mm3
-	punpcklwd %mm3, %mm3
-	punpckldq %mm3, %mm3
-	
-	/*\ x = -dw \*/
-	movl dw, %ecx
-	negl %ecx
-.down_up_loop_x:
-	/*\ %esi = *yp + xp[x] \*/
-	movl yp, %eax
-	movl (%eax), %esi
-	movl xp, %eax
-	movl (%eax, %ecx, 4), %eax
-	leal (%esi, %eax, 4), %esi
-
-	/*\ Setup Mx and Cx \*/
-	movl xap, %eax
-	movzwl (%eax, %ecx, 4), %ebx
-	movl %ebx, Mx
-	movzwl 2(%eax, %ecx, 4), %eax
-	movl %eax, Cx
-
-	/*\ mm4 = Cx \*/
-	movd %eax, %mm4
-	punpcklwd %mm4, %mm4
-	punpckldq %mm4, %mm4
-	/*\ mm5 = Mx \*/
-	movd %ebx, %mm5
-	punpcklwd %mm5, %mm5
-	punpckldq %mm5, %mm5
-
-	movl %esi, %eax
-	/*\ v = (*p * Mx) >> 10 \*/
-	movd (%eax), %mm0
-	punpcklbw %mm7, %mm0
-	psllw $6, %mm0
-	pmulhw %mm5, %mm0
-	
-	/*\ i = 0x4000 - Mx \*/
-	movl $0x4000, %ebx
-	subl Mx, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ p += sow; v += (*p * Cx) >> 10 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm0
-	
-	/*\ i -= Cx; while (i > Cx) \*/
-	subl Cx, %ebx
-2:
-	cmpl Cx, %ebx
-	jg 1b
-	
-	/*\ mm6 = i \*/
-	movd %ebx, %mm6
-	punpcklwd %mm6, %mm6
-	punpckldq %mm6, %mm6
-	
-	/*\ p += sow; v += (*p * i) >> 10 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm6, %mm1
-	paddw %mm1, %mm0
-5:
-	movd %mm3, %eax
-	testl %eax, %eax
-	jz 6f
-	/*\ p + sow \*/
-	movl %esi, %eax
-	addl sow_4, %eax
-	/*\ vv = (*p * Mx) >> 10 \*/
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $6, %mm2
-	pmulhw %mm5, %mm2
-	
-	/*\ i = 0x4000 - Mx \*/
-	movl $0x4000, %ebx
-	subl Mx, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ p += sow; vv += (*p * Cx) >> 10 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm2
-	
-	/*\ i -= Cx; while (i > Cx) \*/
-	subl Cx, %ebx
-2:
-	cmpl Cx, %ebx
-	jg 1b
-	
-	/*\ p += sow; v += (*p * i) >> 10 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $6, %mm1
-	pmulhw %mm6, %mm1
-	paddw %mm1, %mm2
-5:
-	/*\ v = v + (vv - v) * yap \*/
-	psubw %mm0, %mm2
-	psllw $3, %mm2
-	pmulhw %mm3, %mm2
-	paddw %mm2, %mm0
-6:
-	/*\ dest[x] = v >> 4 \*/
-	psrlw $4, %mm0
-	packuswb %mm0, %mm0
-	movd %mm0, (%edi, %ecx, 4)
-
-	/*\ while (++x) \*/
-	incl %ecx
-	jnz .down_up_loop_x
-
-	/*\ dptr += dow \*/
-	movl dow, %eax
-	leal (%edi, %eax, 4), %edi
-	/*\ yap++; yp++ \*/
-	addl $4, yap
-	addl $4, yp
-	/*\ while (y--) \*/
-	decl y
-	jnz .down_up_loop_y
-
-	jmp .scale_leave
-
-
-/*\ Scaling down both ways \*/
-
-.scale_x_down_y_down:
-	/*\ sow_4 = sow * 4 \*/
-	movl sow, %eax
-	sall $2, %eax
-	movl %eax, sow_4
-
-.down_down_loop_y:
-
-	/*\ Setup My and Cy \*/
-	movl yap, %eax
-	movzwl (%eax), %ebx
-	movl %ebx, My
-	movzwl 2(%eax), %eax
-	movl %eax, Cy
-
-	/*\ x = -dw \*/
-	movl dw, %ecx
-	negl %ecx
-.down_down_loop_x:
-	/*\ %esi = *yp + xp[x] \*/
-	movl yp, %eax
-	movl (%eax), %esi
-	movl xp, %eax
-	movl (%eax, %ecx, 4), %eax
-	leal (%esi, %eax, 4), %esi
-
-	/*\ Setup Mx and Cx \*/
-	movl xap, %eax
-	movzwl (%eax, %ecx, 4), %ebx
-	movl %ebx, Mx
-	movzwl 2(%eax, %ecx, 4), %eax
-	movl %eax, Cx
-
-	/*\ mm3 = Cx \*/
-	movd %eax, %mm3
-	punpcklwd %mm3, %mm3
-	punpckldq %mm3, %mm3
-	/*\ mm5 = Mx \*/
-	movd %ebx, %mm5
-	punpcklwd %mm5, %mm5
-	punpckldq %mm5, %mm5
-	
-	/*\ p = sptr; v = (*p * Mx) >> 9 \*/
-	movl %esi, %eax
-	movd (%eax), %mm0
-	punpcklbw %mm7, %mm0
-	psllw $7, %mm0
-	pmulhw %mm5, %mm0
-	
-	/*\ i = 0x4000 - Mx \*/
-	movl $0x4000, %ebx
-	subl Mx, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ v += (*++p * Cx) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $7, %mm1
-	pmulhw %mm3, %mm1
-	paddw %mm1, %mm0
-	
-	/*\ i -= Cx; while (i > Cx) \*/
-	subl Cx, %ebx
-2:
-	cmpl Cx, %ebx
-	jg 1b
-	
-	/*\ mm6 = i \*/
-	movd %ebx, %mm6
-	punpcklwd %mm6, %mm6
-	punpckldq %mm6, %mm6
-	
-	/*\ v += (*++p * i) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $7, %mm1
-	pmulhw %mm6, %mm1
-	paddw %mm1, %mm0
-5:
-	/*\ v *= My \*/
-	movd My, %mm4
-	punpcklwd %mm4, %mm4
-	punpckldq %mm4, %mm4
-	psllw $2, %mm0
-	pmulhw %mm4, %mm0
-	
-	/*\ j = 0x4000 - My \*/
-	movl $0x4000, %edx
-	subl My, %edx
-	jbe 6f
-	jmp 4f
-3:
-	/*\ sptr += sow; p = sptr \*/
-	addl sow_4, %esi
-	movl %esi, %eax
-	/*\ vx = (*p * Mx) >> 9 \*/
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $7, %mm1
-	pmulhw %mm5, %mm1
-	
-	/*\ i = 0x4000 - Mx \*/
-	movl $0x4000, %ebx
-	subl Mx, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ vx += (*++p * Cx) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $7, %mm2
-	pmulhw %mm3, %mm2
-	paddw %mm2, %mm1
-	
-	/*\ i -= Cx; while (i > Cx) \*/
-	subl Cx, %ebx
-2:
-	cmpl Cx, %ebx
-	jg 1b
-	
-	/*\ vx += (*++p * i) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $7, %mm2
-	pmulhw %mm6, %mm2
-	paddw %mm2, %mm1
-5:
-	/*\ v += (vx * Cy) >> 14 \*/
-	movd Cy, %mm4
-	punpcklwd %mm4, %mm4
-	punpckldq %mm4, %mm4
-	psllw $2, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm0
-	
-	/*\ j -= Cy; while (j > Cy) \*/
-	subl Cy, %edx
-4:
-	cmpl Cy, %edx
-	jg 3b
-	
-	/*\ sptr += sow; p = sptr \*/
-	addl sow_4, %esi
-	movl %esi, %eax
-	/*\ vx = (*p * Mx) >> 9 \*/
-	movd (%eax), %mm1
-	punpcklbw %mm7, %mm1
-	psllw $7, %mm1
-	pmulhw %mm5, %mm1
-	
-	/*\ i = 0x4000 - Mx \*/
-	movl $0x4000, %ebx
-	subl Mx, %ebx
-	jbe 5f
-	jmp 2f
-1:
-	/*\ vx += (*++p * Cx) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $7, %mm2
-	pmulhw %mm3, %mm2
-	paddw %mm2, %mm1
-	
-	/*\ i -= Cx; while (i > Cx) \*/
-	subl Cx, %ebx
-2:
-	cmpl Cx, %ebx
-	jg 1b
-	
-	/*\ vx += (*++p * i) >> 9 \*/
-	addl $4, %eax
-	movd (%eax), %mm2
-	punpcklbw %mm7, %mm2
-	psllw $7, %mm2
-	pmulhw %mm6, %mm2
-	paddw %mm2, %mm1
-5:
-	/*\ v += (vx * j) >> 14 \*/
-	movd %edx, %mm4
-	punpcklwd %mm4, %mm4
-	punpckldq %mm4, %mm4
-	psllw $2, %mm1
-	pmulhw %mm4, %mm1
-	paddw %mm1, %mm0
-6:
-	/*\ dptr[x] = mm0 >> 5 \*/
-	psrlw $5, %mm0
-	packuswb %mm0, %mm0
-	movd %mm0, (%edi, %ecx, 4)
-
-	/*\ while (++x) \*/
-	incl %ecx
-	jnz .down_down_loop_x
-
-	/*\ dptr += dow \*/
-	movl dow, %eax
-	leal (%edi, %eax, 4), %edi
-	/*\ yap++; yp++ \*/
-	addl $4, yap
-	addl $4, yp
-	/*\ while (y--) \*/
-	decl y
-	jnz .down_down_loop_y
-
-	jmp .scale_leave
-
-.scale_leave:
-	emms
-	popl %esi
-	popl %edi
-	popl %edx
-	popl %ecx
-	popl %ebx
-	movl %ebp, %esp
-	popl %ebp
-	ret
-
-SIZE(mimageScale_mmx_AARGBA)
-
-#endif
-
-.section	.note.GNU-stack,"",%progbits
diff --git a/src/imageutils/scale.cpp b/src/imageutils/scale.cpp
index 3c719a7..1b6a317 100644
--- a/src/imageutils/scale.cpp
+++ b/src/imageutils/scale.cpp
@@ -947,15 +947,6 @@ namespace MImageScale{
     typedef long long llong;
 }
 
-#ifdef HAVE_X86_MMX
-extern "C" {
-    void __mimageScale_mmx_AARGBA(MImageScale::MImageScaleInfo *isi,
-                                  unsigned int *dest, int dxx, int dyy,
-                                  int dx, int dy, int dw, int dh,
-                                  int dow, int sow);
-}
-#endif
-
 using namespace MImageScale;
 
 TQImage MImageScale::smoothScale(const TQImage& image, int dw, int dh)
@@ -978,23 +969,12 @@ TQImage MImageScale::smoothScale(const TQImage& image, int dw, int dh)
     TQImage buffer(dw, dh, 32);
     buffer.setAlphaBuffer(img.hasAlphaBuffer());
 
-#ifdef HAVE_X86_MMX
-//#warning Using MMX Smoothscale
-    bool haveMMX = KCPUInfo::haveExtension( KCPUInfo::IntelMMX );
-    if(haveMMX){
-        __mimageScale_mmx_AARGBA(scaleinfo, (unsigned int *)buffer.scanLine(0),
-                                 0, 0, 0, 0, dw, dh, dw, sow);
-    }
+    if(img.hasAlphaBuffer())
+        mimageScaleAARGBA(scaleinfo, (unsigned int *)buffer.scanLine(0), 0, 0,
+                          0, 0, dw, dh, dw, sow);
     else
-#endif
-    {
-        if(img.hasAlphaBuffer())
-            mimageScaleAARGBA(scaleinfo, (unsigned int *)buffer.scanLine(0), 0, 0,
-                              0, 0, dw, dh, dw, sow);
-        else
-            mimageScaleAARGB(scaleinfo, (unsigned int *)buffer.scanLine(0), 0, 0,
-                             0, 0, dw, dh, dw, sow);
-    }
+        mimageScaleAARGB(scaleinfo, (unsigned int *)buffer.scanLine(0), 0, 0,
+                         0, 0, dw, dh, dw, sow);
     mimageFreeScaleInfo(scaleinfo);
     return(buffer);
 }
@@ -1310,7 +1290,7 @@ void MImageScale::mimageScaleAARGBA(MImageScaleInfo *isi, unsigned int *dest,
         unsigned int *pix;
         int r, g, b, a, rr, gg, bb, aa;
         int yap;
-		 
+
         /* go through every scanline in the output buffer */
         for(y = 0; y < dh; y++){
             Cy = YAP >> 16;