[PATCH] ARM: Fix VFP to use do_div()

VFP used __divdi3 64-bit division needlessly. Convert it to use our 64-bit by 32-bit division instead. Signed-off-by: Russell King <rmk+kernel@arm.linux.org.uk>

[PATCH] ARM: Fix VFP to use do_div()
VFP used __divdi3 64-bit division needlessly. Convert it to use our 64-bit by 32-bit division instead. Signed-off-by: Russell King <rmk+kernel@arm.linux.org.uk>
Russell King · Russell King
1 parent b3402cf50e
Showing 3 changed files with 27 additions and 4 deletions Side-by-side Diff
arch/arm/vfp/vfp.h
arch/arm/vfp/vfpdouble.c
arch/arm/vfp/vfpsingle.c
@@ -117,7 +117,13 @@
 	if (nh >= m)
 		return ~0ULL;
 	mh = m >> 32;
-	z = (mh << 32 <= nh) ? 0xffffffff00000000ULL : (nh / mh) << 32;
+	if (mh << 32 <= nh) {
+		z = 0xffffffff00000000ULL;
+	} else {
+		z = nh;
+		do_div(z, mh);
+		z <<= 32;
+	}
 	mul64to128(&termh, &terml, m, z);
 	sub128(&remh, &reml, nh, nl, termh, terml);
 	ml = m << 32;
@@ -126,7 +132,12 @@
 		add128(&remh, &reml, remh, reml, mh, ml);
 	}
 	remh = (remh << 32) | (reml >> 32);
-	z |= (mh << 32 <= remh) ? 0xffffffff : remh / mh;
+	if (mh << 32 <= remh) {
+		z |= 0xffffffff;
+	} else {
+		do_div(remh, mh);
+		z |= remh;
+	}
 	return z;
 }
  
@@ -32,6 +32,8 @@
  */
 #include <linux/kernel.h>
 #include <linux/bitops.h>
+
+#include <asm/div64.h>
 #include <asm/ptrace.h>
 #include <asm/vfp.h>
  
@@ -32,6 +32,8 @@
  */
 #include <linux/kernel.h>
 #include <linux/bitops.h>
+
+#include <asm/div64.h>
 #include <asm/ptrace.h>
 #include <asm/vfp.h>
  
@@ -303,7 +305,11 @@
 		if (z <= a)
 			return (s32)a >> 1;
 	}
-	return (u32)(((u64)a << 31) / z) + (z >> 1);
+	{
+		u64 v = (u64)a << 31;
+		do_div(v, z);
+		return v + (z >> 1);
+	}
 }
  
 static u32 vfp_single_fsqrt(int sd, int unused, s32 m, u32 fpscr)
@@ -1107,7 +1113,11 @@
 		vsn.significand >>= 1;
 		vsd.exponent++;
 	}
-	vsd.significand = ((u64)vsn.significand << 32) / vsm.significand;
+	{
+		u64 significand = (u64)vsn.significand << 32;
+		do_div(significand, vsm.significand);
+		vsd.significand = significand;
+	}
 	if ((vsd.significand & 0x3f) == 0)
 		vsd.significand |= ((u64)vsm.significand * vsd.significand != (u64)vsn.significand << 32);
...	...	@@ -117,7 +117,13 @@
117	117	if (nh >= m)
118	118	return ~0ULL;
119	119	mh = m >> 32;
120		- z = (mh << 32 <= nh) ? 0xffffffff00000000ULL : (nh / mh) << 32;
	120	+ if (mh << 32 <= nh) {
	121	+ z = 0xffffffff00000000ULL;
	122	+ } else {
	123	+ z = nh;
	124	+ do_div(z, mh);
	125	+ z <<= 32;
	126	+ }
121	127	mul64to128(&termh, &terml, m, z);
122	128	sub128(&remh, &reml, nh, nl, termh, terml);
123	129	ml = m << 32;
...	...	@@ -126,7 +132,12 @@
126	132	add128(&remh, &reml, remh, reml, mh, ml);
127	133	}
128	134	remh = (remh << 32) \| (reml >> 32);
129		- z \|= (mh << 32 <= remh) ? 0xffffffff : remh / mh;
	135	+ if (mh << 32 <= remh) {
	136	+ z \|= 0xffffffff;
	137	+ } else {
	138	+ do_div(remh, mh);
	139	+ z \|= remh;
	140	+ }
130	141	return z;
131	142	}
132	143
...	...	@@ -32,6 +32,8 @@
32	32	*/
33	33	#include <linux/kernel.h>
34	34	#include <linux/bitops.h>
	35	+
	36	+#include <asm/div64.h>
35	37	#include <asm/ptrace.h>
36	38	#include <asm/vfp.h>
37	39