Line data Source code
1 : #line 2 "../src/kernel/gmp/mp.c"
2 : /* Copyright (C) 2002-2003 The PARI group.
3 :
4 : This file is part of the PARI/GP package.
5 :
6 : PARI/GP is free software; you can redistribute it and/or modify it under the
7 : terms of the GNU General Public License as published by the Free Software
8 : Foundation; either version 2 of the License, or (at your option) any later
9 : version. It is distributed in the hope that it will be useful, but WITHOUT
10 : ANY WARRANTY WHATSOEVER.
11 :
12 : Check the License for details. You should have received a copy of it, along
13 : with the package; see the file 'COPYING'. If not, write to the Free Software
14 : Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA. */
15 :
16 : /***********************************************************************/
17 : /** **/
18 : /** GMP KERNEL **/
19 : /** BA2002Sep24 **/
20 : /***********************************************************************/
21 : /* GMP t_INT as just like normal t_INT, just the mantissa is the other way
22 : * round
23 : *
24 : * `How would you like to live in Looking-glass House, Kitty? I
25 : * wonder if they'd give you milk in there? Perhaps Looking-glass
26 : * milk isn't good to drink--But oh, Kitty! now we come to the
27 : * passage. You can just see a little PEEP of the passage in
28 : * Looking-glass House, if you leave the door of our drawing-room
29 : * wide open: and it's very like our passage as far as you can see,
30 : * only you know it may be quite different on beyond. Oh, Kitty!
31 : * how nice it would be if we could only get through into Looking-
32 : * glass House! I'm sure it's got, oh! such beautiful things in it!
33 : *
34 : * Through the Looking Glass, Lewis Carrol
35 : *
36 : * (pityful attempt to beat GN code/comments rate)
37 : * */
38 :
39 : #include <gmp.h>
40 : #include "pari.h"
41 : #include "paripriv.h"
42 : #include "../src/kernel/none/tune-gen.h"
43 :
44 : /*We need PARI invmod renamed to invmod_pari*/
45 : #define INVMOD_PARI
46 :
47 0 : static void *pari_gmp_realloc(void *ptr, size_t old_size, size_t new_size) {
48 0 : (void)old_size; return (void *) pari_realloc(ptr,new_size);
49 : }
50 :
51 1736831 : static void pari_gmp_free(void *ptr, size_t old_size){
52 1736831 : (void)old_size; pari_free(ptr);
53 1736831 : }
54 :
55 : static void *(*old_gmp_malloc)(size_t new_size);
56 : static void *(*old_gmp_realloc)(void *ptr, size_t old_size, size_t new_size);
57 : static void (*old_gmp_free)(void *ptr, size_t old_size);
58 :
59 : void
60 1096 : pari_kernel_init(void)
61 : {
62 1096 : mp_get_memory_functions (&old_gmp_malloc, &old_gmp_realloc, &old_gmp_free);
63 1096 : mp_set_memory_functions((void *(*)(size_t)) pari_malloc, pari_gmp_realloc, pari_gmp_free);
64 1096 : }
65 :
66 : const char *
67 4 : pari_kernel_version(void)
68 : {
69 : #ifdef gmp_version
70 4 : return gmp_version;
71 : #else
72 : return "";
73 : #endif
74 : }
75 :
76 : void
77 1088 : pari_kernel_close(void)
78 : {
79 : void *(*new_gmp_malloc)(size_t new_size);
80 : void *(*new_gmp_realloc)(void *ptr, size_t old_size, size_t new_size);
81 : void (*new_gmp_free)(void *ptr, size_t old_size);
82 1088 : mp_get_memory_functions (&new_gmp_malloc, &new_gmp_realloc, &new_gmp_free);
83 1088 : if (new_gmp_malloc==pari_malloc) new_gmp_malloc = old_gmp_malloc;
84 1088 : if (new_gmp_realloc==pari_gmp_realloc) new_gmp_realloc = old_gmp_realloc;
85 1088 : if (new_gmp_free==pari_gmp_free) new_gmp_free = old_gmp_free;
86 1088 : mp_set_memory_functions(new_gmp_malloc, new_gmp_realloc, new_gmp_free);
87 1088 : }
88 :
89 : #define LIMBS(x) ((mp_limb_t *)((x)+2))
90 : #define NLIMBS(x) (lgefint(x)-2)
91 : /*This one is for t_REALs to emphasize they are not t_INTs*/
92 : #define RLIMBS(x) ((mp_limb_t *)((x)+2))
93 : #define RNLIMBS(x) (lg(x)-2)
94 :
95 : INLINE void
96 6871328 : xmpn_copy(mp_limb_t *x, mp_limb_t *y, long n)
97 : {
98 56270725 : while (--n >= 0) x[n]=y[n];
99 6871328 : }
100 :
101 : INLINE void
102 581913150 : xmpn_mirror(mp_limb_t *x, long n)
103 : {
104 : long i;
105 3849068545 : for(i=0;i<(n>>1);i++)
106 : {
107 3267155395 : ulong m=x[i];
108 3267155395 : x[i]=x[n-1-i];
109 3267155395 : x[n-1-i]=m;
110 : }
111 581913150 : }
112 :
113 : INLINE void
114 711879251 : xmpn_mirrorcopy(mp_limb_t *z, mp_limb_t *x, long n)
115 : {
116 : long i;
117 9773478336 : for(i=0;i<n;i++)
118 9061599085 : z[i]=x[n-1-i];
119 711879251 : }
120 :
121 : INLINE void
122 235737991 : xmpn_zero(mp_ptr x, mp_size_t n)
123 : {
124 2054786530 : while (--n >= 0) x[n]=0;
125 235737991 : }
126 :
127 : INLINE GEN
128 40886041 : icopy_ef(GEN x, long l)
129 : {
130 40886041 : long lx = lgefint(x);
131 40886041 : const GEN y = cgeti(l);
132 :
133 290047631 : while (--lx > 0) y[lx]=x[lx];
134 40884763 : return y;
135 : }
136 :
137 : /* NOTE: arguments of "spec" routines (muliispec, addiispec, etc.) aren't
138 : * GENs but pairs (long *a, long na) representing a list of digits (in basis
139 : * BITS_IN_LONG) : a[0], ..., a[na-1]. [ In ordre to facilitate splitting: no
140 : * need to reintroduce codewords ]
141 : * Use speci(a,na) to visualize the corresponding GEN.
142 : */
143 :
144 : /***********************************************************************/
145 : /** **/
146 : /** ADDITION / SUBTRACTION **/
147 : /** **/
148 : /***********************************************************************/
149 :
150 : GEN
151 2997433 : setloop(GEN a)
152 : {
153 2997433 : pari_sp av = avma - 2 * sizeof(long);
154 2997433 : (void)cgetg(lgefint(a) + 3, t_VECSMALL);
155 2997433 : return icopy_avma(a, av); /* two cells of extra space after a */
156 : }
157 :
158 : /* we had a = setloop(?), then some incloops. Reset a to b */
159 : GEN
160 174328 : resetloop(GEN a, GEN b) {
161 174328 : a[0] = evaltyp(t_INT) | evallg(lgefint(b));
162 174328 : affii(b, a); return a;
163 : }
164 :
165 : /* assume a > 0, initialized by setloop. Do a++ */
166 : static GEN
167 98848270 : incpos(GEN a)
168 : {
169 98848270 : long i, l = lgefint(a);
170 98848275 : for (i=2; i<l; i++)
171 98852378 : if (++uel(a,i)) return a;
172 3 : a[l] = 1; l++;
173 3 : a[0]=evaltyp(t_INT) | _evallg(l);
174 3 : a[1]=evalsigne(1) | evallgefint(l);
175 3 : return a;
176 : }
177 :
178 : /* assume a < 0, initialized by setloop. Do a++ */
179 : static GEN
180 66652 : incneg(GEN a)
181 : {
182 66652 : long i, l = lgefint(a)-1;
183 66652 : if (uel(a,2)--)
184 : {
185 66648 : if (!a[l]) /* implies l = 2 */
186 : {
187 1976 : a[0] = evaltyp(t_INT) | _evallg(2);
188 1976 : a[1] = evalsigne(0) | evallgefint(2);
189 : }
190 66648 : return a;
191 : }
192 5 : for (i=3; i<=l; i++)
193 5 : if (uel(a,i)--) break;
194 4 : if (!a[l])
195 : {
196 4 : a[0] = evaltyp(t_INT) | _evallg(l);
197 4 : a[1] = evalsigne(-1) | evallgefint(l);
198 : }
199 4 : return a;
200 : }
201 :
202 : /* assume a initialized by setloop. Do a++ */
203 : GEN
204 99253915 : incloop(GEN a)
205 : {
206 99253915 : switch(signe(a))
207 : {
208 336632 : case 0:
209 336632 : a[0]=evaltyp(t_INT) | _evallg(3);
210 336632 : a[1]=evalsigne(1) | evallgefint(3);
211 336632 : a[2]=1; return a;
212 66652 : case -1: return incneg(a);
213 98850631 : default: return incpos(a);
214 : }
215 : }
216 :
217 : INLINE GEN
218 2587516145 : adduispec(ulong s, GEN x, long nx)
219 : {
220 : GEN zd;
221 : long lz;
222 :
223 2587516145 : if (nx == 1) return adduu(uel(x,0), s);
224 715002402 : lz = nx+3; zd = cgeti(lz);
225 717967821 : if (mpn_add_1(LIMBS(zd),(mp_limb_t *)x,nx,s))
226 5009735 : zd[lz-1]=1;
227 : else
228 712963132 : lz--;
229 717972867 : zd[1] = evalsigne(1) | evallgefint(lz);
230 717972867 : return zd;
231 : }
232 :
233 : GEN
234 580877636 : adduispec_offset(ulong s, GEN x, long offset, long nx)
235 : {
236 580877636 : GEN xd=x+2+offset;
237 806560057 : while (nx && *(xd+nx-1)==0) nx--;
238 580877636 : if (!nx) return utoi(s);
239 536211456 : return adduispec(s,xd,nx);
240 : }
241 :
242 : INLINE GEN
243 3264294295 : addiispec(GEN x, GEN y, long nx, long ny)
244 : {
245 : GEN zd;
246 : long lz;
247 :
248 3264294295 : if (nx < ny) swapspec(x,y, nx,ny);
249 3264294295 : if (ny == 1) return adduispec(*y,x,nx);
250 1301625072 : lz = nx+3; zd = cgeti(lz);
251 :
252 1301838460 : if (mpn_add(LIMBS(zd),(mp_limb_t *)x,nx,(mp_limb_t *)y,ny))
253 27945707 : zd[lz-1]=1;
254 : else
255 1274230586 : lz--;
256 :
257 1302176293 : zd[1] = evalsigne(1) | evallgefint(lz);
258 1302176293 : return zd;
259 : }
260 :
261 : /* assume x >= y */
262 : INLINE GEN
263 1723343467 : subiuspec(GEN x, ulong s, long nx)
264 : {
265 : GEN zd;
266 : long lz;
267 :
268 1723343467 : if (nx == 1) return utoi(x[0] - s);
269 :
270 239503335 : lz = nx + 2; zd = cgeti(lz);
271 239969800 : mpn_sub_1 (LIMBS(zd), (mp_limb_t *)x, nx, s);
272 239970489 : if (! zd[lz - 1]) { --lz; }
273 :
274 239970489 : zd[1] = evalsigne(1) | evallgefint(lz);
275 239970489 : return zd;
276 : }
277 :
278 : /* assume x > y */
279 : INLINE GEN
280 2948073746 : subiispec(GEN x, GEN y, long nx, long ny)
281 : {
282 : GEN zd;
283 : long lz;
284 2948073746 : if (ny==1) return subiuspec(x,*y,nx);
285 1254479614 : lz = nx+2; zd = cgeti(lz);
286 :
287 1251960733 : mpn_sub (LIMBS(zd), (mp_limb_t *)x, nx, (mp_limb_t *)y, ny);
288 1720629256 : while (lz >= 3 && zd[lz - 1] == 0) { lz--; }
289 :
290 1252280858 : zd[1] = evalsigne(1) | evallgefint(lz);
291 1252280858 : return zd;
292 : }
293 :
294 : static void
295 520932585 : roundr_up_ip(GEN x, long l)
296 : {
297 520932585 : long i = l;
298 : for(;;)
299 : {
300 522710419 : if (++((ulong*)x)[--i]) break;
301 2166585 : if (i == 2) { x[2] = HIGHBIT; shiftr_inplace(x, 1); break; }
302 : }
303 520980396 : }
304 :
305 : void
306 399622649 : affir(GEN x, GEN y)
307 : {
308 399622649 : const long s = signe(x), ly = lg(y);
309 : long lx, sh, i;
310 :
311 399622649 : if (!s)
312 : {
313 41393237 : y[1] = evalexpo(-bit_accuracy(ly));
314 41389505 : return;
315 : }
316 358229412 : lx = lgefint(x); sh = bfffo(*int_MSW(x));
317 358229412 : y[1] = evalsigne(s) | evalexpo(bit_accuracy(lx)-sh-1);
318 358459709 : if (sh) {
319 350963503 : if (lx <= ly)
320 : {
321 951612745 : for (i=lx; i<ly; i++) y[i]=0;
322 247153629 : mpn_lshift(LIMBS(y),LIMBS(x),lx-2,sh);
323 247265560 : xmpn_mirror(LIMBS(y),lx-2);
324 247653615 : return;
325 : }
326 103809874 : mpn_lshift(LIMBS(y),LIMBS(x)+lx-ly,ly-2,sh);
327 103811084 : uel(y,2) |= uel(x,lx-ly+1) >> (BITS_IN_LONG-sh);
328 103811084 : xmpn_mirror(LIMBS(y),ly-2);
329 : /* lx > ly: round properly */
330 103811944 : if ((uel(x,lx-ly+1)<<sh) & HIGHBIT) roundr_up_ip(y, ly);
331 : }
332 : else {
333 7496206 : GEN xd=int_MSW(x);
334 7496206 : if (lx <= ly)
335 : {
336 9371317 : for (i=2; i<lx; i++,xd=int_precW(xd)) y[i]=*xd;
337 5105121 : for ( ; i<ly; i++) y[i]=0;
338 2348062 : return;
339 : }
340 14637510 : for (i=2; i<ly; i++,xd=int_precW(xd)) y[i]=*xd;
341 : /* lx > ly: round properly */
342 5148144 : if (uel(x,lx-ly+1) & HIGHBIT) roundr_up_ip(y, ly);
343 : }
344 : }
345 :
346 : INLINE GEN
347 704675696 : shiftispec(GEN x, long nx, long n)
348 : {
349 : long ny,m;
350 : GEN yd, y;
351 :
352 704675696 : if (!n) return icopyspec(x, nx);
353 :
354 675790180 : if (n > 0)
355 : {
356 395840967 : long d = dvmdsBIL(n, &m);
357 : long i;
358 :
359 395697485 : ny = nx + d + (m!=0);
360 395697485 : y = cgeti(ny + 2); yd = y + 2;
361 548174382 : for (i=0; i<d; i++) yd[i] = 0;
362 :
363 394776930 : if (!m) xmpn_copy((mp_limb_t *) (yd + d), (mp_limb_t *) x, nx);
364 : else
365 : {
366 393241069 : ulong carryd = mpn_lshift((mp_limb_t *) (yd + d), (mp_limb_t *) x, nx, m);
367 393285627 : if (carryd) yd[ny - 1] = carryd;
368 370152418 : else ny--;
369 : }
370 : }
371 : else
372 : {
373 279949213 : long d = dvmdsBIL(-n, &m);
374 :
375 281803498 : ny = nx - d;
376 281803498 : if (ny < 1) return gen_0;
377 278911423 : y = cgeti(ny + 2); yd = y + 2;
378 :
379 278655264 : if (!m) xmpn_copy((mp_limb_t *) yd, (mp_limb_t *) (x + d), nx - d);
380 : else
381 : {
382 274002883 : mpn_rshift((mp_limb_t *) yd, (mp_limb_t *) (x + d), nx - d, m);
383 274016679 : if (yd[ny - 1] == 0)
384 : {
385 59908527 : if (ny == 1) return gc_const((pari_sp)(yd + 1), gen_0);
386 50425513 : ny--;
387 : }
388 : }
389 : }
390 662168220 : y[1] = evalsigne(1)|evallgefint(ny + 2);
391 662168220 : return y;
392 : }
393 :
394 : GEN
395 137110580 : mantissa2nr(GEN x, long n)
396 : {
397 137110580 : long ly, i, m, s = signe(x), lx = lg(x);
398 : GEN y;
399 137110580 : if (!s) return gen_0;
400 137109229 : if (!n)
401 : {
402 30174038 : y = cgeti(lx);
403 30171011 : y[1] = evalsigne(s) | evallgefint(lx);
404 30171011 : xmpn_mirrorcopy(LIMBS(y),RLIMBS(x),lx-2);
405 30170708 : return y;
406 : }
407 106935191 : if (n > 0)
408 : {
409 217526 : GEN z = (GEN)avma;
410 217526 : long d = dvmdsBIL(n, &m);
411 :
412 217526 : ly = lx+d; y = new_chunk(ly);
413 552203 : for ( ; d; d--) *--z = 0;
414 221903 : if (!m) for (i=2; i<lx; i++) y[i]=x[i];
415 : else
416 : {
417 216108 : const ulong sh = BITS_IN_LONG - m;
418 216108 : shift_left(y,x, 2,lx-1, 0,m);
419 216108 : i = uel(x,2) >> sh;
420 : /* Extend y on the left? */
421 216108 : if (i) { ly++; y = new_chunk(1); y[2] = i; }
422 : }
423 : }
424 : else
425 : {
426 106717665 : ly = lx - dvmdsBIL(-n, &m);
427 106710571 : if (ly<3) return gen_0;
428 106710571 : y = new_chunk(ly);
429 106674863 : if (m) {
430 106416893 : shift_right(y,x, 2,ly, 0,m);
431 106455285 : if (y[2] == 0)
432 : {
433 0 : if (ly==3) return gc_const((pari_sp)(y+3), gen_0);
434 0 : ly--; set_avma((pari_sp)(++y));
435 : }
436 : } else {
437 700081 : for (i=2; i<ly; i++) y[i]=x[i];
438 : }
439 : }
440 106930781 : xmpn_mirror(LIMBS(y),ly-2);
441 106981269 : y[1] = evalsigne(s)|evallgefint(ly);
442 106981269 : y[0] = evaltyp(t_INT)|evallg(ly); return y;
443 : }
444 :
445 : GEN
446 3545650 : truncr(GEN x)
447 : {
448 : long s, e, d, m, i;
449 : GEN y;
450 3545650 : if ((s=signe(x)) == 0 || (e=expo(x)) < 0) return gen_0;
451 1527629 : d = nbits2lg(e+1); m = remsBIL(e);
452 1527617 : if (d > lg(x)) pari_err_PREC( "truncr (precision loss in truncation)");
453 :
454 1527613 : y=cgeti(d); y[1] = evalsigne(s) | evallgefint(d);
455 1527552 : if (++m == BITS_IN_LONG)
456 95929 : for (i=2; i<d; i++) y[d-i+1]=x[i];
457 : else
458 : {
459 1479841 : GEN z=cgeti(d);
460 3026293 : for (i=2; i<d; i++) z[d-i+1]=x[i];
461 1479728 : mpn_rshift(LIMBS(y),LIMBS(z),d-2,BITS_IN_LONG-m);
462 1479732 : set_avma((pari_sp)y);
463 : }
464 1527423 : return y;
465 : }
466 :
467 : /* integral part */
468 : GEN
469 6982030 : floorr(GEN x)
470 : {
471 : long e, d, m, i, lx;
472 : GEN y;
473 6982030 : if (signe(x) >= 0) return truncr(x);
474 4200850 : if ((e=expo(x)) < 0) return gen_m1;
475 3522043 : d = nbits2lg(e+1); m = remsBIL(e);
476 3519556 : lx=lg(x); if (d>lx) pari_err_PREC( "floorr (precision loss in truncation)");
477 3519556 : y = cgeti(d+1);
478 3509566 : if (++m == BITS_IN_LONG)
479 : {
480 3032 : for (i=2; i<d; i++) y[d-i+1]=x[i];
481 1447 : i=d; while (i<lx && !x[i]) i++;
482 903 : if (i==lx) goto END;
483 : }
484 : else
485 : {
486 3508663 : GEN z=cgeti(d);
487 7845990 : for (i=2; i<d; i++) z[d-i+1]=x[i];
488 3494868 : mpn_rshift(LIMBS(y),LIMBS(z),d-2,BITS_IN_LONG-m);
489 3495390 : if (uel(x,d-1)<<m == 0)
490 : {
491 516996 : i=d; while (i<lx && !x[i]) i++;
492 117881 : if (i==lx) goto END;
493 : }
494 : }
495 3421170 : if (mpn_add_1(LIMBS(y),LIMBS(y),d-2,1))
496 0 : y[d++]=1;
497 3421291 : END:
498 3496414 : y[1] = evalsigne(-1) | evallgefint(d);
499 3496414 : return y;
500 : }
501 :
502 : INLINE int
503 3832345192 : cmpiispec(GEN x, GEN y, long lx, long ly)
504 : {
505 3832345192 : if (lx < ly) return -1;
506 3545057449 : if (lx > ly) return 1;
507 3395942727 : return mpn_cmp((mp_limb_t*)x,(mp_limb_t*)y, lx);
508 : }
509 :
510 : INLINE int
511 272688973 : equaliispec(GEN x, GEN y, long lx, long ly)
512 : {
513 272688973 : if (lx != ly) return 0;
514 272551355 : return !mpn_cmp((mp_limb_t*)x,(mp_limb_t*)y, lx);
515 : }
516 :
517 : /***********************************************************************/
518 : /** **/
519 : /** MULTIPLICATION **/
520 : /** **/
521 : /***********************************************************************/
522 : /* assume ny > 0 */
523 : INLINE GEN
524 5457510120 : muluispec(ulong x, GEN y, long ny)
525 : {
526 5457510120 : if (ny == 1)
527 4366871797 : return muluu(x, *y);
528 : else
529 : {
530 1090638323 : long lz = ny+3;
531 1090638323 : GEN z = cgeti(lz);
532 1099879693 : ulong hi = mpn_mul_1 (LIMBS(z), (mp_limb_t *)y, ny, x);
533 1101240382 : if (hi) { z[lz - 1] = hi; } else lz--;
534 1101240382 : z[1] = evalsigne(1) | evallgefint(lz);
535 1101240382 : return z;
536 : }
537 : }
538 :
539 : /* a + b*|y| */
540 : GEN
541 0 : addumului(ulong a, ulong b, GEN y)
542 : {
543 : GEN z;
544 : long i, lz;
545 : ulong hi;
546 0 : if (!b || !signe(y)) return utoi(a);
547 0 : lz = lgefint(y)+1;
548 0 : z = cgeti(lz);
549 0 : z[2]=a;
550 0 : for(i=3;i<lz;i++) z[i]=0;
551 0 : hi=mpn_addmul_1(LIMBS(z), LIMBS(y), NLIMBS(y), b);
552 0 : if (hi) z[lz-1]=hi; else lz--;
553 0 : z[1] = evalsigne(1) | evallgefint(lz);
554 0 : return gc_const((pari_sp)z, z);
555 : }
556 :
557 : /***********************************************************************/
558 : /** **/
559 : /** DIVISION **/
560 : /** **/
561 : /***********************************************************************/
562 :
563 : ulong
564 1286047627 : umodiu(GEN y, ulong x)
565 : {
566 1286047627 : long sy=signe(y);
567 : ulong hi;
568 1286047627 : if (!x) pari_err_INV("umodiu",gen_0);
569 1287006884 : if (!sy) return 0;
570 895040437 : hi = mpn_mod_1(LIMBS(y),NLIMBS(y),x);
571 895040437 : if (!hi) return 0;
572 878743085 : return (sy > 0)? hi: x - hi;
573 : }
574 :
575 : /* return |y| \/ x */
576 : GEN
577 111092377 : absdiviu_rem(GEN y, ulong x, ulong *rem)
578 : {
579 : long ly;
580 : GEN z;
581 :
582 111092377 : if (!x) pari_err_INV("absdiviu_rem",gen_0);
583 111098429 : if (!signe(y)) { *rem = 0; return gen_0; }
584 :
585 88610919 : ly = lgefint(y);
586 88610919 : if (ly == 3 && (ulong)x > uel(y,2)) { *rem = uel(y,2); return gen_0; }
587 :
588 74030528 : z = cgeti(ly);
589 74030653 : *rem = mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
590 74030850 : if (z [ly - 1] == 0) ly--;
591 74030850 : z[1] = evallgefint(ly) | evalsigne(1);
592 74030850 : return z;
593 : }
594 :
595 : GEN
596 85136211 : divis_rem(GEN y, long x, long *rem)
597 : {
598 85136211 : long sy=signe(y),ly,s;
599 : GEN z;
600 :
601 85136211 : if (!x) pari_err_INV("divis_rem",gen_0);
602 85148329 : if (!sy) { *rem = 0; return gen_0; }
603 59912704 : if (x<0) { s = -sy; x = -x; } else s = sy;
604 :
605 59912704 : ly = lgefint(y);
606 59912704 : if (ly == 3 && (ulong)x > uel(y,2)) { *rem = itos(y); return gen_0; }
607 :
608 41449427 : z = cgeti(ly);
609 41446211 : *rem = mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
610 41446441 : if (sy<0) *rem = - *rem;
611 41446441 : if (z[ly - 1] == 0) ly--;
612 41446441 : z[1] = evallgefint(ly) | evalsigne(s);
613 41446441 : return z;
614 : }
615 :
616 : GEN
617 968395 : divis(GEN y, long x)
618 : {
619 968395 : long sy=signe(y),ly,s;
620 : GEN z;
621 :
622 968395 : if (!x) pari_err_INV("divis",gen_0);
623 968394 : if (!sy) return gen_0;
624 968346 : if (x<0) { s = -sy; x = -x; } else s=sy;
625 :
626 968346 : ly = lgefint(y);
627 968346 : if (ly == 3 && (ulong)x > uel(y,2)) return gen_0;
628 :
629 968034 : z = cgeti(ly);
630 968033 : (void)mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
631 968034 : if (z[ly - 1] == 0) ly--;
632 968034 : z[1] = evallgefint(ly) | evalsigne(s);
633 968034 : return z;
634 : }
635 :
636 : /* We keep llx bits of x and lly bits of y*/
637 : static GEN
638 75714224 : divrr_with_gmp(GEN x, GEN y)
639 : {
640 75714224 : long lx=RNLIMBS(x),ly=RNLIMBS(y);
641 75714224 : long lw=minss(lx,ly);
642 75714885 : long lly=minss(lw+1,ly);
643 75715976 : GEN w = cgetg(lw+2, t_REAL);
644 75698469 : long lu=lw+lly;
645 75698469 : long llx=minss(lu,lx);
646 75695553 : mp_limb_t *u=(mp_limb_t *)new_chunk(lu);
647 75674355 : mp_limb_t *z=(mp_limb_t *)new_chunk(lly);
648 : mp_limb_t *q,*r;
649 75642144 : long e=expo(x)-expo(y);
650 75642144 : long sx=signe(x),sy=signe(y);
651 75642144 : xmpn_mirrorcopy(z,RLIMBS(y),lly);
652 75657037 : xmpn_mirrorcopy(u+lu-llx,RLIMBS(x),llx);
653 75705280 : xmpn_zero(u,lu-llx);
654 75734045 : q = (mp_limb_t *)new_chunk(lw+1);
655 75717380 : r = (mp_limb_t *)new_chunk(lly);
656 :
657 75693318 : mpn_tdiv_qr(q,r,0,u,lu,z,lly);
658 :
659 : /*Round up: This is not exactly correct we should test 2*r>z*/
660 75743872 : if (uel(r,lly-1) > (uel(z,lly-1)>>1))
661 37526002 : mpn_add_1(q,q,lw+1,1);
662 :
663 75743918 : xmpn_mirrorcopy(RLIMBS(w),q,lw);
664 :
665 75741951 : if (q[lw] == 0) e--;
666 41926581 : else if (q[lw] == 1) { shift_right(w,w, 2,lw+2, 1,1); }
667 69 : else { w[2] = HIGHBIT; e++; }
668 75740842 : if (sy < 0) sx = -sx;
669 75740842 : w[1] = evalsigne(sx) | evalexpo(e);
670 75734883 : return gc_const((pari_sp)w, w);
671 : }
672 :
673 : /* We keep llx bits of x and lly bits of y*/
674 : static GEN
675 35161806 : divri_with_gmp(GEN x, GEN y)
676 : {
677 35161806 : long llx=RNLIMBS(x),ly=NLIMBS(y);
678 35161806 : long lly=minss(llx+1,ly);
679 35162094 : GEN w = cgetg(llx+2, t_REAL);
680 35157876 : long lu=llx+lly, ld=ly-lly;
681 35157876 : mp_limb_t *u=(mp_limb_t *)new_chunk(lu);
682 35154437 : mp_limb_t *z=(mp_limb_t *)new_chunk(lly);
683 : mp_limb_t *q,*r;
684 35148870 : long sh=bfffo(y[ly+1]);
685 35148870 : long e=expo(x)-expi(y);
686 35149569 : long sx=signe(x),sy=signe(y);
687 35149569 : if (sh) mpn_lshift(z,LIMBS(y)+ld,lly,sh);
688 683113 : else xmpn_copy(z,LIMBS(y)+ld,lly);
689 35151340 : xmpn_mirrorcopy(u+lu-llx,RLIMBS(x),llx);
690 35159020 : xmpn_zero(u,lu-llx);
691 35164571 : q = (mp_limb_t *)new_chunk(llx+1);
692 35162644 : r = (mp_limb_t *)new_chunk(lly);
693 :
694 35158243 : mpn_tdiv_qr(q,r,0,u,lu,z,lly);
695 :
696 : /*Round up: This is not exactly correct we should test 2*r>z*/
697 35167679 : if (uel(r,lly-1) > (uel(z,lly-1)>>1))
698 16011255 : mpn_add_1(q,q,llx+1,1);
699 :
700 35167691 : xmpn_mirrorcopy(RLIMBS(w),q,llx);
701 :
702 35167376 : if (q[llx] == 0) e--;
703 10577212 : else if (q[llx] == 1) { shift_right(w,w, 2,llx+2, 1,1); }
704 0 : else { w[2] = HIGHBIT; e++; }
705 35167246 : if (sy < 0) sx = -sx;
706 35167246 : w[1] = evalsigne(sx) | evalexpo(e);
707 35166201 : return gc_const((pari_sp)w, w);
708 : }
709 :
710 : GEN
711 150164264 : divri(GEN x, GEN y)
712 : {
713 150164264 : long s = signe(y);
714 :
715 150164264 : if (!s) pari_err_INV("divri",gen_0);
716 150164457 : if (!signe(x)) return real_0_bit(expo(x) - expi(y));
717 149932843 : if (!is_bigint(y)) {
718 114776855 : GEN z = divru(x, y[2]);
719 114777278 : if (s < 0) togglesign(z);
720 114777288 : return z;
721 : }
722 35155220 : return divri_with_gmp(x,y);
723 : }
724 :
725 : GEN
726 141571217 : divrr(GEN x, GEN y)
727 : {
728 141571217 : long sx=signe(x), sy=signe(y), lx,ly,lr,e,i,j;
729 : ulong y0,y1;
730 : GEN r, r1;
731 :
732 141571217 : if (!sy) pari_err_INV("divrr",y);
733 141580461 : e = expo(x) - expo(y);
734 141580461 : if (!sx) return real_0_bit(e);
735 141078287 : if (sy<0) sx = -sx;
736 :
737 141078287 : lx=lg(x); ly=lg(y);
738 141078287 : if (ly==3)
739 : {
740 26133941 : ulong k = x[2], l = (lx>3)? x[3]: 0;
741 : LOCAL_HIREMAINDER;
742 26133941 : if (k < uel(y,2)) e--;
743 : else
744 : {
745 8202765 : l >>= 1; if (k&1) l |= HIGHBIT;
746 8202765 : k >>= 1;
747 : }
748 26133941 : hiremainder = k; k = divll(l,y[2]);
749 26133941 : if (hiremainder > (uel(y,2) >> 1) && !++k) { k = HIGHBIT; e++; }
750 26133941 : r = cgetg(3, t_REAL);
751 26135910 : r[1] = evalsigne(sx) | evalexpo(e);
752 26133819 : r[2] = k; return r;
753 : }
754 :
755 114944346 : if (ly >= prec2lg(DIVRR_GMP_LIMIT))
756 75713760 : return divrr_with_gmp(x,y);
757 :
758 39283418 : lr = minss(lx,ly); r = new_chunk(lr);
759 39291345 : r1 = r-1;
760 133473554 : r1[1] = 0; for (i=2; i<lr; i++) r1[i]=x[i];
761 39291345 : r1[lr] = (lx>ly)? x[lr]: 0;
762 39291345 : y0 = y[2]; y1 = y[3];
763 172722502 : for (i=0; i<lr-1; i++)
764 : { /* r1 = r + (i-1), OK up to r1[2] (accesses at most r[lr]) */
765 : ulong k, qp;
766 : LOCAL_HIREMAINDER;
767 : LOCAL_OVERFLOW;
768 :
769 133431157 : if (uel(r1,1) == y0) { qp = ULONG_MAX; k = addll(y0,r1[2]); }
770 : else
771 : {
772 133185759 : if (uel(r1,1) > y0) /* can't happen if i=0 */
773 : {
774 0 : GEN y1 = y+1;
775 0 : j = lr-i; r1[j] = subll(r1[j],y1[j]);
776 0 : for (j--; j>0; j--) r1[j] = subllx(r1[j],y1[j]);
777 0 : j=i; do uel(r,--j)++; while (j && !r[j]);
778 : }
779 133185759 : hiremainder = r1[1]; overflow = 0;
780 133185759 : qp = divll(r1[2],y0); k = hiremainder;
781 : }
782 133431157 : j = lr-i+1;
783 133431157 : if (!overflow)
784 : {
785 : long k3, k4;
786 133287329 : k3 = mulll(qp,y1);
787 133287329 : if (j == 3) /* i = lr - 2 maximal, r1[3] undefined -> 0 */
788 39343101 : k4 = subll(hiremainder,k);
789 : else
790 : {
791 93944228 : k3 = subll(k3, r1[3]);
792 93944228 : k4 = subllx(hiremainder,k);
793 : }
794 170992022 : while (!overflow && k4) { qp--; k3=subll(k3,y1); k4=subllx(k4,y0); }
795 : }
796 133431157 : if (j<ly) (void)mulll(qp,y[j]); else { hiremainder = 0 ; j = ly; }
797 395927937 : for (j--; j>1; j--)
798 : {
799 262496780 : r1[j] = subll(r1[j], addmul(qp,y[j]));
800 262496780 : hiremainder += overflow;
801 : }
802 133431157 : if (uel(r1,1) != hiremainder)
803 : {
804 181913 : if (uel(r1,1) < hiremainder)
805 : {
806 181913 : qp--;
807 181913 : j = lr-i-(lr-i>=ly); r1[j] = addll(r1[j], y[j]);
808 517893 : for (j--; j>1; j--) r1[j] = addllx(r1[j], y[j]);
809 : }
810 : else
811 : {
812 0 : uel(r1,1) -= hiremainder;
813 0 : while (r1[1])
814 : {
815 0 : qp++; if (!qp) { j=i; do uel(r,--j)++; while (j && !r[j]); }
816 0 : j = lr-i-(lr-i>=ly); r1[j] = subll(r1[j],y[j]);
817 0 : for (j--; j>1; j--) r1[j] = subllx(r1[j],y[j]);
818 0 : uel(r1,1) -= overflow;
819 : }
820 : }
821 : }
822 133431157 : *++r1 = qp;
823 : }
824 : /* i = lr-1 */
825 : /* round correctly */
826 39291345 : if (uel(r1,1) > (y0>>1))
827 : {
828 19812433 : j=i; do uel(r,--j)++; while (j && !r[j]);
829 : }
830 133645544 : r1 = r-1; for (j=i; j>=2; j--) r[j]=r1[j];
831 39291345 : if (r[0] == 0) e--;
832 14172383 : else if (r[0] == 1) { shift_right(r,r, 2,lr, 1,1); }
833 : else { /* possible only when rounding up to 0x2 0x0 ... */
834 18 : r[2] = (long)HIGHBIT; e++;
835 : }
836 39290310 : r[0] = evaltyp(t_REAL)|evallg(lr);
837 39343341 : r[1] = evalsigne(sx) | evalexpo(e);
838 39334425 : return r;
839 : }
840 :
841 : /* Integer division x / y: such that sign(r) = sign(x)
842 : * if z = ONLY_REM return remainder, otherwise return quotient
843 : * if z != NULL set *z to remainder
844 : * *z is the last object on stack (and thus can be disposed of with cgiv
845 : * instead of gerepile)
846 : * If *z is zero, we put gen_0 here and no copy.
847 : * space needed: lx + ly
848 : */
849 : GEN
850 1907536215 : dvmdii(GEN x, GEN y, GEN *z)
851 : {
852 1907536215 : long sx=signe(x),sy=signe(y);
853 : long lx, ly, lq;
854 : pari_sp av;
855 : GEN r,q;
856 :
857 1907536215 : if (!sy) pari_err_INV("dvmdii",y);
858 1908598906 : if (!sx)
859 : {
860 67787498 : if (!z || z == ONLY_REM) return gen_0;
861 40548761 : *z=gen_0; return gen_0;
862 : }
863 1840811408 : lx=lgefint(x);
864 1840811408 : ly=lgefint(y); lq=lx-ly;
865 1840811408 : if (lq <= 0)
866 : {
867 1162118379 : if (lq == 0)
868 : {
869 1054307398 : long s=mpn_cmp(LIMBS(x),LIMBS(y),NLIMBS(x));
870 1054307398 : if (s>0) goto DIVIDE;
871 361230389 : if (s==0)
872 : {
873 30555412 : if (z == ONLY_REM) return gen_0;
874 20005911 : if (z) *z = gen_0;
875 20005911 : if (sx < 0) sy = -sy;
876 20005911 : return stoi(sy);
877 : }
878 : }
879 438485958 : if (z == ONLY_REM) return icopy(x);
880 12381967 : if (z) *z = icopy(x);
881 12381967 : return gen_0;
882 : }
883 678693029 : DIVIDE: /* quotient is nonzero */
884 1371770038 : av=avma; if (sx<0) sy = -sy;
885 1371770038 : if (ly==3)
886 : {
887 574168788 : ulong lq = lx;
888 : ulong si;
889 574168788 : q = cgeti(lq);
890 573791738 : si = mpn_divrem_1(LIMBS(q), 0, LIMBS(x), NLIMBS(x), y[2]);
891 574337593 : if (q[lq - 1] == 0) lq--;
892 574337593 : if (z == ONLY_REM)
893 : {
894 338803487 : if (!si) return gc_const(av, gen_0);
895 293090484 : set_avma(av); r = cgeti(3);
896 292608611 : r[1] = evalsigne(sx) | evallgefint(3);
897 292608611 : r[2] = si; return r;
898 : }
899 235534106 : q[1] = evalsigne(sy) | evallgefint(lq);
900 235534106 : if (!z) return q;
901 231440803 : if (!si) { *z=gen_0; return q; }
902 59989702 : r=cgeti(3);
903 60014714 : r[1] = evalsigne(sx) | evallgefint(3);
904 60014714 : r[2] = si; *z=r; return q;
905 : }
906 797601250 : if (z == ONLY_REM)
907 : {
908 775183595 : ulong lr = lgefint(y);
909 775183595 : ulong lq = lgefint(x)-lgefint(y)+3;
910 775183595 : GEN r = cgeti(lr);
911 769213687 : GEN q = cgeti(lq);
912 762789674 : mpn_tdiv_qr(LIMBS(q), LIMBS(r),0, LIMBS(x), NLIMBS(x), LIMBS(y), NLIMBS(y));
913 776378563 : if (!r[lr - 1])
914 : {
915 806606434 : while(lr>2 && !r[lr - 1]) lr--;
916 358715202 : if (lr == 2) return gc_const(av, gen_0); /* exact division */
917 : }
918 761640993 : r[1] = evalsigne(sx) | evallgefint(lr);
919 761640993 : return gc_const((pari_sp)r, r);
920 : }
921 : else
922 : {
923 22417655 : ulong lq = lgefint(x)-lgefint(y)+3;
924 22417655 : ulong lr = lgefint(y);
925 22417655 : GEN q = cgeti(lq);
926 27588767 : GEN r = cgeti(lr);
927 27575203 : mpn_tdiv_qr(LIMBS(q), LIMBS(r),0, LIMBS(x), NLIMBS(x), LIMBS(y), NLIMBS(y));
928 27601992 : if (q[lq - 1] == 0) lq--;
929 27601992 : q[1] = evalsigne(sy) | evallgefint(lq);
930 27601992 : if (!z) return gc_const((pari_sp)q, q);
931 23905029 : if (!r[lr - 1])
932 : {
933 36759334 : while(lr>2 && !r[lr - 1]) lr--;
934 6135755 : if (lr == 2) { *z = gen_0; return gc_const((pari_sp)q, q); } /* exact */
935 : }
936 19295843 : r[1] = evalsigne(sx) | evallgefint(lr);
937 19295843 : *z = gc_const((pari_sp)r, r); return q;
938 : }
939 : }
940 :
941 : /* Montgomery reduction.
942 : * N has k words, assume T >= 0 has less than 2k.
943 : * Return res := T / B^k mod N, where B = 2^BIL
944 : * such that 0 <= res < T/B^k + N and res has less than k words */
945 : GEN
946 36670820 : red_montgomery(GEN T, GEN N, ulong inv)
947 : {
948 : pari_sp av;
949 : GEN Te, Td, Ne, Nd, scratch;
950 36670820 : ulong i, j, m, t, d, k = NLIMBS(N);
951 : int carry;
952 : LOCAL_HIREMAINDER;
953 : LOCAL_OVERFLOW;
954 :
955 36670820 : if (k == 0) return gen_0;
956 36670820 : d = NLIMBS(T); /* <= 2*k */
957 36670820 : if (d == 0) return gen_0;
958 : #ifdef DEBUG
959 : if (d > 2*k) pari_err_BUG("red_montgomery");
960 : #endif
961 36670811 : if (k == 1)
962 : { /* as below, special cased for efficiency */
963 163341 : ulong n = uel(N,2);
964 163341 : if (d == 1) {
965 163194 : hiremainder = uel(T,2);
966 163194 : m = hiremainder * inv;
967 163194 : (void)addmul(m, n); /* t + m*n = 0 */
968 163194 : return utoi(hiremainder);
969 : } else { /* d = 2 */
970 147 : hiremainder = uel(T,2);
971 147 : m = hiremainder * inv;
972 147 : (void)addmul(m, n); /* t + m*n = 0 */
973 147 : t = addll(hiremainder, uel(T,3));
974 147 : if (overflow) t -= n; /* t > n doesn't fit in 1 word */
975 147 : return utoi(t);
976 : }
977 : }
978 : /* assume k >= 2 */
979 36507470 : av = avma; scratch = new_chunk(k<<1); /* >= k + 2: result fits */
980 :
981 : /* copy T to scratch space (pad with zeroes to 2k words) */
982 36092826 : Td = scratch;
983 36092826 : Te = T + 2;
984 516902027 : for (i=0; i < d ; i++) *Td++ = *Te++;
985 64210343 : for ( ; i < (k<<1); i++) *Td++ = 0;
986 :
987 36092826 : Te = scratch - 1; /* 1 beyond end of current T mantissa (in scratch) */
988 36092826 : Ne = N + 1; /* 1 beyond end of N mantissa */
989 :
990 36092826 : carry = 0;
991 275667334 : for (i=0; i<k; i++) /* set T := T/B nod N, k times */
992 : {
993 239574508 : Td = Te; /* one beyond end of (new) T mantissa */
994 239574508 : Nd = Ne;
995 239574508 : hiremainder = *++Td;
996 239574508 : m = hiremainder * inv; /* solve T + m N = O(B) */
997 :
998 : /* set T := (T + mN) / B */
999 239574508 : Te = Td;
1000 239574508 : (void)addmul(m, *++Nd); /* = 0 */
1001 2123027304 : for (j=1; j<k; j++)
1002 : {
1003 1883452796 : t = addll(addmul(m, *++Nd), *++Td);
1004 1883452796 : *Td = t;
1005 1883452796 : hiremainder += overflow;
1006 : }
1007 239574508 : t = addll(hiremainder, *++Td); *Td = t + carry;
1008 239574508 : carry = (overflow || (carry && *Td == 0));
1009 : }
1010 36092826 : if (carry)
1011 : { /* Td > N overflows (k+1 words), set Td := Td - N */
1012 57139 : GEN NE = N + k+1;
1013 57139 : Td = Te;
1014 57139 : Nd = Ne;
1015 57139 : t = subll(*++Td, *++Nd); *Td = t;
1016 516702 : while (Nd < NE) { t = subllx(*++Td, *++Nd); *Td = t; }
1017 : }
1018 :
1019 : /* copy result */
1020 36092826 : Td = (GEN)av - 1; /* *Td = high word of final result */
1021 39585662 : while (*Td == 0 && Te < Td) Td--; /* strip leading 0s */
1022 36092826 : k = Td - Te; if (!k) return gc_const(av, gen_0);
1023 36092826 : Td = (GEN)av - k; /* will write mantissa there */
1024 36092826 : (void)memmove(Td, Te+1, k*sizeof(long));
1025 36092826 : Td -= 2;
1026 36092826 : Td[0] = evaltyp(t_INT) | evallg(k+2);
1027 36469537 : Td[1] = evalsigne(1) | evallgefint(k+2);
1028 : #ifdef DEBUG
1029 : {
1030 : long l = NLIMBS(N), s = BITS_IN_LONG*l;
1031 : GEN R = int2n(s);
1032 : GEN res = remii(mulii(T, Fp_inv(R, N)), N);
1033 : if (k > lgefint(N)
1034 : || !equalii(remii(Td,N),res)
1035 : || cmpii(Td, addii(shifti(T, -s), N)) >= 0) pari_err_BUG("red_montgomery");
1036 : }
1037 : #endif
1038 36469537 : return gc_const((pari_sp)Td, Td);
1039 : }
1040 :
1041 : /* EXACT INTEGER DIVISION */
1042 :
1043 : /* use undocumented GMP interface */
1044 : static void
1045 114838497 : GEN2mpz(mpz_t X, GEN x)
1046 : {
1047 114838497 : long l = lgefint(x)-2;
1048 114838497 : X->_mp_alloc = l;
1049 114838497 : X->_mp_size = signe(x) > 0? l: -l;
1050 114838497 : X->_mp_d = LIMBS(x);
1051 114838497 : }
1052 : static void
1053 57420597 : mpz2GEN(GEN z, mpz_t Z)
1054 : {
1055 57420597 : long l = Z->_mp_size;
1056 57420597 : z[1] = evalsigne(l > 0? 1: -1) | evallgefint(labs(l)+2);
1057 57420597 : }
1058 :
1059 : #ifdef mpn_divexact_1
1060 : static GEN
1061 389269271 : diviuexact_i(GEN x, ulong y)
1062 : {
1063 389269271 : long l = lgefint(x);
1064 389269271 : GEN z = cgeti(l);
1065 388821070 : mpn_divexact_1(LIMBS(z), LIMBS(x), NLIMBS(x), y);
1066 388880365 : if (z[l-1] == 0) l--;
1067 388880365 : z[1] = evallgefint(l) | evalsigne(signe(x));
1068 388880365 : return z;
1069 : }
1070 : #elif 1 && !defined(_WIN64) /* mpz_divexact_ui is not LLP64 friendly */
1071 : /* assume y != 0 and the division is exact */
1072 : static GEN
1073 : diviuexact_i(GEN x, ulong y)
1074 : {
1075 : long l = lgefint(x);
1076 : GEN z = cgeti(l);
1077 : mpz_t X, Z;
1078 : GEN2mpz(X, x);
1079 : Z->_mp_alloc = l-2;
1080 : Z->_mp_size = l-2;
1081 : Z->_mp_d = LIMBS(z);
1082 : mpz_divexact_ui(Z, X, y);
1083 : mpz2GEN(z, Z); return z;
1084 : }
1085 : #else
1086 : /* assume y != 0 and the division is exact */
1087 : static GEN
1088 : diviuexact_i(GEN x, ulong y)
1089 : {
1090 : /*TODO: implement true exact division.*/
1091 : return divii(x,utoi(y));
1092 : }
1093 : #endif
1094 :
1095 : GEN
1096 31142405 : diviuexact(GEN x, ulong y)
1097 : {
1098 : GEN z;
1099 31142405 : if (!signe(x)) return gen_0;
1100 30013829 : z = diviuexact_i(x, y);
1101 30011762 : if (lgefint(z) == 2) pari_err_OP("exact division", x, utoi(y));
1102 30011840 : return z;
1103 : }
1104 :
1105 : /* Find z such that x=y*z, knowing that y | x (unchecked) */
1106 : GEN
1107 505888712 : diviiexact(GEN x, GEN y)
1108 : {
1109 : GEN z;
1110 505888712 : if (!signe(y)) pari_err_INV("diviiexact",y);
1111 506054113 : if (!signe(x)) return gen_0;
1112 416859698 : if (lgefint(y) == 3)
1113 : {
1114 359459237 : z = diviuexact_i(x, y[2]);
1115 359075723 : if (signe(y) < 0) togglesign(z);
1116 : }
1117 : else
1118 : {
1119 57400461 : long l = lgefint(x);
1120 : mpz_t X, Y, Z;
1121 57400461 : z = cgeti(l);
1122 57419467 : GEN2mpz(X, x);
1123 57419395 : GEN2mpz(Y, y);
1124 57419209 : Z->_mp_alloc = l-2;
1125 57419209 : Z->_mp_size = l-2;
1126 57419209 : Z->_mp_d = LIMBS(z);
1127 57419209 : mpz_divexact(Z, X, Y);
1128 57420619 : mpz2GEN(z, Z);
1129 : }
1130 416496307 : if (lgefint(z) == 2) pari_err_OP("exact division", x, y);
1131 416480755 : return z;
1132 : }
1133 :
1134 : /* assume yz != and yz | x */
1135 : GEN
1136 199482 : diviuuexact(GEN x, ulong y, ulong z)
1137 : {
1138 : long tmp[4];
1139 : ulong t;
1140 : LOCAL_HIREMAINDER;
1141 199482 : t = mulll(y, z);
1142 199482 : if (!hiremainder) return diviuexact(x, t);
1143 0 : tmp[0] = evaltyp(t_INT)|_evallg(4);
1144 0 : tmp[1] = evalsigne(1)|evallgefint(4);
1145 0 : tmp[2] = t;
1146 0 : tmp[3] = hiremainder;
1147 0 : return diviiexact(x, tmp);
1148 : }
1149 :
1150 : /********************************************************************/
1151 : /** **/
1152 : /** INTEGER MULTIPLICATION **/
1153 : /** **/
1154 : /********************************************************************/
1155 :
1156 : /* nx >= ny = num. of digits of x, y (not GEN, see mulii) */
1157 : GEN
1158 5791587226 : muliispec(GEN x, GEN y, long nx, long ny)
1159 : {
1160 : GEN zd;
1161 : long lz;
1162 : ulong hi;
1163 :
1164 5791587226 : if (nx < ny) swapspec(x,y, nx,ny);
1165 5791587226 : if (!ny) return gen_0;
1166 5791587226 : if (ny == 1) return muluispec((ulong)*y, x, nx);
1167 :
1168 1030615468 : lz = nx+ny+2;
1169 1030615468 : zd = cgeti(lz);
1170 1033730991 : hi = mpn_mul(LIMBS(zd), (mp_limb_t *)x, nx, (mp_limb_t *)y, ny);
1171 1040970484 : if (!hi) lz--;
1172 : /*else zd[lz-1]=hi; GH tell me it is not necessary.*/
1173 :
1174 1040970484 : zd[1] = evalsigne(1) | evallgefint(lz);
1175 1040970484 : return zd;
1176 : }
1177 : GEN
1178 221694 : muluui(ulong x, ulong y, GEN z)
1179 : {
1180 221694 : long t, s = signe(z);
1181 : GEN r;
1182 : LOCAL_HIREMAINDER;
1183 :
1184 221694 : if (!x || !y || !signe(z)) return gen_0;
1185 221310 : t = mulll(x,y);
1186 221310 : if (!hiremainder)
1187 221325 : r = muluispec(t, z+2, lgefint(z)-2);
1188 : else
1189 : {
1190 : long tmp[2];
1191 0 : tmp[1] = hiremainder;
1192 0 : tmp[0] = t;
1193 0 : r = muliispec(z+2,tmp, lgefint(z)-2, 2);
1194 : }
1195 221315 : setsigne(r,s); return r;
1196 : }
1197 :
1198 : GEN
1199 987788637 : sqrispec(GEN x, long nx)
1200 : {
1201 : GEN zd;
1202 : long lz;
1203 :
1204 987788637 : if (!nx) return gen_0;
1205 479588030 : if (nx==1) return sqru(*x);
1206 :
1207 274591248 : lz = (nx<<1)+2;
1208 274591248 : zd = cgeti(lz);
1209 : #ifdef mpn_sqr
1210 271435510 : mpn_sqr(LIMBS(zd), (mp_limb_t *)x, nx);
1211 : #else
1212 : mpn_mul_n(LIMBS(zd), (mp_limb_t *)x, (mp_limb_t *)x, nx);
1213 : #endif
1214 274808446 : if (zd[lz-1]==0) lz--;
1215 :
1216 274808446 : zd[1] = evalsigne(1) | evallgefint(lz);
1217 274808446 : return zd;
1218 : }
1219 :
1220 : INLINE GEN
1221 41360460 : sqrispec_mirror(GEN x, long nx)
1222 : {
1223 41360460 : GEN cx=new_chunk(nx);
1224 : GEN z;
1225 41316933 : xmpn_mirrorcopy((mp_limb_t *)cx,(mp_limb_t *)x,nx);
1226 41420066 : z=sqrispec(cx, nx);
1227 41492350 : xmpn_mirror(LIMBS(z), NLIMBS(z));
1228 41488466 : return z;
1229 : }
1230 :
1231 : /* leaves garbage on the stack. */
1232 : INLINE GEN
1233 83827767 : muliispec_mirror(GEN x, GEN y, long nx, long ny)
1234 : {
1235 : GEN cx, cy, z;
1236 83827767 : long s = 0;
1237 112878823 : while (nx && x[nx-1]==0) { nx--; s++; }
1238 118246221 : while (ny && y[ny-1]==0) { ny--; s++; }
1239 83827767 : cx=new_chunk(nx); cy=new_chunk(ny);
1240 83265945 : xmpn_mirrorcopy((mp_limb_t *)cx,(mp_limb_t *)x,nx);
1241 84101709 : xmpn_mirrorcopy((mp_limb_t *)cy,(mp_limb_t *)y,ny);
1242 84619816 : z = nx>=ny ? muliispec(cx, cy, nx, ny): muliispec(cy, cx, ny, nx);
1243 84725133 : if (s)
1244 : {
1245 7633846 : long i, lz = lgefint(z) + s;
1246 7633846 : (void)new_chunk(s);
1247 7633838 : z -= s;
1248 71103345 : for (i=0; i<s; i++) z[2+i]=0;
1249 7633838 : z[1] = evalsigne(1) | evallgefint(lz);
1250 7633838 : z[0] = evaltyp(t_INT) | evallg(lz);
1251 : }
1252 84725122 : xmpn_mirror(LIMBS(z), NLIMBS(z));
1253 85243844 : return z;
1254 : }
1255 :
1256 : /* x % (2^n), assuming n >= 0 */
1257 : GEN
1258 36046596 : remi2n(GEN x, long n)
1259 : {
1260 : ulong hi;
1261 36046596 : long l, k, lx, ly, sx = signe(x);
1262 : GEN z, xd, zd;
1263 :
1264 36046596 : if (!sx || !n) return gen_0;
1265 :
1266 35724989 : k = dvmdsBIL(n, &l);
1267 35735396 : lx = lgefint(x);
1268 35735396 : if (lx < k+3) return icopy(x);
1269 :
1270 34876755 : xd = x + (2 + k);
1271 : /* x = |k|...|1|#|... : copy the last l bits of # and the first k words
1272 : * ^--- initial xd */
1273 34876755 : hi = ((ulong)*xd) & ((1UL<<l)-1); /* last l bits of # = top bits of result */
1274 34876755 : if (!hi)
1275 : { /* strip leading zeroes from result */
1276 3174207 : xd--; while (k && !*xd) { k--; xd--; }
1277 2988518 : if (!k) return gen_0;
1278 2040720 : ly = k+2;
1279 : }
1280 : else
1281 31888237 : ly = k+3;
1282 :
1283 33928957 : zd = z = cgeti(ly);
1284 33888152 : *++zd = evalsigne(sx) | evallgefint(ly);
1285 499595539 : xd = x+1; for ( ;k; k--) *++zd = *++xd;
1286 33888152 : if (hi) *++zd = hi;
1287 33888152 : return z;
1288 : }
1289 :
1290 : /********************************************************************/
1291 : /** **/
1292 : /** INTEGER SQUARE ROOT **/
1293 : /** **/
1294 : /********************************************************************/
1295 :
1296 : /* Return S (and set R) s.t S^2 + R = N, 0 <= R <= 2S.
1297 : * As for dvmdii, R is last on stack and guaranteed to be gen_0 in case the
1298 : * remainder is 0. R = NULL is allowed. */
1299 : GEN
1300 5113219 : sqrtremi(GEN a, GEN *r)
1301 : {
1302 5113219 : long l, na = NLIMBS(a);
1303 : mp_size_t nr;
1304 : GEN S;
1305 5113219 : if (!na) {
1306 724 : if (r) *r = gen_0;
1307 724 : return gen_0;
1308 : }
1309 5112495 : l = (na + 5) >> 1; /* 2 + ceil(na/2) */
1310 5112495 : S = cgetipos(l);
1311 5112460 : if (r) {
1312 1309256 : GEN R = cgeti(2 + na);
1313 1309255 : nr = mpn_sqrtrem(LIMBS(S), LIMBS(R), LIMBS(a), na);
1314 1309256 : if (nr) R[1] = evalsigne(1) | evallgefint(nr+2);
1315 25627 : else { set_avma((pari_sp)S); R = gen_0; }
1316 1309256 : *r = R;
1317 : }
1318 : else
1319 3803204 : (void)mpn_sqrtrem(LIMBS(S), NULL, LIMBS(a), na);
1320 5112466 : return S;
1321 : }
1322 :
1323 : /* compute sqrt(|a|), assuming a != 0 */
1324 : GEN
1325 125137835 : sqrtr_abs(GEN a)
1326 : {
1327 : GEN res;
1328 : mp_limb_t *b, *c;
1329 125137835 : long l = RNLIMBS(a), e = expo(a), er = e>>1;
1330 : long n;
1331 125137835 : res = cgetg(2 + l, t_REAL);
1332 125052193 : res[1] = evalsigne(1) | evalexpo(er);
1333 125131897 : if (e&1)
1334 : {
1335 52559257 : b = (mp_limb_t *) new_chunk(l<<1);
1336 52543515 : xmpn_zero(b,l);
1337 52544355 : xmpn_mirrorcopy(b+l, RLIMBS(a), l);
1338 52556897 : c = (mp_limb_t *) new_chunk(l);
1339 52550230 : n = mpn_sqrtrem(c,b,b,l<<1); /* c <- sqrt; b <- rem */
1340 52587893 : if (n>l || (n==l && mpn_cmp(b,c,l) > 0)) mpn_add_1(c,c,l,1);
1341 : }
1342 : else
1343 : {
1344 : ulong u;
1345 72572640 : b = (mp_limb_t *) mantissa2nr(a,-1);
1346 72608249 : b[1] = uel(a,l+1)<<(BITS_IN_LONG-1);
1347 72608249 : b = (mp_limb_t *) new_chunk(l);
1348 72584999 : xmpn_zero(b,l+1); /* overwrites the former b[0] */
1349 72588013 : c = (mp_limb_t *) new_chunk(l + 1);
1350 72550959 : n = mpn_sqrtrem(c,b,b,(l<<1)+2); /* c <- sqrt; b <- rem */
1351 72649889 : u = (ulong)*c++;
1352 72649889 : if ( u&HIGHBIT || (u == ~HIGHBIT &&
1353 0 : (n>l || (n==l && mpn_cmp(b,c,l)>0))))
1354 35796346 : mpn_add_1(c,c,l,1);
1355 : }
1356 125247694 : xmpn_mirrorcopy(RLIMBS(res),c,l);
1357 125217984 : return gc_const((pari_sp)res, res);
1358 : }
1359 :
1360 : /* Normalize a nonnegative integer */
1361 : GEN
1362 303349989 : int_normalize(GEN x, long known_zero_words)
1363 : {
1364 303349989 : long i = lgefint(x) - 1 - known_zero_words;
1365 2199513278 : for ( ; i > 1; i--)
1366 2149255859 : if (x[i]) { setlgefint(x, i+1); return x; }
1367 50257419 : x[1] = evalsigne(0) | evallgefint(2); return x;
1368 : }
1369 :
1370 : /********************************************************************
1371 : ** **
1372 : ** Base Conversion **
1373 : ** **
1374 : ********************************************************************/
1375 :
1376 : ulong *
1377 437049 : convi(GEN x, long *l)
1378 : {
1379 437049 : long n = nchar2nlong(2 + (long)(NLIMBS(x) * (BITS_IN_LONG * LOG10_2)));
1380 437049 : GEN str = cgetg(n+1, t_VECSMALL);
1381 437049 : unsigned char *res = (unsigned char*) GSTR(str);
1382 437049 : long llz = mpn_get_str(res, 10, LIMBS(icopy(x)), NLIMBS(x));
1383 : long lz;
1384 : ulong *z;
1385 : long i, j;
1386 : unsigned char *t;
1387 437049 : while (!*res) {res++; llz--;} /*Strip leading zeros*/
1388 437049 : lz = (8+llz)/9;
1389 437049 : z = (ulong*)new_chunk(1+lz);
1390 437049 : t=res+llz+9;
1391 866771 : for(i=0;i<llz-8;i+=9)
1392 : {
1393 : ulong s;
1394 429722 : t-=18;
1395 429722 : s=*t++;
1396 3867498 : for (j=1; j<9;j++)
1397 3437776 : s=10*s+*t++;
1398 429722 : *z++=s;
1399 : }
1400 437049 : if (i<llz)
1401 : {
1402 433094 : unsigned char *t = res;
1403 433094 : ulong s=*t++;
1404 1225007 : for (j=i+1; j<llz;j++)
1405 791913 : s=10*s+*t++;
1406 433094 : *z++=s;
1407 : }
1408 437049 : *l = lz;
1409 437049 : return z;
1410 : }
|