Code coverage tests

This page documents the degree to which the PARI/GP source code is tested by our public test suite, distributed with the source distribution in directory src/test/. This is measured by the gcov utility; we then process gcov output using the lcov frond-end.

We test a few variants depending on Configure flags on the pari.math.u-bordeaux.fr machine (x86_64 architecture), and agregate them in the final report:

with GMP kernel
with GMP kernel using --mt=pthread
with native kernel, including micro-assembler code
with native kernel, without micro-assembler
with native kernel, without micro-assembler, disabling GCC extensions (DISABLE_INLINE)
with GMP kernel, emulating an x86_32 architecture at Configure time via setarch

The target is to exceed 90% coverage for all mathematical modules (given that branches depending on DEBUGLEVEL or DEBUGMEM are not covered). This script is run to produce the results below.

LCOV - code coverage report

Current view:	top level - basemath - lll.c (source / functions)		Hit	Total	Coverage
Test:	PARI/GP v2.18.1 lcov report (development 30674-be81ecfdd4)	Lines:	1336	1642	81.4 %
Date:	2026-02-12 09:23:52	Functions:	125	130	96.2 %
Legend:	Lines: hit not hit

          Line data    Source code

       1             : /* Copyright (C) 2008  The PARI group.
       2             : 
       3             : This file is part of the PARI/GP package.
       4             : 
       5             : PARI/GP is free software; you can redistribute it and/or modify it under the
       6             : terms of the GNU General Public License as published by the Free Software
       7             : Foundation; either version 2 of the License, or (at your option) any later
       8             : version. It is distributed in the hope that it will be useful, but WITHOUT
       9             : ANY WARRANTY WHATSOEVER.
      10             : 
      11             : Check the License for details. You should have received a copy of it, along
      12             : with the package; see the file 'COPYING'. If not, write to the Free Software
      13             : Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA. */
      14             : 
      15             : #include "pari.h"
      16             : #include "paripriv.h"
      17             : 
      18             : #define DEBUGLEVEL DEBUGLEVEL_qflll
      19             : 
      20             : static int
      21       45828 : RgM_is_square_mat(GEN x) { long l = lg(x); return l == 1 || l == lgcols(x); }
      22             : 
      23             : static long
      24     4236130 : ZM_is_upper(GEN R)
      25             : {
      26     4236130 :   long i,j, l = lg(R);
      27     4236130 :   if (l != lgcols(R)) return 0;
      28     8184417 :   for(i = 1; i < l; i++)
      29     8831690 :     for(j = 1; j < i; j++)
      30     4534215 :       if (signe(gcoeff(R,i,j))) return 0;
      31      264594 :   return 1;
      32             : }
      33             : 
      34             : static long
      35      606299 : ZM_is_knapsack(GEN R)
      36             : {
      37      606299 :   long i,j, l = lg(R);
      38      606299 :   if (l != lgcols(R)) return 0;
      39      843656 :   for(i = 2; i < l; i++)
      40     2902180 :     for(j = 1; j < l; j++)
      41     2664823 :       if ( i!=j && signe(gcoeff(R,i,j))) return 0;
      42       92384 :   return 1;
      43             : }
      44             : 
      45             : static long
      46     1205060 : ZM_is_lower(GEN R)
      47             : {
      48     1205060 :   long i,j, l = lg(R);
      49     1205060 :   if (l != lgcols(R)) return 0;
      50     2089649 :   for(i = 1; i < l; i++)
      51     2414749 :     for(j = 1; j < i; j++)
      52     1307316 :       if (signe(gcoeff(R,j,i))) return 0;
      53       34918 :   return 1;
      54             : }
      55             : 
      56             : static GEN
      57       34918 : RgM_flip(GEN R)
      58             : {
      59             :   GEN M;
      60             :   long i,j,l;
      61       34918 :   M = cgetg_copy(R, &l);
      62      181392 :   for(i = 1; i < l; i++)
      63             :   {
      64      146474 :     gel(M,i) = cgetg(l, t_COL);
      65      910682 :     for(j = 1; j < l; j++)
      66      764208 :       gmael(M,i,j) = gmael(R,l-i, l-j);
      67             :   }
      68       34918 :   return M;
      69             : }
      70             : 
      71             : static GEN
      72           0 : RgM_flop(GEN R)
      73             : {
      74             :   GEN M;
      75             :   long i,j,l;
      76           0 :   M = cgetg_copy(R, &l);
      77           0 :   for(i = 1; i < l; i++)
      78             :   {
      79           0 :     gel(M,i) = cgetg(l, t_COL);
      80           0 :     for(j = 1; j < l; j++)
      81           0 :       gmael(M,i,j) = gmael(R,i, l-j);
      82             :   }
      83           0 :   return M;
      84             : }
      85             : 
      86             : /* Assume x and y has same type! */
      87             : INLINE int
      88     4095949 : mpabscmp(GEN x, GEN y)
      89             : {
      90     4095949 :   return (typ(x)==t_INT) ? abscmpii(x,y) : abscmprr(x,y);
      91             : }
      92             : 
      93             : /****************************************************************************/
      94             : /***                             FLATTER                                  ***/
      95             : /****************************************************************************/
      96             : /* Implementation of "FLATTER" algorithm based on
      97             :  * <https://eprint.iacr.org/2023/237>
      98             :  * Fast Practical Lattice Reduction through Iterated Compression
      99             :  *
     100             :  * Keegan Ryan, University of California, San Diego
     101             :  * Nadia Heninger, University of California, San Diego. BA20230925 */
     102             : static long
     103     1346958 : drop(GEN R)
     104             : {
     105     1346958 :   long i, n = lg(R)-1;
     106     1346958 :   long s = 0, m = mpexpo(gcoeff(R, 1, 1));
     107     5442907 :   for (i = 2; i <= n; ++i)
     108             :   {
     109     4095949 :     if (mpabscmp(gcoeff(R, i, i), gcoeff(R, i - 1, i - 1)) >= 0)
     110             :     {
     111     2781303 :       s += m - mpexpo(gcoeff(R, i - 1, i - 1));
     112     2781303 :       m = mpexpo(gcoeff(R, i, i));
     113             :     }
     114             :   }
     115     1346958 :   s += m - mpexpo(gcoeff(R, n, n));
     116     1346958 :   return s;
     117             : }
     118             : 
     119             : static long
     120     1346959 : potential(GEN R)
     121             : {
     122     1346959 :   long i, n = lg(R)-1;
     123     1346959 :   long s = 0, mul = n-1;;
     124     6789864 :   for (i = 1; i <= n; i++, mul-=2) s += mul * mpexpo(gcoeff(R,i,i));
     125     1346959 :   return s;
     126             : }
     127             : 
     128             : /* U upper-triangular invertible:
     129             :  * Bound on the exponent of the condition number of U.
     130             :  * Algo 8.13 in Higham, Accuracy and stability of numercal algorithms. */
     131             : static long
     132     4727335 : condition_bound(GEN U, int lower)
     133             : {
     134     4727335 :   long n = lg(U)-1, e, i, j;
     135             :   GEN y;
     136     4727335 :   pari_sp av = avma;
     137     4727335 :   y = cgetg(n+1, t_VECSMALL);
     138     4727335 :   e = y[n] = -gexpo(gcoeff(U,n,n));
     139    18788260 :   for (i=n-1; i>0; i--)
     140             :   {
     141    14060924 :     long s = 0;
     142    49918731 :     for (j=i+1; j<=n; j++)
     143    35857806 :       s = maxss(s, (lower? gexpo(gcoeff(U,j,i)): gexpo(gcoeff(U,i,j))) + y[j]);
     144    14060925 :     y[i] = s - gexpo(gcoeff(U,i,i));
     145    14060928 :     e = maxss(e, y[i]);
     146             :   }
     147     4727336 :   return gc_long(av, gexpo(U) + e);
     148             : }
     149             : 
     150             : static long
     151     5195085 : gsisinv(GEN M)
     152             : {
     153     5195085 :   long i, l = lg(M);
     154    26135989 :   for (i = 1; i < l; ++i)
     155    20941312 :     if (! signe(gmael(M, i, i))) return 0;
     156     5194677 :   return 1;
     157             : }
     158             : 
     159             : INLINE long
     160     7491984 : nbits2prec64(long n)
     161             : {
     162     7491984 :   return nbits2prec(((n+63)>>6)<<6);
     163             : }
     164             : 
     165             : static long
     166     5852282 : spread(GEN R)
     167             : {
     168     5852282 :   long i, n = lg(R)-1, m = mpexpo(gcoeff(R, 1, 1)), M = m;
     169    23548745 :   for (i = 2; i <= n; ++i)
     170             :   {
     171    17696465 :     long e = mpexpo(gcoeff(R, i, i));
     172    17696463 :     if (e < m) m = e;
     173    17696463 :     if (e > M) M = e;
     174             :   }
     175     5852280 :   return M - m;
     176             : }
     177             : 
     178             : static long
     179     4727335 : GS_extraprec(GEN L, int lower)
     180             : {
     181     4727335 :   long C = condition_bound(L, lower), S = spread(L), n = lg(L)-1;
     182     4727338 :   return maxss(2*S+2*n, C-S-2*n); /* = 2*S + 2*n + maxss(0, C-3*S-4*n) */
     183             : }
     184             : 
     185             : static GEN
     186        2967 : RgM_Cholesky_dynprec(GEN M)
     187             : {
     188        2967 :   pari_sp ltop = avma;
     189             :   GEN L;
     190        2967 :   long minprec = lg(M) + 30, bitprec = minprec, prec;
     191             :   while (1)
     192        4877 :   {
     193             :     long mbitprec;
     194        7844 :     prec = nbits2prec64(bitprec);
     195        7844 :     L = RgM_Cholesky(RgM_gtofp(M, prec), prec); /* upper-triangular */
     196        7844 :     if (!L)
     197             :     {
     198        1458 :       bitprec *= 2;
     199        1458 :       set_avma(ltop);
     200        1458 :       continue;
     201             :     }
     202        6386 :     mbitprec = minprec + GS_extraprec(L, 0);
     203        6386 :     if (bitprec >= mbitprec)
     204        2967 :       break;
     205        3419 :     bitprec = maxss((4*bitprec)/3, mbitprec);
     206        3419 :     set_avma(ltop);
     207             :   }
     208        2967 :   return gc_GEN(ltop, L);
     209             : }
     210             : 
     211             : static GEN
     212        1336 : gramschmidt_upper(GEN M)
     213             : {
     214        1336 :   long bitprec = lg(M)-1 + 31 + GS_extraprec(M, 0);
     215        1336 :   return RgM_gtofp(M, nbits2prec64(bitprec));
     216             : }
     217             : 
     218             : static GEN
     219     2693917 : gramschmidt_dynprec(GEN M)
     220             : {
     221     2693917 :   pari_sp ltop = avma;
     222     2693917 :   long minprec = lg(M) + 30, bitprec = minprec;
     223     2693917 :   if (ZM_is_upper(M)) return gramschmidt_upper(M);
     224             :   while (1)
     225     3646905 :   {
     226             :     GEN B, Q, L;
     227     6339485 :     long prec = nbits2prec64(bitprec), mbitprec;
     228     6339482 :     if (!QR_init(RgM_gtofp(M, prec), &B, &Q, &L, prec) || !gsisinv(L))
     229             :     {
     230     1619866 :       bitprec *= 2;
     231     1619866 :       set_avma(ltop);
     232     1619872 :       continue;
     233             :     }
     234     4719613 :     mbitprec = minprec + GS_extraprec(L, 1);
     235     4719616 :     if (bitprec >= mbitprec)
     236     2692583 :       return gc_GEN(ltop, shallowtrans(L));
     237     2027033 :     bitprec = maxss((4*bitprec)/3, mbitprec);
     238     2027033 :     set_avma(ltop);
     239             :   }
     240             : }
     241             : /* return -T1 * round(T1^-1*(R1^-1*R2)*T3) */
     242             : static GEN
     243     1346960 : sizered(GEN T1, GEN T3, GEN R1, GEN R2)
     244             : {
     245     1346960 :   pari_sp ltop = avma;
     246             :   long e;
     247     1346960 :   return gc_upto(ltop, ZM_mul(ZM_neg(T1), grndtoi(gmul(ZM_inv(T1,NULL),
     248             :          RgM_mul(RgM_mul(RgM_inv_upper(R1), R2), T3)), &e)));
     249             : }
     250             : 
     251             : static GEN
     252     1346960 : flat(GEN M, long flag, GEN *pt_T, long *pt_s, long *pt_pot)
     253             : {
     254     1346960 :   pari_sp ltop = avma;
     255             :   GEN R, R1, R2, R3, T1, T2, T3, T, S;
     256     1346960 :   long k = lg(M)-1, n = k>>1, n2 = k - n, m = n>>1;
     257     1346960 :   long keepfirst = flag & LLL_KEEP_FIRST, inplace = flag & LLL_INPLACE;
     258             :   /* for k = 3, we want n = 1; n2  = 2; m = 0 */
     259             :   /* for k = 5,         n = 2; n2 = 3; m = 1 */
     260     1346960 :   R = gramschmidt_dynprec(M);
     261     1346959 :   R1 = matslice(R, 1, n, 1, n);
     262     1346958 :   R2 = matslice(R, 1, n, n + 1, k);
     263     1346959 :   R3 = matslice(R, n + 1, k, n + 1, k);
     264     1346960 :   T1 = lllfp(R1, 0.99, LLL_IM| LLL_UPPER| LLL_NOCERTIFY| (keepfirst ? LLL_KEEP_FIRST: 0));
     265     1346960 :   T3 = lllfp(R3, 0.99, LLL_IM| LLL_UPPER| LLL_NOCERTIFY);
     266     1346960 :   T2 = sizered(T1, T3, R1, R2);
     267     1346959 :   T = shallowmatconcat(mkmat22(T1,T2,gen_0,T3));
     268     1346960 :   M = ZM_mul(M, T);
     269     1346958 :   R = gramschmidt_dynprec(M);
     270     1346960 :   R3 = matslice(R, m + 1, m + n2, m + 1, m + n2);
     271     1346960 :   T3 = lllfp(R3, 0.99, LLL_IM| LLL_UPPER| LLL_NOCERTIFY);
     272     2693920 :   S = shallowmatconcat(diagonal(
     273      577277 :        m == 0     ? mkvec2(T3, matid(k - m - n2))
     274           0 :      : m+n2 == k  ? mkvec2(matid(m), T3)
     275      769683 :                   : mkvec3(matid(m), T3, matid(k - m - n2))));
     276     1346960 :   M = ZM_mul(M, S);
     277     1346959 :   if (!inplace) *pt_T = ZM_mul(T, S);
     278     1346958 :   *pt_s = drop(R);
     279     1346959 :   *pt_pot = potential(R);
     280     1346958 :   return gc_all(ltop, inplace ? 1: 2, &M, pt_T);
     281             : }
     282             : 
     283             : static void
     284           0 : dbg_flatter(pari_timer *ti, long n, long i, long lti, double t, double pot2)
     285             : {
     286           0 :   double s = t / n, p = pot2 / (n*(n+1));
     287             :   const char *str;
     288           0 :   if (i == -1)
     289           0 :     str = (i == lti)? "final"
     290           0 :                     : stack_sprintf("steps %ld-final", lti);
     291             :   else
     292           0 :     str = (i == lti)? stack_sprintf("step %ld", i)
     293           0 :                     : stack_sprintf("steps %ld-%ld", lti, i);
     294           0 :   timer_printf(ti, "FLATTER, dim %ld, %s: \t slope=%0.10g \t pot=%0.10g",
     295             :                n, str, s, p);
     296           0 : }
     297             : 
     298             : static GEN
     299      626806 : ZM_flatter(GEN M, long flag)
     300             : {
     301      626806 :   pari_sp av = avma;
     302      626806 :   long i, n = lg(M)-1, s = -1, lti = 1, pot = LONG_MAX;
     303      626806 :   GEN T = NULL;
     304             :   pari_timer ti;
     305      626806 :   long inplace = flag & LLL_INPLACE, cert = !(flag & LLL_NOCERTIFY);
     306             : 
     307      626806 :   if (DEBUGLEVEL>=3)
     308             :   {
     309           0 :     timer_start(&ti);
     310           0 :     if (cert) err_printf("FLATTER dim = %ld size = %ld\n", n, ZM_max_expi(M));
     311             :   }
     312      626806 :   for (i = 1;;i++)
     313      720154 :   {
     314             :     long t, pot2;
     315     1346960 :     GEN U, M2 = flat(M, flag, &U, &t, &pot2);
     316     1346960 :     if (t == 0) { s = t; break; }
     317      763667 :     if (s >= 0)
     318             :     {
     319      437551 :       if (s == t && pot>=pot2) break;
     320      394038 :       if (s < t && i > 20)
     321             :       {
     322           0 :         if (DEBUGLEVEL >= 3) err_printf("BACK:%ld:%ld:%g\n", n, i, s);
     323           0 :         break;
     324             :       }
     325             :     }
     326      720154 :     if (DEBUGLEVEL>=3 && (cert || timer_get(&ti) > 1000))
     327           0 :       dbg_flatter(&ti, n, i, lti, t, pot2);
     328      720154 :     s = t;
     329      720154 :     pot = pot2;
     330      720154 :     M = M2;
     331      720154 :     if (!inplace)
     332             :     {
     333      692522 :       T = T? ZM_mul(T, U): U;
     334      692522 :       if (gc_needed(av, 1)) (void)gc_all(av, 2, &M, &T);
     335             :     }
     336             :     else
     337       27632 :       if (gc_needed(av, 1)) M = gc_GEN(av, M);
     338             :   }
     339      626806 :   if (DEBUGLEVEL>=3 && (cert || timer_get(&ti) > 1000))
     340           0 :     dbg_flatter(&ti, n, -1, i == lti? -1: lti, s, pot);
     341      626806 :   if (!inplace)
     342             :   {
     343      612798 :     if (!T) return gc_NULL(av);
     344      312276 :     return gc_GEN(av, T);
     345             :   }
     346       14008 :   return  gc_GEN(av, M);
     347             : }
     348             : 
     349             : static GEN
     350      624792 : ZM_flatter_rank(GEN M, long rank, long flag)
     351             : {
     352             :   pari_timer ti;
     353      624792 :   pari_sp av = avma;
     354      624792 :   GEN T = NULL;
     355      624792 :   long i, n = lg(M)-1, sm = LONG_MAX;
     356      624792 :   long inplace = flag & LLL_INPLACE;
     357             : 
     358      624792 :   if (rank == n) return ZM_flatter(M, flag);
     359        3785 :   if (DEBUGLEVEL>=3) timer_start(&ti);
     360        3785 :   for (i = 1;; i++)
     361        2014 :   {
     362        5799 :     GEN S = ZM_flatter(vconcat(gshift(M,i),matid(n)), flag);
     363             :     long s;
     364        5799 :     if (!S || (s = expi(gnorml2(S))) >= sm) break;
     365        2014 :     sm = s;
     366        2014 :     if (DEBUGLEVEL>=3) timer_printf(&ti,"FLATTERRANK step %ld: %ld",i,sm);
     367        2014 :     T = T? ZM_mul(T, S): S;
     368        2014 :     M = ZM_mul(M, S);
     369        2014 :     if (gc_needed(av, 1)) (void)gc_all(av, 2, &M, &T);
     370             :   }
     371        3785 :   if (!inplace)
     372             :   {
     373        3778 :     if (!T) { set_avma(av); return matid(n); }
     374        1951 :     return gc_GEN(av, T);
     375             :   }
     376           7 :   return  gc_GEN(av, M);
     377             : }
     378             : 
     379             : static GEN
     380        2967 : flattergram_i(GEN M, long flag)
     381             : {
     382        2967 :   pari_sp av = avma;
     383        2967 :   GEN T, R = RgM_Cholesky_dynprec(M);
     384        2967 :   T = lllfp(R, 0.99, LLL_IM|LLL_UPPER|LLL_NOCERTIFY | (flag&LLL_KEEP_FIRST));
     385        2967 :   return gc_upto(av, T);
     386             : }
     387             : 
     388             : static void
     389           0 : dbg_flattergram(pari_timer *t, long n, long i, long s)
     390           0 : { timer_printf(t, "FLATTERGRAM, dim %ld step %ld, slope=%0.10g", n, i,
     391           0 :                ((double)s)/n); }
     392             : /* return base change, NULL if identity */
     393             : static GEN
     394         961 : ZM_flattergram(GEN M, long flag)
     395             : {
     396         961 :   pari_sp av = avma;
     397         961 :   GEN T = NULL;
     398         961 :   long i, n = lg(M)-1, s = -1;
     399             : 
     400             :   pari_timer ti;
     401         961 :   if (DEBUGLEVEL>=3)
     402             :   {
     403           0 :     timer_start(&ti);
     404           0 :     err_printf("FLATTERGRAM dim = %ld size = %ld\n", n, ZM_max_expi(M));
     405             :   }
     406         961 :   for (i = 1;; i++)
     407        2006 :   {
     408        2967 :     GEN S = flattergram_i(M, flag);
     409        2967 :     long t = expi(gnorml2(S));
     410        2967 :     if (t == 0) { s = t;  break; }
     411        2967 :     if (s)
     412             :     {
     413        2967 :       double st = s - t;
     414        2967 :       if (st == 0) break;
     415        2006 :       if (st < 0 && i > 20)
     416             :       {
     417           0 :         if (DEBUGLEVEL >= 3)
     418           0 :           err_printf("BACK:%ld:%ld:%0.10g\n", n, i, ((double)s)/n);
     419           0 :         break;
     420             :       }
     421             :     }
     422        2006 :     T = T? ZM_mul(T, S): S;
     423        2006 :     M = qf_ZM_apply(M, S);
     424        2006 :     s = t;
     425        2006 :     if (DEBUGLEVEL >= 3) dbg_flattergram(&ti, n, i, s);
     426        2006 :     if (gc_needed(av, 1)) (void)gc_all(av, 2, &M, &T);
     427             :   }
     428         961 :   if (DEBUGLEVEL >= 3) dbg_flattergram(&ti, n, i, s);
     429         961 :   if (!T && ZM_isidentity(T)) return gc_NULL(av);
     430         961 :   return gc_GEN(av, T);
     431             : }
     432             : 
     433             : /* return base change, NULL if identity */
     434             : static GEN
     435         961 : ZM_flattergram_rank(GEN M, long rank, long flag)
     436             : {
     437             :   pari_timer ti;
     438         961 :   pari_sp av = avma;
     439         961 :   GEN T = NULL;
     440         961 :   long i, n = lg(M)-1;
     441         961 :   if (rank == n) return ZM_flattergram(M, flag);
     442           0 :   if (DEBUGLEVEL>=3) timer_start(&ti);
     443           0 :   for (i = 1;; i++)
     444           0 :   {
     445           0 :     GEN S = ZM_flattergram(RgM_Rg_add(gshift(M, i), gen_1), flag);
     446           0 :     if (DEBUGLEVEL>=3)
     447           0 :       timer_printf(&ti,"FLATTERGRAMRANK step %ld: %ld",i,expi(gnorml2(S)));
     448           0 :     if (!S) break;
     449           0 :     T = T? ZM_mul(T, S): S;
     450           0 :     M = qf_ZM_apply(M, S);
     451           0 :     if (gc_needed(av, 1)) (void)gc_all(av, 2, &M, &T);
     452             :   }
     453           0 :   if (!T || ZM_isidentity(T)) return gc_NULL(av);
     454           0 :   return gc_GEN(av, T);
     455             : }
     456             : 
     457             : /* round to closest integer (as a double). If |a| >= 2^52, return it */
     458             : static double
     459    10767634 : pari_rint(double a)
     460             : {
     461             : #ifdef HAS_RINT
     462    10767634 :   return rint(a);
     463             : #else
     464             :   const double pow2 = 4.5035996273704960e+15; /* 2^52 */
     465             :   double r, fa = fabs(a);
     466             :   if (fa >= pow2) return a;
     467             :   r = (pow2 + fa) - pow2;
     468             :   if (a < 0) r = -r;
     469             :   return r;
     470             : #endif
     471             : }
     472             : 
     473             : /* default quality ratio for LLL */
     474             : static const double LLLDFT = 0.99;
     475             : 
     476             : /* assume flag & (LLL_KER|LLL_IM|LLL_ALL). LLL_INPLACE implies LLL_IM */
     477             : static GEN
     478      771699 : lll_trivial(GEN x, long flag)
     479             : {
     480      771699 :   if (lg(x) == 1)
     481             :   { /* dim x = 0 */
     482       15484 :     if (! (flag & LLL_ALL)) return cgetg(1,t_MAT);
     483          28 :     retmkvec2(cgetg(1,t_MAT), cgetg(1,t_MAT));
     484             :   }
     485             :   /* dim x = 1 */
     486      756215 :   if (gequal0(gel(x,1)))
     487             :   {
     488         129 :     if (flag & LLL_KER) return matid(1);
     489         129 :     if (flag & (LLL_IM|LLL_INPLACE)) return cgetg(1,t_MAT);
     490          28 :     retmkvec2(matid(1), cgetg(1,t_MAT));
     491             :   }
     492      756085 :   if (flag & LLL_INPLACE) return gcopy(x);
     493      652403 :   if (flag & LLL_KER) return cgetg(1,t_MAT);
     494      652403 :   if (flag & LLL_IM)  return matid(1);
     495          28 :   retmkvec2(cgetg(1,t_MAT), (flag & LLL_GRAM)? gcopy(x): matid(1));
     496             : }
     497             : 
     498             : /* vecslice(x,#x-k,#x) in place. Works for t_MAT, t_VEC/t_COL */
     499             : static GEN
     500     2090270 : vectail_inplace(GEN x, long k)
     501             : {
     502     2090270 :   if (!k) return x;
     503       57983 :   x[k] = ((ulong)x[0] & ~LGBITS) | _evallg(lg(x) - k);
     504       57983 :   return x + k;
     505             : }
     506             : 
     507             : /* k = dim Kernel */
     508             : static GEN
     509     2164394 : lll_finish(GEN h, long k, long flag)
     510             : {
     511             :   GEN g;
     512     2164394 :   if (!(flag & (LLL_IM|LLL_KER|LLL_ALL|LLL_INPLACE))) return h;
     513     2090293 :   if (flag & (LLL_IM|LLL_INPLACE)) return vectail_inplace(h, k);
     514          93 :   if (flag & LLL_KER) { setlg(h,k+1); return h; }
     515          65 :   g = vecslice(h,1,k); /* done first: vectail_inplace kills h */
     516          70 :   return mkvec2(g, vectail_inplace(h, k));
     517             : }
     518             : 
     519             : /* y * z * 2^e, e >= 0; y,z t_INT */
     520             : INLINE GEN
     521      317718 : mulshift(GEN y, GEN z, long e)
     522             : {
     523      317718 :   long ly = lgefint(y), lz;
     524             :   pari_sp av;
     525             :   GEN t;
     526      317718 :   if (ly == 2) return gen_0;
     527       46562 :   lz = lgefint(z);
     528       46562 :   av = avma; (void)new_chunk(ly+lz+nbits2lg(e)); /* HACK */
     529       46562 :   t = mulii(z, y);
     530       46562 :   set_avma(av); return shifti(t, e);
     531             : }
     532             : 
     533             : /* x - y * z * 2^e, e >= 0; x,y,z t_INT */
     534             : INLINE GEN
     535     1501331 : submulshift(GEN x, GEN y, GEN z, long e)
     536             : {
     537     1501331 :   long lx = lgefint(x), ly, lz;
     538             :   pari_sp av;
     539             :   GEN t;
     540     1501331 :   if (!e) return submulii(x, y, z);
     541     1491384 :   if (lx == 2) { t = mulshift(y, z, e); togglesign(t); return t; }
     542     1192677 :   ly = lgefint(y);
     543     1192677 :   if (ly == 2) return icopy(x);
     544      955034 :   lz = lgefint(z);
     545      955034 :   av = avma; (void)new_chunk(lx+ly+lz+nbits2lg(e)); /* HACK */
     546      955034 :   t = shifti(mulii(z, y), e);
     547      955034 :   set_avma(av); return subii(x, t);
     548             : }
     549             : static void
     550    18524547 : subzi(GEN *a, GEN b)
     551             : {
     552    18524547 :   pari_sp av = avma;
     553    18524547 :   b = subii(*a, b);
     554    18524504 :   if (lgefint(b)<=lg(*a) && isonstack(*a)) { affii(b,*a); set_avma(av); }
     555     2104842 :   else *a = b;
     556    18524562 : }
     557             : 
     558             : static void
     559    17783076 : addzi(GEN *a, GEN b)
     560             : {
     561    17783076 :   pari_sp av = avma;
     562    17783076 :   b = addii(*a, b);
     563    17783057 :   if (lgefint(b)<=lg(*a) && isonstack(*a)) { affii(b,*a); set_avma(av); }
     564     1879121 :   else *a = b;
     565    17783081 : }
     566             : 
     567             : /* x - u*y * 2^e */
     568             : INLINE GEN
     569     4178178 : submuliu2n(GEN x, GEN y, ulong u, long e)
     570             : {
     571             :   pari_sp av;
     572     4178178 :   long ly = lgefint(y);
     573     4178178 :   if (ly == 2) return x;
     574     2866302 :   av = avma;
     575     2866302 :   (void)new_chunk(3+ly+lgefint(x)+nbits2lg(e)); /* HACK */
     576     2866966 :   y = shifti(mului(u,y), e);
     577     2866604 :   set_avma(av); return subii(x, y);
     578             : }
     579             : /* *x -= u*y * 2^e */
     580             : INLINE void
     581      262549 : submulzu2n(GEN *x, GEN y, ulong u, long e)
     582             : {
     583             :   pari_sp av;
     584      262549 :   long ly = lgefint(y);
     585      262549 :   if (ly == 2) return;
     586      172674 :   av = avma;
     587      172674 :   (void)new_chunk(3+ly+lgefint(*x)+nbits2lg(e)); /* HACK */
     588      172674 :   y = shifti(mului(u,y), e);
     589      172674 :   set_avma(av); return subzi(x, y);
     590             : }
     591             : 
     592             : /* x + u*y * 2^e */
     593             : INLINE GEN
     594     4086689 : addmuliu2n(GEN x, GEN y, ulong u, long e)
     595             : {
     596             :   pari_sp av;
     597     4086689 :   long ly = lgefint(y);
     598     4086689 :   if (ly == 2) return x;
     599     2806644 :   av = avma;
     600     2806644 :   (void)new_chunk(3+ly+lgefint(x)+nbits2lg(e)); /* HACK */
     601     2807308 :   y = shifti(mului(u,y), e);
     602     2806977 :   set_avma(av); return addii(x, y);
     603             : }
     604             : 
     605             : /* *x += u*y * 2^e */
     606             : INLINE void
     607      271563 : addmulzu2n(GEN *x, GEN y, ulong u, long e)
     608             : {
     609             :   pari_sp av;
     610      271563 :   long ly = lgefint(y);
     611      271563 :   if (ly == 2) return;
     612      178632 :   av = avma;
     613      178632 :   (void)new_chunk(3+ly+lgefint(*x)+nbits2lg(e)); /* HACK */
     614      178632 :   y = shifti(mului(u,y), e);
     615      178632 :   set_avma(av); return addzi(x, y);
     616             : }
     617             : 
     618             : /* n < 10; (void)gc_all supporting &NULL arguments. Maybe rename and export ? */
     619             : INLINE void
     620        4835 : gc_lll(pari_sp av, int n, ...)
     621             : {
     622             :   int i, j;
     623             :   GEN *gptr[10];
     624             :   size_t s;
     625        4835 :   va_list a; va_start(a, n);
     626       14505 :   for (i=j=0; i<n; i++)
     627             :   {
     628        9670 :     GEN *x = va_arg(a,GEN*);
     629        9670 :     if (*x) { gptr[j++] = x; *x = (GEN)copy_bin(*x); }
     630             :   }
     631        4835 :   va_end(a); set_avma(av);
     632       12003 :   for (--j; j>=0; j--) *gptr[j] = bin_copy((GENbin*)*gptr[j]);
     633        4835 :   s = pari_mainstack->top - pari_mainstack->bot;
     634             :   /* size of saved objects ~ stacksize / 4 => overflow */
     635        4835 :   if (av - avma > (s >> 2))
     636             :   {
     637           0 :     size_t t = avma - pari_mainstack->bot;
     638           0 :     av = avma; new_chunk((s + t) / sizeof(long)); set_avma(av); /* double */
     639             :   }
     640        4835 : }
     641             : 
     642             : /********************************************************************/
     643             : /**                                                                **/
     644             : /**                   FPLLL (adapted from D. Stehle's code)        **/
     645             : /**                                                                **/
     646             : /********************************************************************/
     647             : /* Babai* and fplll* are a conversion to libpari API and data types
     648             :    of fplll-1.3 by Damien Stehle'.
     649             : 
     650             :   Copyright 2005, 2006 Damien Stehle'.
     651             : 
     652             :   This program is free software; you can redistribute it and/or modify it
     653             :   under the terms of the GNU General Public License as published by the
     654             :   Free Software Foundation; either version 2 of the License, or (at your
     655             :   option) any later version.
     656             : 
     657             :   This program implements ideas from the paper "Floating-point LLL Revisited",
     658             :   by Phong Nguyen and Damien Stehle', in the Proceedings of Eurocrypt'2005,
     659             :   Springer-Verlag; and was partly inspired by Shoup's NTL library:
     660             :   http://www.shoup.net/ntl/ */
     661             : 
     662             : /* x t_REAL, |x| >= 1/2. Test whether |x| <= 3/2 */
     663             : static int
     664      402705 : absrsmall2(GEN x)
     665             : {
     666      402705 :   long e = expo(x), l, i;
     667      402705 :   if (e < 0) return 1;
     668      203333 :   if (e > 0 || (ulong)x[2] > (3UL << (BITS_IN_LONG-2))) return 0;
     669             :   /* line above assumes l > 2. OK since x != 0 */
     670       75162 :   l = lg(x); for (i = 3; i < l; i++) if (x[i]) return 0;
     671       64627 :   return 1;
     672             : }
     673             : /* x t_REAL; test whether |x| <= 1/2 */
     674             : static int
     675      698128 : absrsmall(GEN x)
     676             : {
     677             :   long e, l, i;
     678      698128 :   if (!signe(x)) return 1;
     679      693961 :   e = expo(x); if (e < -1) return 1;
     680      408115 :   if (e > -1 || (ulong)x[2] > HIGHBIT) return 0;
     681        6123 :   l = lg(x); for (i = 3; i < l; i++) if (x[i]) return 0;
     682        5410 :   return 1;
     683             : }
     684             : 
     685             : static void
     686    31866205 : rotate(GEN A, long k2, long k)
     687             : {
     688             :   long i;
     689    31866205 :   GEN B = gel(A,k2);
     690   101735990 :   for (i = k2; i > k; i--) gel(A,i) = gel(A,i-1);
     691    31866205 :   gel(A,k) = B;
     692    31866205 : }
     693             : 
     694             : /************************* FAST version (double) ************************/
     695             : #define dmael(x,i,j) ((x)[i][j])
     696             : #define del(x,i) ((x)[i])
     697             : 
     698             : static double *
     699    34981891 : cget_dblvec(long d)
     700    34981891 : { return (double*) stack_malloc_align(d*sizeof(double), sizeof(double)); }
     701             : 
     702             : static double **
     703     8415048 : cget_dblmat(long d) { return (double **) cgetg(d, t_VECSMALL); }
     704             : 
     705             : static double
     706   162350923 : itodbl_exp(GEN x, long *e)
     707             : {
     708   162350923 :   pari_sp av = avma;
     709   162350923 :   GEN r = itor(x,DEFAULTPREC);
     710   162345939 :   *e = expo(r); setexpo(r,0);
     711   162343433 :   return gc_double(av, rtodbl(r));
     712             : }
     713             : 
     714             : static double
     715   118015479 : dbldotproduct(double *x, double *y, long n)
     716             : {
     717             :   long i;
     718   118015479 :   double sum = del(x,1) * del(y,1);
     719  1382798098 :   for (i=2; i<=n; i++) sum += del(x,i) * del(y,i);
     720   118015479 :   return sum;
     721             : }
     722             : 
     723             : static double
     724     2481147 : dbldotsquare(double *x, long n)
     725             : {
     726             :   long i;
     727     2481147 :   double sum = del(x,1) * del(x,1);
     728     8221317 :   for (i=2; i<=n; i++) sum += del(x,i) * del(x,i);
     729     2481147 :   return sum;
     730             : }
     731             : 
     732             : static long
     733    24880376 : set_line(double *appv, GEN v, long n)
     734             : {
     735    24880376 :   long i, maxexp = 0;
     736    24880376 :   pari_sp av = avma;
     737    24880376 :   GEN e = cgetg(n+1, t_VECSMALL);
     738   187225844 :   for (i = 1; i <= n; i++)
     739             :   {
     740   162347832 :     del(appv,i) = itodbl_exp(gel(v,i), e+i);
     741   162344577 :     if (e[i] > maxexp) maxexp = e[i];
     742             :   }
     743   187270854 :   for (i = 1; i <= n; i++) del(appv,i) = ldexp(del(appv,i), e[i]-maxexp);
     744    24878012 :   set_avma(av); return maxexp;
     745             : }
     746             : 
     747             : static void
     748    34539811 : dblrotate(double **A, long k2, long k)
     749             : {
     750             :   long i;
     751    34539811 :   double *B = del(A,k2);
     752   109328630 :   for (i = k2; i > k; i--) del(A,i) = del(A,i-1);
     753    34539811 :   del(A,k) = B;
     754    34539811 : }
     755             : /* update G[kappa][i] from appB */
     756             : static void
     757    22609311 : setG_fast(double **appB, long n, double **G, long kappa, long a, long b)
     758             : { long i;
     759   101745278 :   for (i = a; i <= b; i++)
     760    79136074 :     dmael(G,kappa,i) = dbldotproduct(del(appB,kappa), del(appB,i), n);
     761    22609204 : }
     762             : /* update G[i][kappa] from appB */
     763             : static void
     764    16981193 : setG2_fast(double **appB, long n, double **G, long kappa, long a, long b)
     765             : { long i;
     766    55862549 :   for (i = a; i <= b; i++)
     767    38881386 :     dmael(G,i,kappa) = dbldotproduct(del(appB,kappa), del(appB,i), n);
     768    16981163 : }
     769             : const long EX0 = -2; /* uninitialized; any value less than expo(0.51) = -1 */
     770             : 
     771             : #ifdef LONG_IS_64BIT
     772             : typedef long s64;
     773             : #define addmuliu64_inplace addmuliu_inplace
     774             : #define submuliu64_inplace submuliu_inplace
     775             : #define submuliu642n submuliu2n
     776             : #define addmuliu642n addmuliu2n
     777             : #else
     778             : typedef long long s64;
     779             : typedef unsigned long long u64;
     780             : 
     781             : INLINE GEN
     782    19880176 : u64toi(u64 x)
     783             : {
     784             :   GEN y;
     785             :   ulong h;
     786    19880176 :   if (!x) return gen_0;
     787    19880176 :   h = x>>32;
     788    19880176 :   if (!h) return utoipos(x);
     789     1145216 :   y = cgetipos(4);
     790     1145216 :   *int_LSW(y) = x&0xFFFFFFFF;
     791     1145216 :   *int_MSW(y) = x>>32;
     792     1145216 :   return y;
     793             : }
     794             : 
     795             : INLINE GEN
     796      668454 : u64toineg(u64 x)
     797             : {
     798             :   GEN y;
     799             :   ulong h;
     800      668454 :   if (!x) return gen_0;
     801      668454 :   h = x>>32;
     802      668454 :   if (!h) return utoineg(x);
     803      668454 :   y = cgetineg(4);
     804      668454 :   *int_LSW(y) = x&0xFFFFFFFF;
     805      668454 :   *int_MSW(y) = x>>32;
     806      668454 :   return y;
     807             : }
     808             : INLINE GEN
     809     9572242 : addmuliu64_inplace(GEN x, GEN y, u64 u) { return addmulii(x, y, u64toi(u)); }
     810             : 
     811             : INLINE GEN
     812     9623289 : submuliu64_inplace(GEN x, GEN y, u64 u) { return submulii(x, y, u64toi(u)); }
     813             : 
     814             : INLINE GEN
     815      668454 : addmuliu642n(GEN x, GEN y, u64 u, long e) { return submulshift(x, y, u64toineg(u), e); }
     816             : 
     817             : INLINE GEN
     818      684645 : submuliu642n(GEN x, GEN y, u64 u, long e) { return submulshift(x, y, u64toi(u), e); }
     819             : 
     820             : #endif
     821             : 
     822             : /* Babai's Nearest Plane algorithm (iterative); see Babai() */
     823             : static int
     824    30136774 : Babai_fast(pari_sp av, long kappa, GEN *pB, GEN *pU, double **mu, double **r,
     825             :            double *s, double **appB, GEN expoB, double **G,
     826             :            long a, long zeros, long maxG, double eta)
     827             : {
     828    30136774 :   GEN B = *pB, U = *pU;
     829    30136774 :   const long n = nbrows(B), d = U ? lg(U)-1: 0;
     830    30136670 :   long k, aa = (a > zeros)? a : zeros+1;
     831    30136670 :   long emaxmu = EX0, emax2mu = EX0;
     832             :   s64 xx;
     833    30136670 :   int did_something = 0;
     834             :   /* N.B: we set d = 0 (resp. n = 0) to avoid updating U (resp. B) */
     835             : 
     836    17188381 :   for (;;) {
     837    47325051 :     int go_on = 0;
     838    47325051 :     long i, j, emax3mu = emax2mu;
     839             : 
     840    47325051 :     if (gc_needed(av,2))
     841             :     {
     842         195 :       if(DEBUGMEM>1) pari_warn(warnmem,"Babai[1], a=%ld", aa);
     843         195 :       gc_lll(av,2,&B,&U);
     844             :     }
     845             :     /* Step2: compute the GSO for stage kappa */
     846    47324487 :     emax2mu = emaxmu; emaxmu = EX0;
     847   181134291 :     for (j=aa; j<kappa; j++)
     848             :     {
     849   133813403 :       double g = dmael(G,kappa,j);
     850   573775524 :       for (k = zeros+1; k < j; k++) g -= dmael(mu,j,k) * dmael(r,kappa,k);
     851   133813403 :       dmael(r,kappa,j) = g;
     852   133813403 :       dmael(mu,kappa,j) = dmael(r,kappa,j) / dmael(r,j,j);
     853   133813403 :       emaxmu = maxss(emaxmu, expoB[kappa]-expoB[j]);
     854             :     }
     855             :     /* maxmu doesn't decrease fast enough */
     856    47320888 :     if (emax3mu != EX0 && emax3mu <= emax2mu + 5) {*pB = B; *pU = U; return 1;}
     857             : 
     858   168094694 :     for (j=kappa-1; j>zeros; j--)
     859             :     {
     860   137966564 :       double tmp = fabs(ldexp (dmael(mu,kappa,j), expoB[kappa]-expoB[j]));
     861   137966564 :       if (tmp>eta) { go_on = 1; break; }
     862             :     }
     863             : 
     864             :     /* Step3--5: compute the X_j's  */
     865    47316642 :     if (go_on)
     866    77909842 :       for (j=kappa-1; j>zeros; j--)
     867             :       { /* The code below seemingly handles U = NULL, but in this case d = 0 */
     868    60722077 :         int e = expoB[j] - expoB[kappa];
     869    60722077 :         double tmp = ldexp(dmael(mu,kappa,j), -e), atmp = fabs(tmp);
     870             :         /* tmp = Inf is allowed */
     871    60722077 :         if (atmp <= .5) continue; /* size-reduced */
     872    34070072 :         if (gc_needed(av,2))
     873             :         {
     874         348 :           if(DEBUGMEM>1) pari_warn(warnmem,"Babai[2], a=%ld, j=%ld", aa,j);
     875         348 :           gc_lll(av,2,&B,&U);
     876             :         }
     877    34071415 :         did_something = 1;
     878             :         /* we consider separately the case |X| = 1 */
     879    34071415 :         if (atmp <= 1.5)
     880             :         {
     881    22933308 :           if (dmael(mu,kappa,j) > 0) { /* in this case, X = 1 */
     882    46863393 :             for (k=zeros+1; k<j; k++)
     883    35165659 :               dmael(mu,kappa,k) -= ldexp(dmael(mu,j,k), e);
     884   158127238 :             for (i=1; i<=n; i++)
     885   146430212 :               gmael(B,kappa,i) = subii(gmael(B,kappa,i), gmael(B,j,i));
     886   104419531 :             for (i=1; i<=d; i++)
     887    92722369 :               gmael(U,kappa,i) = subii(gmael(U,kappa,i), gmael(U,j,i));
     888             :           } else { /* otherwise X = -1 */
     889    46047328 :             for (k=zeros+1; k<j; k++)
     890    34811754 :               dmael(mu,kappa,k) += ldexp(dmael(mu,j,k), e);
     891   155489043 :             for (i=1; i<=n; i++)
     892   144255225 :               gmael(B,kappa,i) = addii(gmael(B,kappa,i), gmael(B,j,i));
     893   101727082 :             for (i=1; i<=d; i++)
     894    90493133 :               gmael(U,kappa,i) = addii(gmael(U,kappa,i), gmael(U,j,i));
     895             :           }
     896    22931111 :           continue;
     897             :         }
     898             :         /* we have |X| >= 2 */
     899    11138107 :         if (atmp < 9007199254740992.)
     900             :         {
     901    10299427 :           tmp = pari_rint(tmp);
     902    24556538 :           for (k=zeros+1; k<j; k++)
     903    14257105 :             dmael(mu,kappa,k) -= ldexp(tmp * dmael(mu,j,k), e);
     904    10299433 :           xx = (s64) tmp;
     905    10299433 :           if (xx > 0) /* = xx */
     906             :           {
     907    46178143 :             for (i=1; i<=n; i++)
     908    40998119 :               gmael(B,kappa,i) = submuliu64_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
     909    33404362 :             for (i=1; i<=d; i++)
     910    28224277 :               gmael(U,kappa,i) = submuliu64_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
     911             :           }
     912             :           else /* = -xx */
     913             :           {
     914    45850902 :             for (i=1; i<=n; i++)
     915    40731497 :               gmael(B,kappa,i) = addmuliu64_inplace(gmael(B,kappa,i), gmael(B,j,i), -xx);
     916    33087124 :             for (i=1; i<=d; i++)
     917    27967661 :               gmael(U,kappa,i) = addmuliu64_inplace(gmael(U,kappa,i), gmael(U,j,i), -xx);
     918             :           }
     919             :         }
     920             :         else
     921             :         {
     922             :           int E;
     923      838680 :           xx = (s64) ldexp(frexp(dmael(mu,kappa,j), &E), 53);
     924      838680 :           E -= e + 53;
     925      838680 :           if (E <= 0)
     926             :           {
     927           0 :             xx = xx << -E;
     928           0 :             for (k=zeros+1; k<j; k++)
     929           0 :               dmael(mu,kappa,k) -= ldexp(((double)xx) * dmael(mu,j,k), e);
     930           0 :             if (xx > 0) /* = xx */
     931             :             {
     932           0 :               for (i=1; i<=n; i++)
     933           0 :                 gmael(B,kappa,i) = submuliu64_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
     934           0 :               for (i=1; i<=d; i++)
     935           0 :                 gmael(U,kappa,i) = submuliu64_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
     936             :             }
     937             :             else /* = -xx */
     938             :             {
     939           0 :               for (i=1; i<=n; i++)
     940           0 :                 gmael(B,kappa,i) = addmuliu64_inplace(gmael(B,kappa,i), gmael(B,j,i), -xx);
     941           0 :               for (i=1; i<=d; i++)
     942           0 :                 gmael(U,kappa,i) = addmuliu64_inplace(gmael(U,kappa,i), gmael(U,j,i), -xx);
     943             :             }
     944             :           } else
     945             :           {
     946     2790955 :             for (k=zeros+1; k<j; k++)
     947     1952275 :               dmael(mu,kappa,k) -= ldexp(((double)xx) * dmael(mu,j,k), E + e);
     948      838680 :             if (xx > 0) /* = xx */
     949             :             {
     950     3940504 :               for (i=1; i<=n; i++)
     951     3518411 :                 gmael(B,kappa,i) = submuliu642n(gmael(B,kappa,i), gmael(B,j,i), xx, E);
     952     1509437 :               for (i=1; i<=d; i++)
     953     1087344 :                 gmael(U,kappa,i) = submuliu642n(gmael(U,kappa,i), gmael(U,j,i), xx, E);
     954             :             }
     955             :             else /* = -xx */
     956             :             {
     957     3891001 :               for (i=1; i<=n; i++)
     958     3474410 :                 gmael(B,kappa,i) = addmuliu642n(gmael(B,kappa,i), gmael(B,j,i), -xx, E);
     959     1486171 :               for (i=1; i<=d; i++)
     960     1069580 :                 gmael(U,kappa,i) = addmuliu642n(gmael(U,kappa,i), gmael(U,j,i), -xx, E);
     961             :             }
     962             :           }
     963             :         }
     964             :       }
     965    47315913 :     if (!go_on) break; /* Anything happened? */
     966    17183541 :     expoB[kappa] = set_line(del(appB,kappa), gel(B,kappa), n);
     967    17188212 :     setG_fast(appB, n, G, kappa, zeros+1, kappa-1);
     968    17188381 :     aa = zeros+1;
     969             :   }
     970    30132372 :   if (did_something) setG2_fast(appB, n, G, kappa, kappa, maxG);
     971             : 
     972    30132515 :   del(s,zeros+1) = dmael(G,kappa,kappa);
     973             :   /* the last s[kappa-1]=r[kappa][kappa] is computed only if kappa increases */
     974   109498592 :   for (k=zeros+1; k<=kappa-2; k++)
     975    79366077 :     del(s,k+1) = del(s,k) - dmael(mu,kappa,k)*dmael(r,kappa,k);
     976    30132515 :   *pB = B; *pU = U; return 0;
     977             : }
     978             : 
     979             : static void
     980    11956995 : update_alpha(GEN alpha, long kappa, long kappa2, long kappamax)
     981             : {
     982             :   long i;
     983    37996710 :   for (i = kappa; i < kappa2; i++)
     984    26039715 :     if (kappa <= alpha[i]) alpha[i] = kappa;
     985    37996737 :   for (i = kappa2; i > kappa; i--) alpha[i] = alpha[i-1];
     986    23154562 :   for (i = kappa2+1; i <= kappamax; i++)
     987    11197567 :     if (kappa < alpha[i]) alpha[i] = kappa;
     988    11956995 :   alpha[kappa] = kappa;
     989    11956995 : }
     990             : static void
     991      443655 : rotateG(GEN G, long kappa2, long kappa, long maxG, GEN Gtmp)
     992             : {
     993             :   long i, j;
     994     3429153 :   for (i=1; i<=kappa2; i++) gel(Gtmp,i) = gmael(G,kappa2,i);
     995     1819936 :   for (   ; i<=maxG; i++)   gel(Gtmp,i) = gmael(G,i,kappa2);
     996     1553560 :   for (i=kappa2; i>kappa; i--)
     997             :     {
     998     5256756 :       for (j=1; j<kappa; j++) gmael(G,i,j) = gmael(G,i-1,j);
     999     1109905 :       gmael(G,i,kappa) = gel(Gtmp,i-1);
    1000     3996298 :       for (j=kappa+1; j<=i; j++) gmael(G,i,j) = gmael(G,i-1,j-1);
    1001     4795384 :       for (j=kappa2+1; j<=maxG; j++) gmael(G,j,i) = gmael(G,j,i-1);
    1002             :     }
    1003     1875593 :   for (i=1; i<kappa; i++) gmael(G,kappa,i) = gel(Gtmp,i);
    1004      443655 :   gmael(G,kappa,kappa) = gel(Gtmp,kappa2);
    1005     1819936 :   for (i=kappa2+1; i<=maxG; i++) gmael(G,i,kappa) = gel(Gtmp,i);
    1006      443655 : }
    1007             : static void
    1008    11513280 : rotateG_fast(double **G, long kappa2, long kappa, long maxG, double *Gtmp)
    1009             : {
    1010             :   long i, j;
    1011    66930728 :   for (i=1; i<=kappa2; i++) del(Gtmp,i) = dmael(G,kappa2,i);
    1012    22196952 :   for (   ; i<=maxG; i++) del(Gtmp,i) = dmael(G,i,kappa2);
    1013    36442998 :   for (i=kappa2; i>kappa; i--)
    1014             :   {
    1015    69929005 :     for (j=1; j<kappa; j++) dmael(G,i,j) = dmael(G,i-1,j);
    1016    24929718 :     dmael(G,i,kappa) = del(Gtmp,i-1);
    1017    84888337 :     for (j=kappa+1; j<=i; j++) dmael(G,i,j) = dmael(G,i-1,j-1);
    1018    46920548 :     for (j=kappa2+1; j<=maxG; j++) dmael(G,j,i) = dmael(G,j,i-1);
    1019             :   }
    1020    30487891 :   for (i=1; i<kappa; i++) dmael(G,kappa,i) = del(Gtmp,i);
    1021    11513280 :   dmael(G,kappa,kappa) = del(Gtmp,kappa2);
    1022    22196983 :   for (i=kappa2+1; i<=maxG; i++) dmael(G,i,kappa) = del(Gtmp,i);
    1023    11513280 : }
    1024             : 
    1025             : /* LLL-reduces (B,U) in place [apply base change transforms to B and U].
    1026             :  * Gram matrix, and GSO performed on matrices of 'double'.
    1027             :  * If (keepfirst), never swap with first vector.
    1028             :  * Return -1 on failure, else zeros = dim Kernel (>= 0) */
    1029             : static long
    1030     2103787 : fplll_fast(GEN *pB, GEN *pU, double delta, double eta, long keepfirst)
    1031             : {
    1032             :   pari_sp av;
    1033             :   long kappa, kappa2, d, n, i, j, zeros, kappamax, maxG;
    1034             :   double **mu, **r, *s, tmp, *Gtmp, **G, **appB;
    1035     2103787 :   GEN alpha, expoB, B = *pB, U;
    1036     2103787 :   long cnt = 0;
    1037             : 
    1038     2103787 :   d = lg(B)-1;
    1039     2103787 :   n = nbrows(B);
    1040     2103785 :   U = *pU; /* NULL if inplace */
    1041             : 
    1042     2103785 :   G = cget_dblmat(d+1);
    1043     2103781 :   appB = cget_dblmat(d+1);
    1044     2103776 :   mu = cget_dblmat(d+1);
    1045     2103776 :   r  = cget_dblmat(d+1);
    1046     2103777 :   s  = cget_dblvec(d+1);
    1047     9797432 :   for (j = 1; j <= d; j++)
    1048             :   {
    1049     7693649 :     del(mu,j) = cget_dblvec(d+1);
    1050     7693647 :     del(r,j) = cget_dblvec(d+1);
    1051     7693644 :     del(appB,j) = cget_dblvec(n+1);
    1052     7693645 :     del(G,j) = cget_dblvec(d+1);
    1053    47471387 :     for (i=1; i<=d; i++) dmael(G,j,i) = 0.;
    1054             :   }
    1055     2103783 :   expoB = cgetg(d+1, t_VECSMALL);
    1056     9797381 :   for (i=1; i<=d; i++) expoB[i] = set_line(del(appB,i), gel(B,i), n);
    1057     2103756 :   Gtmp = cget_dblvec(d+1);
    1058     2103780 :   alpha = cgetg(d+1, t_VECSMALL);
    1059     2103776 :   av = avma;
    1060             : 
    1061             :   /* Step2: Initializing the main loop */
    1062     2103776 :   kappamax = 1;
    1063     2103776 :   i = 1;
    1064     2103776 :   maxG = d; /* later updated to kappamax */
    1065             : 
    1066             :   do {
    1067     2269035 :     dmael(G,i,i) = dbldotsquare(del(appB,i),n);
    1068     2269038 :   } while (dmael(G,i,i) <= 0 && (++i <=d));
    1069     2103779 :   zeros = i-1; /* all vectors B[i] with i <= zeros are zero vectors */
    1070     2103779 :   kappa = i;
    1071     2103779 :   if (zeros < d) dmael(r,zeros+1,zeros+1) = dmael(G,zeros+1,zeros+1);
    1072     9632177 :   for (i=zeros+1; i<=d; i++) alpha[i]=1;
    1073    32236363 :   while (++kappa <= d)
    1074             :   {
    1075    30136827 :     if (kappa > kappamax)
    1076             :     {
    1077     5421073 :       if (DEBUGLEVEL>=4) err_printf("K%ld ",kappa);
    1078     5421073 :       maxG = kappamax = kappa;
    1079     5421073 :       setG_fast(appB, n, G, kappa, zeros+1, kappa);
    1080             :     }
    1081             :     /* Step3: Call to the Babai algorithm, mu,r,s updated in place */
    1082    30136821 :     if (Babai_fast(av, kappa, &B,&U, mu,r,s, appB, expoB, G, alpha[kappa],
    1083        4246 :                    zeros, maxG, eta)) { *pB=B; *pU=U; return -1; }
    1084             : 
    1085    30132470 :     tmp = ldexp(r[kappa-1][kappa-1] * delta, 2*(expoB[kappa-1]-expoB[kappa]));
    1086    30132470 :     if ((keepfirst && kappa == 2) || tmp <= del(s,kappa-1))
    1087             :     { /* Step4: Success of Lovasz's condition */
    1088    18619130 :       alpha[kappa] = kappa;
    1089    18619130 :       tmp = dmael(mu,kappa,kappa-1) * dmael(r,kappa,kappa-1);
    1090    18619130 :       dmael(r,kappa,kappa) = del(s,kappa-1)- tmp;
    1091    18619130 :       continue;
    1092             :     }
    1093             :     /* Step5: Find the right insertion index kappa, kappa2 = initial kappa */
    1094    11513340 :     if (DEBUGLEVEL>=4 && kappa==kappamax && del(s,kappa-1)!=0)
    1095           0 :       if (++cnt > 20) { cnt = 0; err_printf("(%ld) ", 2*expoB[1] + dblexpo(del(s,1))); }
    1096    11513336 :     kappa2 = kappa;
    1097             :     do {
    1098    24929826 :       kappa--;
    1099    24929826 :       if (kappa<zeros+2 + (keepfirst ? 1: 0)) break;
    1100    18359652 :       tmp = dmael(r,kappa-1,kappa-1) * delta;
    1101    18359652 :       tmp = ldexp(tmp, 2*(expoB[kappa-1]-expoB[kappa2]));
    1102    18359652 :     } while (del(s,kappa-1) <= tmp);
    1103    11513336 :     update_alpha(alpha, kappa, kappa2, kappamax);
    1104             : 
    1105             :     /* Step6: Update the mu's and r's */
    1106    11513341 :     dblrotate(mu,kappa2,kappa);
    1107    11513323 :     dblrotate(r,kappa2,kappa);
    1108    11513297 :     dmael(r,kappa,kappa) = del(s,kappa);
    1109             : 
    1110             :     /* Step7: Update B, appB, U, G */
    1111    11513297 :     rotate(B,kappa2,kappa);
    1112    11513301 :     dblrotate(appB,kappa2,kappa);
    1113    11513289 :     if (U) rotate(U,kappa2,kappa);
    1114    11513291 :     rotate(expoB,kappa2,kappa);
    1115    11513273 :     rotateG_fast(G,kappa2,kappa, maxG, Gtmp);
    1116             : 
    1117             :     /* Step8: Prepare the next loop iteration */
    1118    11513454 :     if (kappa == zeros+1 && dmael(G,kappa,kappa)<= 0)
    1119             :     {
    1120      212110 :       zeros++; kappa++;
    1121      212110 :       dmael(G,kappa,kappa) = dbldotsquare(del(appB,kappa),n);
    1122      212110 :       dmael(r,kappa,kappa) = dmael(G,kappa,kappa);
    1123             :     }
    1124             :   }
    1125     2099536 :   *pB = B; *pU = U; return zeros;
    1126             : }
    1127             : 
    1128             : /***************** HEURISTIC version (reduced precision) ****************/
    1129             : static GEN
    1130      198160 : realsqrdotproduct(GEN x)
    1131             : {
    1132      198160 :   long i, l = lg(x);
    1133      198160 :   GEN z = sqrr(gel(x,1));
    1134     1274070 :   for (i=2; i<l; i++) z = addrr(z, sqrr(gel(x,i)));
    1135      198160 :   return z;
    1136             : }
    1137             : /* x, y non-empty vector of t_REALs, same length */
    1138             : static GEN
    1139     1186355 : realdotproduct(GEN x, GEN y)
    1140             : {
    1141             :   long i, l;
    1142             :   GEN z;
    1143     1186355 :   if (x == y) return realsqrdotproduct(x);
    1144      988195 :   l = lg(x); z = mulrr(gel(x,1),gel(y,1));
    1145     8535293 :   for (i=2; i<l; i++) z = addrr(z, mulrr(gel(x,i), gel(y,i)));
    1146      988195 :   return z;
    1147             : }
    1148             : static void
    1149      206374 : setG_heuristic(GEN appB, GEN G, long kappa, long a, long b)
    1150      206374 : { pari_sp av = avma;
    1151             :   long i;
    1152      935493 :   for (i = a; i <= b; i++)
    1153      729119 :     affrr(realdotproduct(gel(appB,kappa),gel(appB,i)), gmael(G,kappa,i));
    1154      206374 :   set_avma(av);
    1155      206374 : }
    1156             : static void
    1157      188352 : setG2_heuristic(GEN appB, GEN G, long kappa, long a, long b)
    1158      188352 : { pari_sp av = avma;
    1159             :   long i;
    1160      645588 :   for (i = a; i <= b; i++)
    1161      457236 :     affrr(realdotproduct(gel(appB,kappa),gel(appB,i)), gmael(G,i,kappa));
    1162      188352 :   set_avma(av);
    1163      188352 : }
    1164             : 
    1165             : /* approximate t_REAL x as m * 2^e, where |m| < 2^bit */
    1166             : static GEN
    1167       12139 : truncexpo(GEN x, long bit, long *e)
    1168             : {
    1169       12139 :   *e = expo(x) + 1 - bit;
    1170       12139 :   if (*e >= 0) return mantissa2nr(x, 0);
    1171         938 :   *e = 0; return roundr_safe(x);
    1172             : }
    1173             : /* Babai's Nearest Plane algorithm (iterative); see Babai() */
    1174             : static int
    1175      289747 : Babai_heuristic(pari_sp av, long kappa, GEN *pB, GEN *pU, GEN mu, GEN r, GEN s,
    1176             :                 GEN appB, GEN G, long a, long zeros, long maxG,
    1177             :                 GEN eta, long prec)
    1178             : {
    1179      289747 :   GEN B = *pB, U = *pU;
    1180      289747 :   const long n = nbrows(B), d = U ? lg(U)-1: 0, bit = prec2nbits(prec);
    1181      289747 :   long k, aa = (a > zeros)? a : zeros+1;
    1182      289747 :   int did_something = 0;
    1183      289747 :   long emaxmu = EX0, emax2mu = EX0;
    1184             :   /* N.B: we set d = 0 (resp. n = 0) to avoid updating U (resp. B) */
    1185             : 
    1186      196566 :   for (;;) {
    1187      486313 :     int go_on = 0;
    1188      486313 :     long i, j, emax3mu = emax2mu;
    1189             : 
    1190      486313 :     if (gc_needed(av,2))
    1191             :     {
    1192          27 :       if(DEBUGMEM>1) pari_warn(warnmem,"Babai[1], a=%ld", aa);
    1193          27 :       gc_lll(av,2,&B,&U);
    1194             :     }
    1195             :     /* Step2: compute the GSO for stage kappa */
    1196      486313 :     emax2mu = emaxmu; emaxmu = EX0;
    1197     1867372 :     for (j=aa; j<kappa; j++)
    1198             :     {
    1199     1381059 :       pari_sp btop = avma;
    1200     1381059 :       GEN g = gmael(G,kappa,j);
    1201     4466949 :       for (k = zeros+1; k<j; k++)
    1202     3085890 :         g = subrr(g, mulrr(gmael(mu,j,k), gmael(r,kappa,k)));
    1203     1381059 :       affrr(g, gmael(r,kappa,j));
    1204     1381059 :       affrr(divrr(gmael(r,kappa,j), gmael(r,j,j)), gmael(mu,kappa,j));
    1205     1381059 :       emaxmu = maxss(emaxmu, expo(gmael(mu,kappa,j)));
    1206     1381059 :       set_avma(btop);
    1207             :     }
    1208      486313 :     if (emax3mu != EX0 && emax3mu <= emax2mu + 5)
    1209        1335 :     { *pB = B; *pU = U; return 1; }
    1210             : 
    1211     1641231 :     for (j=kappa-1; j>zeros; j--)
    1212     1352819 :       if (abscmprr(gmael(mu,kappa,j), eta) > 0) { go_on = 1; break; }
    1213             : 
    1214             :     /* Step3--5: compute the X_j's  */
    1215      484978 :     if (go_on)
    1216      894694 :       for (j=kappa-1; j>zeros; j--)
    1217             :       { /* The code below seemingly handles U = NULL, but in this case d = 0 */
    1218             :         pari_sp btop;
    1219      698128 :         GEN tmp = gmael(mu,kappa,j);
    1220      698128 :         if (absrsmall(tmp)) continue; /* size-reduced */
    1221             : 
    1222      402705 :         if (gc_needed(av,2))
    1223             :         {
    1224          19 :           if(DEBUGMEM>1) pari_warn(warnmem,"Babai[2], a=%ld, j=%ld", aa,j);
    1225          19 :           gc_lll(av,2,&B,&U);
    1226             :         }
    1227      402705 :         btop = avma; did_something = 1;
    1228             :         /* we consider separately the case |X| = 1 */
    1229      402705 :         if (absrsmall2(tmp))
    1230             :         {
    1231      263999 :           if (signe(tmp) > 0) { /* in this case, X = 1 */
    1232      386534 :             for (k=zeros+1; k<j; k++)
    1233      255034 :               affrr(subrr(gmael(mu,kappa,k), gmael(mu,j,k)), gmael(mu,kappa,k));
    1234      131500 :             set_avma(btop);
    1235     1240283 :             for (i=1; i<=n; i++)
    1236     1108783 :               gmael(B,kappa,i) = subii(gmael(B,kappa,i), gmael(B,j,i));
    1237      812790 :             for (i=1; i<=d; i++)
    1238      681290 :               gmael(U,kappa,i) = subii(gmael(U,kappa,i), gmael(U,j,i));
    1239             :           } else { /* otherwise X = -1 */
    1240      391254 :             for (k=zeros+1; k<j; k++)
    1241      258755 :               affrr(addrr(gmael(mu,kappa,k), gmael(mu,j,k)), gmael(mu,kappa,k));
    1242      132499 :             set_avma(btop);
    1243     1254241 :             for (i=1; i<=n; i++)
    1244     1121742 :               gmael(B,kappa,i) = addii(gmael(B,kappa,i), gmael(B,j,i));
    1245      814232 :             for (i=1; i<=d; i++)
    1246      681733 :               gmael(U,kappa,i) = addii(gmael(U,kappa,i),gmael(U,j,i));
    1247             :           }
    1248      263999 :           continue;
    1249             :         }
    1250             :         /* we have |X| >= 2 */
    1251      138706 :         if (expo(tmp) < BITS_IN_LONG)
    1252             :         {
    1253      126567 :           ulong xx = roundr_safe(tmp)[2]; /* X fits in an ulong */
    1254      126567 :           if (signe(tmp) > 0) /* = xx */
    1255             :           {
    1256      138131 :             for (k=zeros+1; k<j; k++)
    1257       74374 :               affrr(subrr(gmael(mu,kappa,k), mulur(xx, gmael(mu,j,k))),
    1258       74374 :                   gmael(mu,kappa,k));
    1259       63757 :             set_avma(btop);
    1260      421218 :             for (i=1; i<=n; i++)
    1261      357461 :               gmael(B,kappa,i) = submuliu_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
    1262      312453 :             for (i=1; i<=d; i++)
    1263      248696 :               gmael(U,kappa,i) = submuliu_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
    1264             :           }
    1265             :           else /* = -xx */
    1266             :           {
    1267      134980 :             for (k=zeros+1; k<j; k++)
    1268       72170 :               affrr(addrr(gmael(mu,kappa,k), mulur(xx, gmael(mu,j,k))),
    1269       72170 :                   gmael(mu,kappa,k));
    1270       62810 :             set_avma(btop);
    1271      414705 :             for (i=1; i<=n; i++)
    1272      351895 :               gmael(B,kappa,i) = addmuliu_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
    1273      299706 :             for (i=1; i<=d; i++)
    1274      236896 :               gmael(U,kappa,i) = addmuliu_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
    1275             :           }
    1276             :         }
    1277             :         else
    1278             :         {
    1279             :           long e;
    1280       12139 :           GEN X = truncexpo(tmp, bit, &e); /* tmp ~ X * 2^e */
    1281       12139 :           btop = avma;
    1282       29549 :           for (k=zeros+1; k<j; k++)
    1283             :           {
    1284       17410 :             GEN x = mulir(X, gmael(mu,j,k));
    1285       17410 :             if (e) shiftr_inplace(x, e);
    1286       17410 :             affrr(subrr(gmael(mu,kappa,k), x), gmael(mu,kappa,k));
    1287             :           }
    1288       12139 :           set_avma(btop);
    1289       99264 :           for (i=1; i<=n; i++)
    1290       87125 :             gmael(B,kappa,i) = submulshift(gmael(B,kappa,i), gmael(B,j,i), X, e);
    1291       73246 :           for (i=1; i<=d; i++)
    1292       61107 :             gmael(U,kappa,i) = submulshift(gmael(U,kappa,i), gmael(U,j,i), X, e);
    1293             :         }
    1294             :       }
    1295      484978 :     if (!go_on) break; /* Anything happened? */
    1296     1463967 :     for (i=1 ; i<=n; i++) affir(gmael(B,kappa,i), gmael(appB,kappa,i));
    1297      196566 :     setG_heuristic(appB, G, kappa, zeros+1, kappa-1);
    1298      196566 :     aa = zeros+1;
    1299             :   }
    1300      288412 :   if (did_something) setG2_heuristic(appB, G, kappa, kappa, maxG);
    1301      288412 :   affrr(gmael(G,kappa,kappa), gel(s,zeros+1));
    1302             :   /* the last s[kappa-1]=r[kappa][kappa] is computed only if kappa increases */
    1303      288412 :   av = avma;
    1304     1026584 :   for (k=zeros+1; k<=kappa-2; k++)
    1305      738172 :     affrr(subrr(gel(s,k), mulrr(gmael(mu,kappa,k), gmael(r,kappa,k))),
    1306      738172 :           gel(s,k+1));
    1307      288412 :   *pB = B; *pU = U; return gc_bool(av, 0);
    1308             : }
    1309             : 
    1310             : static GEN
    1311       15952 : ZC_to_RC(GEN x, long prec)
    1312      104207 : { pari_APPLY_type(t_COL,itor(gel(x,i),prec)) }
    1313             : 
    1314             : static GEN
    1315        4246 : ZM_to_RM(GEN x, long prec)
    1316       20198 : { pari_APPLY_same(ZC_to_RC(gel(x,i),prec)) }
    1317             : 
    1318             : /* LLL-reduces (B,U) in place [apply base change transforms to B and U].
    1319             :  * Gram matrix made of t_REAL at precision prec2, performe GSO at prec.
    1320             :  * If (keepfirst), never swap with first vector.
    1321             :  * Return -1 on failure, else zeros = dim Kernel (>= 0) */
    1322             : static long
    1323        4246 : fplll_heuristic(GEN *pB, GEN *pU, double DELTA, double ETA, long keepfirst,
    1324             :                 long prec, long prec2)
    1325             : {
    1326             :   pari_sp av, av2;
    1327             :   long kappa, kappa2, d, i, j, zeros, kappamax, maxG;
    1328        4246 :   GEN mu, r, s, tmp, Gtmp, alpha, G, appB, B = *pB, U;
    1329        4246 :   GEN delta = dbltor(DELTA), eta = dbltor(ETA);
    1330        4246 :   long cnt = 0;
    1331             : 
    1332        4246 :   d = lg(B)-1;
    1333        4246 :   U = *pU; /* NULL if inplace */
    1334             : 
    1335        4246 :   G = cgetg(d+1, t_MAT);
    1336        4246 :   mu = cgetg(d+1, t_MAT);
    1337        4246 :   r  = cgetg(d+1, t_MAT);
    1338        4246 :   s  = cgetg(d+1, t_VEC);
    1339        4246 :   appB = ZM_to_RM(B, prec2);
    1340       20198 :   for (j = 1; j <= d; j++)
    1341             :   {
    1342       15952 :     GEN M = cgetg(d+1, t_COL), R = cgetg(d+1, t_COL), S = cgetg(d+1, t_COL);
    1343       15952 :     gel(mu,j)= M;
    1344       15952 :     gel(r,j) = R;
    1345       15952 :     gel(G,j) = S;
    1346       15952 :     gel(s,j) = cgetr(prec);
    1347       95758 :     for (i = 1; i <= d; i++)
    1348             :     {
    1349       79806 :       gel(R,i) = cgetr(prec);
    1350       79806 :       gel(M,i) = cgetr(prec);
    1351       79806 :       gel(S,i) = cgetr(prec2);
    1352             :     }
    1353             :   }
    1354        4246 :   Gtmp = cgetg(d+1, t_VEC);
    1355        4246 :   alpha = cgetg(d+1, t_VECSMALL);
    1356        4246 :   av = avma;
    1357             : 
    1358             :   /* Step2: Initializing the main loop */
    1359        4246 :   kappamax = 1;
    1360        4246 :   i = 1;
    1361        4246 :   maxG = d; /* later updated to kappamax */
    1362             : 
    1363             :   do {
    1364        4249 :     affrr(RgV_dotsquare(gel(appB,i)), gmael(G,i,i));
    1365        4249 :   } while (signe(gmael(G,i,i)) == 0 && (++i <=d));
    1366        4246 :   zeros = i-1; /* all vectors B[i] with i <= zeros are zero vectors */
    1367        4246 :   kappa = i;
    1368        4246 :   if (zeros < d) affrr(gmael(G,zeros+1,zeros+1), gmael(r,zeros+1,zeros+1));
    1369       20195 :   for (i=zeros+1; i<=d; i++) alpha[i]=1;
    1370             : 
    1371      292658 :   while (++kappa <= d)
    1372             :   {
    1373      289747 :     if (kappa > kappamax)
    1374             :     {
    1375        9808 :       if (DEBUGLEVEL>=4) err_printf("K%ld ",kappa);
    1376        9808 :       maxG = kappamax = kappa;
    1377        9808 :       setG_heuristic(appB, G, kappa, zeros+1, kappa);
    1378             :     }
    1379             :     /* Step3: Call to the Babai algorithm, mu,r,s updated in place */
    1380      289747 :     if (Babai_heuristic(av, kappa, &B,&U, mu,r,s, appB, G, alpha[kappa], zeros,
    1381        1335 :                         maxG, eta, prec)) { *pB = B; *pU = U; return -1; }
    1382      288412 :     av2 = avma;
    1383      576710 :     if ((keepfirst && kappa == 2) ||
    1384      288298 :         cmprr(mulrr(gmael(r,kappa-1,kappa-1), delta), gel(s,kappa-1)) <= 0)
    1385             :     { /* Step4: Success of Lovasz's condition */
    1386      170932 :       alpha[kappa] = kappa;
    1387      170932 :       tmp = mulrr(gmael(mu,kappa,kappa-1), gmael(r,kappa,kappa-1));
    1388      170932 :       affrr(subrr(gel(s,kappa-1), tmp), gmael(r,kappa,kappa));
    1389      170932 :       set_avma(av2); continue;
    1390             :     }
    1391             :     /* Step5: Find the right insertion index kappa, kappa2 = initial kappa */
    1392      117480 :     if (DEBUGLEVEL>=4 && kappa==kappamax && signe(gel(s,kappa-1)))
    1393           0 :       if (++cnt > 20) { cnt = 0; err_printf("(%ld) ", expo(gel(s,1))); }
    1394      117480 :     kappa2 = kappa;
    1395             :     do {
    1396      279967 :       kappa--;
    1397      279967 :       if (kappa < zeros+2 + (keepfirst ? 1: 0)) break;
    1398      249414 :       tmp = mulrr(gmael(r,kappa-1,kappa-1), delta);
    1399      249414 :     } while (cmprr(gel(s,kappa-1), tmp) <= 0 );
    1400      117480 :     set_avma(av2);
    1401      117480 :     update_alpha(alpha, kappa, kappa2, kappamax);
    1402             : 
    1403             :     /* Step6: Update the mu's and r's */
    1404      117480 :     rotate(mu,kappa2,kappa);
    1405      117480 :     rotate(r,kappa2,kappa);
    1406      117480 :     affrr(gel(s,kappa), gmael(r,kappa,kappa));
    1407             : 
    1408             :     /* Step7: Update B, appB, U, G */
    1409      117480 :     rotate(B,kappa2,kappa);
    1410      117480 :     rotate(appB,kappa2,kappa);
    1411      117480 :     if (U) rotate(U,kappa2,kappa);
    1412      117480 :     rotateG(G,kappa2,kappa, maxG, Gtmp);
    1413             : 
    1414             :     /* Step8: Prepare the next loop iteration */
    1415      117480 :     if (kappa == zeros+1 && !signe(gmael(G,kappa,kappa)))
    1416             :     {
    1417           0 :       zeros++; kappa++;
    1418           0 :       affrr(RgV_dotsquare(gel(appB,kappa)), gmael(G,kappa,kappa));
    1419           0 :       affrr(gmael(G,kappa,kappa), gmael(r,kappa,kappa));
    1420             :     }
    1421             :   }
    1422        2911 :   *pB=B; *pU=U; return zeros;
    1423             : }
    1424             : 
    1425             : /************************* PROVED version (t_INT) ***********************/
    1426             : /* dpe inspired by dpe.h by Patrick Pelissier, Paul Zimmermann
    1427             :  * https://gforge.inria.fr/projects/dpe/
    1428             :  */
    1429             : 
    1430             : typedef struct
    1431             : {
    1432             :   double d;  /* significand */
    1433             :   long e; /* exponent */
    1434             : } dpe_t;
    1435             : 
    1436             : #define Dmael(x,i,j) (&((x)[i][j]))
    1437             : #define Del(x,i) (&((x)[i]))
    1438             : 
    1439             : static void
    1440      652350 : dperotate(dpe_t **A, long k2, long k)
    1441             : {
    1442             :   long i;
    1443      652350 :   dpe_t *B = A[k2];
    1444     2312226 :   for (i = k2; i > k; i--) A[i] = A[i-1];
    1445      652350 :   A[k] = B;
    1446      652350 : }
    1447             : 
    1448             : static void
    1449   108562642 : dpe_normalize0(dpe_t *x)
    1450             : {
    1451             :   int e;
    1452   108562642 :   x->d = frexp(x->d, &e);
    1453   108562642 :   x->e += e;
    1454   108562642 : }
    1455             : 
    1456             : static void
    1457    48108636 : dpe_normalize(dpe_t *x)
    1458             : {
    1459    48108636 :   if (x->d == 0.0)
    1460      497550 :     x->e = -LONG_MAX;
    1461             :   else
    1462    47611086 :     dpe_normalize0(x);
    1463    48108700 : }
    1464             : 
    1465             : static GEN
    1466       93802 : dpetor(dpe_t *x)
    1467             : {
    1468       93802 :   GEN r = dbltor(x->d);
    1469       93802 :   if (signe(r)==0) return r;
    1470       93802 :   setexpo(r, x->e-1);
    1471       93802 :   return r;
    1472             : }
    1473             : 
    1474             : static void
    1475    25730609 : affdpe(dpe_t *y, dpe_t *x)
    1476             : {
    1477    25730609 :   x->d = y->d;
    1478    25730609 :   x->e = y->e;
    1479    25730609 : }
    1480             : 
    1481             : static void
    1482    20751814 : affidpe(GEN y, dpe_t *x)
    1483             : {
    1484    20751814 :   pari_sp av = avma;
    1485    20751814 :   GEN r = itor(y, DEFAULTPREC);
    1486    20751588 :   x->e = expo(r)+1;
    1487    20751588 :   setexpo(r,-1);
    1488    20751537 :   x->d = rtodbl(r);
    1489    20751526 :   set_avma(av);
    1490    20751481 : }
    1491             : 
    1492             : static void
    1493     3206859 : affdbldpe(double y, dpe_t *x)
    1494             : {
    1495     3206859 :   x->d = (double)y;
    1496     3206859 :   x->e = 0;
    1497     3206859 :   dpe_normalize(x);
    1498     3206864 : }
    1499             : 
    1500             : static void
    1501    56963804 : dpe_mulz(dpe_t *x, dpe_t *y, dpe_t *z)
    1502             : {
    1503    56963804 :   z->d = x->d * y->d;
    1504    56963804 :   if (z->d == 0.0)
    1505     8169657 :     z->e = -LONG_MAX;
    1506             :   else
    1507             :   {
    1508    48794147 :     z->e = x->e + y->e;
    1509    48794147 :     dpe_normalize0(z);
    1510             :   }
    1511    56964056 : }
    1512             : 
    1513             : static void
    1514    14075817 : dpe_divz(dpe_t *x, dpe_t *y, dpe_t *z)
    1515             : {
    1516    14075817 :   z->d = x->d / y->d;
    1517    14075817 :   if (z->d == 0.0)
    1518     1918123 :     z->e = -LONG_MAX;
    1519             :   else
    1520             :   {
    1521    12157694 :     z->e = x->e - y->e;
    1522    12157694 :     dpe_normalize0(z);
    1523             :   }
    1524    14075893 : }
    1525             : 
    1526             : static void
    1527      244361 : dpe_negz(dpe_t *y, dpe_t *x)
    1528             : {
    1529      244361 :   x->d = - y->d;
    1530      244361 :   x->e = y->e;
    1531      244361 : }
    1532             : 
    1533             : static void
    1534     1943120 : dpe_addz(dpe_t *y, dpe_t *z, dpe_t *x)
    1535             : {
    1536     1943120 :   if (y->e > z->e + 53)
    1537      112266 :     affdpe(y, x);
    1538     1830854 :   else if (z->e > y->e + 53)
    1539       41675 :     affdpe(z, x);
    1540             :   else
    1541             :   {
    1542     1789179 :     long d = y->e - z->e;
    1543             : 
    1544     1789179 :     if (d >= 0)
    1545             :     {
    1546     1344830 :       x->d = y->d + ldexp(z->d, -d);
    1547     1344830 :       x->e  = y->e;
    1548             :     }
    1549             :     else
    1550             :     {
    1551      444349 :       x->d = z->d + ldexp(y->d, d);
    1552      444349 :       x->e = z->e;
    1553             :     }
    1554     1789179 :     dpe_normalize(x);
    1555             :   }
    1556     1943120 : }
    1557             : static void
    1558    53731778 : dpe_subz(dpe_t *y, dpe_t *z, dpe_t *x)
    1559             : {
    1560    53731778 :   if (y->e > z->e + 53)
    1561    11174815 :     affdpe(y, x);
    1562    42556963 :   else if (z->e > y->e + 53)
    1563      244361 :     dpe_negz(z, x);
    1564             :   else
    1565             :   {
    1566    42312602 :     long d = y->e - z->e;
    1567             : 
    1568    42312602 :     if (d >= 0)
    1569             :     {
    1570    39551953 :       x->d = y->d - ldexp(z->d, -d);
    1571    39551953 :       x->e = y->e;
    1572             :     }
    1573             :     else
    1574             :     {
    1575     2760649 :       x->d = ldexp(y->d, d) - z->d;
    1576     2760649 :       x->e = z->e;
    1577             :     }
    1578    42312602 :     dpe_normalize(x);
    1579             :   }
    1580    53732012 : }
    1581             : 
    1582             : static void
    1583      799872 : dpe_muluz(dpe_t *y, ulong t, dpe_t *x)
    1584             : {
    1585      799872 :   x->d = y->d * (double)t;
    1586      799872 :   x->e = y->e;
    1587      799872 :   dpe_normalize(x);
    1588      799872 : }
    1589             : 
    1590             : static void
    1591      342913 : dpe_addmuluz(dpe_t *y,  dpe_t *z, ulong t, dpe_t *x)
    1592             : {
    1593             :   dpe_t tmp;
    1594      342913 :   dpe_muluz(z, t, &tmp);
    1595      342913 :   dpe_addz(y, &tmp, x);
    1596      342913 : }
    1597             : 
    1598             : static void
    1599      412411 : dpe_submuluz(dpe_t *y,  dpe_t *z, ulong t, dpe_t *x)
    1600             : {
    1601             :   dpe_t tmp;
    1602      412411 :   dpe_muluz(z, t, &tmp);
    1603      412411 :   dpe_subz(y, &tmp, x);
    1604      412411 : }
    1605             : 
    1606             : static void
    1607    51700682 : dpe_submulz(dpe_t *y,  dpe_t *z, dpe_t *t, dpe_t *x)
    1608             : {
    1609             :   dpe_t tmp;
    1610    51700682 :   dpe_mulz(z, t, &tmp);
    1611    51700672 :   dpe_subz(y, &tmp, x);
    1612    51700701 : }
    1613             : 
    1614             : static int
    1615     5263268 : dpe_cmp(dpe_t *x, dpe_t *y)
    1616             : {
    1617     5263268 :   int sx = x->d < 0. ? -1: x->d > 0.;
    1618     5263268 :   int sy = y->d < 0. ? -1: y->d > 0.;
    1619     5263268 :   int d  = sx - sy;
    1620             : 
    1621     5263268 :   if (d != 0)
    1622      141626 :     return d;
    1623     5121642 :   else if (x->e > y->e)
    1624      481839 :     return (sx > 0) ? 1 : -1;
    1625     4639803 :   else if (y->e > x->e)
    1626     2551738 :     return (sx > 0) ? -1 : 1;
    1627             :   else
    1628     2088065 :     return (x->d < y->d) ? -1 : (x->d > y->d);
    1629             : }
    1630             : 
    1631             : static int
    1632    14516265 : dpe_abscmp(dpe_t *x, dpe_t *y)
    1633             : {
    1634    14516265 :   if (x->e > y->e)
    1635      271989 :     return 1;
    1636    14244276 :   else if (y->e > x->e)
    1637    13387805 :     return -1;
    1638             :   else
    1639      856471 :     return (fabs(x->d) < fabs(y->d)) ? -1 : (fabs(x->d) > fabs(y->d));
    1640             : }
    1641             : 
    1642             : static int
    1643     1390418 : dpe_abssmall(dpe_t *x)
    1644             : {
    1645     1390418 :   return (x->e <= 0) || (x->e == 1 && fabs(x->d) <= .75);
    1646             : }
    1647             : 
    1648             : static int
    1649     5263264 : dpe_cmpmul(dpe_t *x, dpe_t *y, dpe_t *z)
    1650             : {
    1651             :   dpe_t t;
    1652     5263264 :   dpe_mulz(x,y,&t);
    1653     5263266 :   return dpe_cmp(&t, z);
    1654             : }
    1655             : 
    1656             : static dpe_t *
    1657    13295901 : cget_dpevec(long d)
    1658    13295901 : { return (dpe_t*) stack_malloc_align(d*sizeof(dpe_t), sizeof(dpe_t)); }
    1659             : 
    1660             : static dpe_t **
    1661     3206854 : cget_dpemat(long d) { return (dpe_t **) cgetg(d, t_VECSMALL); }
    1662             : 
    1663             : static GEN
    1664       20147 : dpeM_diagonal_shallow(dpe_t **m, long d)
    1665             : {
    1666             :   long i;
    1667       20147 :   GEN y = cgetg(d+1,t_VEC);
    1668      113949 :   for (i=1; i<=d; i++) gel(y, i) = dpetor(Dmael(m,i,i));
    1669       20147 :   return y;
    1670             : }
    1671             : 
    1672             : static void
    1673     1390409 : affii_or_copy_gc(pari_sp av, GEN x, GEN *y)
    1674             : {
    1675     1390409 :   long l = lg(*y);
    1676     1390409 :   if (lgefint(x) <= l && isonstack(*y))
    1677             :   {
    1678     1390395 :     affii(x,*y);
    1679     1390398 :     set_avma(av);
    1680             :   }
    1681             :   else
    1682          12 :     *y = gc_INT(av, x);
    1683     1390412 : }
    1684             : 
    1685             : /* *x -= u*y */
    1686             : INLINE void
    1687     5923043 : submulziu(GEN *x, GEN y, ulong u)
    1688             : {
    1689             :   pari_sp av;
    1690     5923043 :   long ly = lgefint(y);
    1691     5923043 :   if (ly == 2) return;
    1692     3254018 :   av = avma;
    1693     3254018 :   (void)new_chunk(3+ly+lgefint(*x)); /* HACK */
    1694     3254185 :   y = mului(u,y);
    1695     3254149 :   set_avma(av); subzi(x, y);
    1696             : }
    1697             : 
    1698             : /* *x += u*y */
    1699             : INLINE void
    1700     4580722 : addmulziu(GEN *x, GEN y, ulong u)
    1701             : {
    1702             :   pari_sp av;
    1703     4580722 :   long ly = lgefint(y);
    1704     4580722 :   if (ly == 2) return;
    1705     2758207 :   av = avma;
    1706     2758207 :   (void)new_chunk(3+ly+lgefint(*x)); /* HACK */
    1707     2758276 :   y = mului(u,y);
    1708     2758255 :   set_avma(av); addzi(x, y);
    1709             : }
    1710             : 
    1711             : /************************** PROVED version (dpe) *************************/
    1712             : 
    1713             : /* Babai's Nearest Plane algorithm (iterative).
    1714             :  * Size-reduces b_kappa using mu_{i,j} and r_{i,j} for j<=i <kappa
    1715             :  * Update B[,kappa]; compute mu_{kappa,j}, r_{kappa,j} for j<=kappa and s[kappa]
    1716             :  * mu, r, s updated in place (affrr). Return 1 on failure, else 0. */
    1717             : static int
    1718     4654910 : Babai_dpe(pari_sp av, long kappa, GEN *pG, GEN *pB, GEN *pU, dpe_t **mu, dpe_t **r, dpe_t *s,
    1719             :       long a, long zeros, long maxG, dpe_t *eta)
    1720             : {
    1721     4654910 :   GEN G = *pG, B = *pB, U = *pU, ztmp;
    1722     4654910 :   long k, d, n, aa = a > zeros? a: zeros+1;
    1723     4654910 :   long emaxmu = EX0, emax2mu = EX0;
    1724             :   /* N.B: we set d = 0 (resp. n = 0) to avoid updating U (resp. B) */
    1725     4654910 :   d = U? lg(U)-1: 0;
    1726     4654910 :   n = B? nbrows(B): 0;
    1727      523350 :   for (;;) {
    1728     5178282 :     int go_on = 0;
    1729     5178282 :     long i, j, emax3mu = emax2mu;
    1730             : 
    1731     5178282 :     if (gc_needed(av,2))
    1732             :     {
    1733           0 :       if(DEBUGMEM>1) pari_warn(warnmem,"Babai[1], a=%ld", aa);
    1734           0 :       gc_lll(av,3,&G,&B,&U);
    1735             :     }
    1736             :     /* Step2: compute the GSO for stage kappa */
    1737     5178265 :     emax2mu = emaxmu; emaxmu = EX0;
    1738    19254128 :     for (j=aa; j<kappa; j++)
    1739             :     {
    1740             :       dpe_t g;
    1741    14075843 :       affidpe(gmael(G,kappa,j), &g);
    1742    52515013 :       for (k = zeros+1; k < j; k++)
    1743    38439244 :         dpe_submulz(&g, Dmael(mu,j,k), Dmael(r,kappa,k), &g);
    1744    14075769 :       affdpe(&g, Dmael(r,kappa,j));
    1745    14075816 :       dpe_divz(Dmael(r,kappa,j), Dmael(r,j,j), Dmael(mu,kappa,j));
    1746    14075824 :       emaxmu = maxss(emaxmu, Dmael(mu,kappa,j)->e);
    1747             :     }
    1748     5178285 :     if (emax3mu != EX0 && emax3mu <= emax2mu + 5) /* precision too low */
    1749           0 :     { *pG = G; *pB = B; *pU = U; return 1; }
    1750             : 
    1751    19171203 :     for (j=kappa-1; j>zeros; j--)
    1752    14516265 :       if (dpe_abscmp(Dmael(mu,kappa,j), eta) > 0) { go_on = 1; break; }
    1753             : 
    1754             :     /* Step3--5: compute the X_j's  */
    1755     5178285 :     if (go_on)
    1756     3034854 :       for (j=kappa-1; j>zeros; j--)
    1757             :       {
    1758             :         pari_sp btop;
    1759     2511503 :         dpe_t *tmp = Dmael(mu,kappa,j);
    1760     2511503 :         if (tmp->e < 0) continue; /* (essentially) size-reduced */
    1761             : 
    1762     1390417 :         if (gc_needed(av,2))
    1763             :         {
    1764           0 :           if(DEBUGMEM>1) pari_warn(warnmem,"Babai[2], a=%ld, j=%ld", aa,j);
    1765           0 :           gc_lll(av,3,&G,&B,&U);
    1766             :         }
    1767             :         /* we consider separately the case |X| = 1 */
    1768     1390417 :         if (dpe_abssmall(tmp))
    1769             :         {
    1770      922224 :           if (tmp->d > 0) { /* in this case, X = 1 */
    1771     2059144 :             for (k=zeros+1; k<j; k++)
    1772     1596788 :               dpe_subz(Dmael(mu,kappa,k), Dmael(mu,j,k), Dmael(mu,kappa,k));
    1773     3018266 :             for (i=1; i<=n; i++)
    1774     2555910 :               subzi(&gmael(B,kappa,i), gmael(B,j,i));
    1775     6974870 :             for (i=1; i<=d; i++)
    1776     6512516 :               subzi(&gmael(U,kappa,i), gmael(U,j,i));
    1777      462354 :             btop = avma;
    1778      462354 :             ztmp = subii(gmael(G,j,j), shifti(gmael(G,kappa,j), 1));
    1779      462354 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1780      462353 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1781     2861692 :             for (i=1; i<=j; i++)
    1782     2399335 :               subzi(&gmael(G,kappa,i), gmael(G,j,i));
    1783     2193128 :             for (i=j+1; i<kappa; i++)
    1784     1730774 :               subzi(&gmael(G,kappa,i), gmael(G,i,j));
    1785     2362127 :             for (i=kappa+1; i<=maxG; i++)
    1786     1899773 :               subzi(&gmael(G,i,kappa), gmael(G,i,j));
    1787             :           } else { /* otherwise X = -1 */
    1788     2037461 :             for (k=zeros+1; k<j; k++)
    1789     1577593 :               dpe_addz(Dmael(mu,kappa,k), Dmael(mu,j,k), Dmael(mu,kappa,k));
    1790     3013574 :             for (i=1; i<=n; i++)
    1791     2553706 :               addzi(&gmael(B,kappa,i),gmael(B,j,i));
    1792     6848065 :             for (i=1; i<=d; i++)
    1793     6388209 :               addzi(&gmael(U,kappa,i),gmael(U,j,i));
    1794      459856 :             btop = avma;
    1795      459856 :             ztmp = addii(gmael(G,j,j), shifti(gmael(G,kappa,j), 1));
    1796      459864 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1797      459865 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1798     2772713 :             for (i=1; i<=j; i++)
    1799     2312845 :               addzi(&gmael(G,kappa,i), gmael(G,j,i));
    1800     2196912 :             for (i=j+1; i<kappa; i++)
    1801     1737041 :               addzi(&gmael(G,kappa,i), gmael(G,i,j));
    1802     2314811 :             for (i=kappa+1; i<=maxG; i++)
    1803     1854940 :               addzi(&gmael(G,i,kappa), gmael(G,i,j));
    1804             :           }
    1805      922225 :           continue;
    1806             :         }
    1807             :         /* we have |X| >= 2 */
    1808      468195 :         if (tmp->e < BITS_IN_LONG-1)
    1809             :         {
    1810      449195 :           if (tmp->d > 0)
    1811             :           {
    1812      247684 :             ulong xx = (ulong) pari_rint(ldexp(tmp->d, tmp->e)); /* X fits in an ulong */
    1813      660095 :             for (k=zeros+1; k<j; k++)
    1814      412411 :               dpe_submuluz(Dmael(mu,kappa,k), Dmael(mu,j,k), xx, Dmael(mu,kappa,k));
    1815      722688 :             for (i=1; i<=n; i++)
    1816      475004 :               submulziu(&gmael(B,kappa,i), gmael(B,j,i), xx);
    1817     3109696 :             for (i=1; i<=d; i++)
    1818     2862002 :               submulziu(&gmael(U,kappa,i), gmael(U,j,i), xx);
    1819      247694 :             btop = avma;
    1820      247694 :             ztmp = submuliu2n(mulii(gmael(G,j,j), sqru(xx)), gmael(G,kappa,j), xx, 1);
    1821      247681 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1822      247684 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1823     1315259 :             for (i=1; i<=j; i++)
    1824     1067581 :               submulziu(&gmael(G,kappa,i), gmael(G,j,i), xx);
    1825      808501 :             for (i=j+1; i<kappa; i++)
    1826      560823 :               submulziu(&gmael(G,kappa,i), gmael(G,i,j), xx);
    1827     1205555 :             for (i=kappa+1; i<=maxG; i++)
    1828      957882 :               submulziu(&gmael(G,i,kappa), gmael(G,i,j), xx);
    1829             :           }
    1830             :           else
    1831             :           {
    1832      201511 :             ulong xx = (ulong) pari_rint(ldexp(-tmp->d, tmp->e)); /* X fits in an ulong */
    1833      544426 :             for (k=zeros+1; k<j; k++)
    1834      342913 :               dpe_addmuluz(Dmael(mu,kappa,k), Dmael(mu,j,k), xx, Dmael(mu,kappa,k));
    1835      688375 :             for (i=1; i<=n; i++)
    1836      486862 :               addmulziu(&gmael(B,kappa,i), gmael(B,j,i), xx);
    1837     2361699 :             for (i=1; i<=d; i++)
    1838     2160180 :               addmulziu(&gmael(U,kappa,i), gmael(U,j,i), xx);
    1839      201519 :             btop = avma;
    1840      201519 :             ztmp = addmuliu2n(mulii(gmael(G,j,j), sqru(xx)), gmael(G,kappa,j), xx, 1);
    1841      201512 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1842      201511 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1843      991317 :             for (i=1; i<=j; i++)
    1844      789807 :               addmulziu(&gmael(G,kappa,i), gmael(G,j,i), xx);
    1845      663172 :             for (i=j+1; i<kappa; i++)
    1846      461660 :               addmulziu(&gmael(G,kappa,i), gmael(G,i,j), xx);
    1847      883793 :             for (i=kappa+1; i<=maxG; i++)
    1848      682281 :               addmulziu(&gmael(G,i,kappa), gmael(G,i,j), xx);
    1849             :           }
    1850             :         }
    1851             :         else
    1852             :         {
    1853       19000 :           long e = tmp->e - BITS_IN_LONG + 1;
    1854       19000 :           if (tmp->d > 0)
    1855             :           {
    1856        9381 :             ulong xx = (ulong) pari_rint(ldexp(tmp->d, BITS_IN_LONG - 1));
    1857       31318 :             for (k=zeros+1; k<j; k++)
    1858             :             {
    1859             :               dpe_t x;
    1860       21937 :               dpe_muluz(Dmael(mu,j,k), xx, &x);
    1861       21937 :               x.e += e;
    1862       21937 :               dpe_subz(Dmael(mu,kappa,k), &x, Dmael(mu,kappa,k));
    1863             :             }
    1864      124141 :             for (i=1; i<=n; i++)
    1865      114760 :               submulzu2n(&gmael(B,kappa,i), gmael(B,j,i), xx, e);
    1866       86854 :             for (i=1; i<=d; i++)
    1867       77473 :               submulzu2n(&gmael(U,kappa,i), gmael(U,j,i), xx, e);
    1868        9381 :             btop = avma;
    1869        9381 :             ztmp = submuliu2n(mulshift(gmael(G,j,j), sqru(xx), 2*e),
    1870        9381 :                 gmael(G,kappa,j), xx, e+1);
    1871        9381 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1872        9381 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1873       40897 :             for (i=1; i<=j; i++)
    1874       31516 :               submulzu2n(&gmael(G,kappa,i), gmael(G,j,i), xx, e);
    1875       47307 :             for (   ; i<kappa; i++)
    1876       37926 :               submulzu2n(&gmael(G,kappa,i), gmael(G,i,j), xx, e);
    1877       10255 :             for (i=kappa+1; i<=maxG; i++)
    1878         874 :               submulzu2n(&gmael(G,i,kappa), gmael(G,i,j), xx, e);
    1879             :           } else
    1880             :           {
    1881        9619 :             ulong xx = (ulong) pari_rint(ldexp(-tmp->d, BITS_IN_LONG - 1));
    1882       32244 :             for (k=zeros+1; k<j; k++)
    1883             :             {
    1884             :               dpe_t x;
    1885       22614 :               dpe_muluz(Dmael(mu,j,k), xx, &x);
    1886       22614 :               x.e += e;
    1887       22614 :               dpe_addz(Dmael(mu,kappa,k), &x, Dmael(mu,kappa,k));
    1888             :             }
    1889      128739 :             for (i=1; i<=n; i++)
    1890      119109 :               addmulzu2n(&gmael(B,kappa,i), gmael(B,j,i), xx, e);
    1891       89526 :             for (i=1; i<=d; i++)
    1892       79896 :               addmulzu2n(&gmael(U,kappa,i), gmael(U,j,i), xx, e);
    1893        9630 :             btop = avma;
    1894        9630 :             ztmp = addmuliu2n(mulshift(gmael(G,j,j), sqru(xx), 2*e),
    1895        9630 :                 gmael(G,kappa,j), xx, e+1);
    1896        9630 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    1897        9630 :             affii_or_copy_gc(btop, ztmp, &gmael(G,kappa,kappa));
    1898       42072 :             for (i=1; i<=j; i++)
    1899       32442 :               addmulzu2n(&gmael(G,kappa,i), gmael(G,j,i), xx, e);
    1900       48988 :             for (   ; i<kappa; i++)
    1901       39358 :               addmulzu2n(&gmael(G,kappa,i), gmael(G,i,j), xx, e);
    1902       10388 :             for (i=kappa+1; i<=maxG; i++)
    1903         758 :               addmulzu2n(&gmael(G,i,kappa), gmael(G,i,j), xx, e);
    1904             :           }
    1905             :         }
    1906             :       }
    1907     5178289 :     if (!go_on) break; /* Anything happened? */
    1908      523350 :     aa = zeros+1;
    1909             :   }
    1910             : 
    1911     4654939 :   affidpe(gmael(G,kappa,kappa), Del(s,zeros+1));
    1912             :   /* the last s[kappa-1]=r[kappa][kappa] is computed only if kappa increases */
    1913    13587845 :   for (k=zeros+1; k<=kappa-2; k++)
    1914     8932928 :     dpe_submulz(Del(s,k), Dmael(mu,kappa,k), Dmael(r,kappa,k), Del(s,k+1));
    1915     4654917 :   *pG = G; *pB = B; *pU = U; return 0;
    1916             : }
    1917             : 
    1918             : /* G integral Gram matrix, LLL-reduces (G,B,U) in place [apply base change
    1919             :  * transforms to B and U]. If (keepfirst), never swap with first vector.
    1920             :  * If G = NULL, we compute the Gram matrix incrementally.
    1921             :  * Return -1 on failure, else zeros = dim Kernel (>= 0) */
    1922             : static long
    1923     1603431 : fplll_dpe(GEN *pG, GEN *pB, GEN *pU, GEN *pr, double DELTA, double ETA,
    1924             :       long keepfirst)
    1925             : {
    1926             :   pari_sp av;
    1927     1603431 :   GEN Gtmp, alpha, G = *pG, B = *pB, U = *pU;
    1928     1603431 :   long d, maxG, kappa, kappa2, i, j, zeros, kappamax, incgram = !G, cnt = 0;
    1929             :   dpe_t delta, eta, **mu, **r, *s;
    1930     1603431 :   affdbldpe(DELTA,&delta);
    1931     1603435 :   affdbldpe(ETA,&eta);
    1932             : 
    1933     1603434 :   if (incgram)
    1934             :   { /* incremental Gram matrix */
    1935     1542896 :     maxG = 2; d = lg(B)-1;
    1936     1542896 :     G = zeromatcopy(d, d);
    1937             :   }
    1938             :   else
    1939       60538 :     maxG = d = lg(G)-1;
    1940             : 
    1941     1603430 :   mu = cget_dpemat(d+1);
    1942     1603429 :   r  = cget_dpemat(d+1);
    1943     1603422 :   s  = cget_dpevec(d+1);
    1944     7449693 :   for (j = 1; j <= d; j++)
    1945             :   {
    1946     5846272 :     mu[j]= cget_dpevec(d+1);
    1947     5846261 :     r[j] = cget_dpevec(d+1);
    1948             :   }
    1949     1603421 :   Gtmp = cgetg(d+1, t_VEC);
    1950     1603422 :   alpha = cgetg(d+1, t_VECSMALL);
    1951     1603418 :   av = avma;
    1952             : 
    1953             :   /* Step2: Initializing the main loop */
    1954     1603418 :   kappamax = 1;
    1955     1603418 :   i = 1;
    1956             :   do {
    1957     1986074 :     if (incgram) gmael(G,i,i) = ZV_dotsquare(gel(B,i));
    1958     1986048 :     affidpe(gmael(G,i,i), Dmael(r,i,i));
    1959     1986060 :   } while (!signe(gmael(G,i,i)) && ++i <= d);
    1960     1603404 :   zeros = i-1; /* all basis vectors b_i with i <= zeros are zero vectors */
    1961     1603404 :   kappa = i;
    1962     7066971 :   for (i=zeros+1; i<=d; i++) alpha[i]=1;
    1963             : 
    1964     6258361 :   while (++kappa <= d)
    1965             :   {
    1966     4654943 :     if (kappa > kappamax)
    1967             :     {
    1968     3860171 :       if (DEBUGLEVEL>=4) err_printf("K%ld ",kappa);
    1969     3860171 :       kappamax = kappa;
    1970     3860171 :       if (incgram)
    1971             :       {
    1972    16161764 :         for (i=zeros+1; i<=kappa; i++)
    1973    12501954 :           gmael(G,kappa,i) = ZV_dotproduct(gel(B,kappa), gel(B,i));
    1974     3659810 :         maxG = kappamax;
    1975             :       }
    1976             :     }
    1977             :     /* Step3: Call to the Babai algorithm, mu,r,s updated in place */
    1978     4654667 :     if (Babai_dpe(av, kappa, &G,&B,&U, mu,r,s, alpha[kappa], zeros, maxG, &eta))
    1979           0 :     { *pG = incgram? NULL: G; *pB = B; *pU = U; return -1; }
    1980     9210173 :     if ((keepfirst && kappa == 2) ||
    1981     4555235 :         dpe_cmpmul(Dmael(r,kappa-1,kappa-1), &delta, Del(s,kappa-1)) <= 0)
    1982             :     { /* Step4: Success of Lovasz's condition */
    1983     4328763 :       alpha[kappa] = kappa;
    1984     4328763 :       dpe_submulz(Del(s,kappa-1), Dmael(mu,kappa,kappa-1), Dmael(r,kappa,kappa-1), Dmael(r,kappa,kappa));
    1985     4328765 :       continue;
    1986             :     }
    1987             :     /* Step5: Find the right insertion index kappa, kappa2 = initial kappa */
    1988      326175 :     if (DEBUGLEVEL>=4 && kappa==kappamax && Del(s,kappa-1)->d)
    1989           0 :       if (++cnt > 20) { cnt = 0; err_printf("(%ld) ", Del(s,1)->e-1); }
    1990      326175 :     kappa2 = kappa;
    1991             :     do {
    1992      829938 :       kappa--;
    1993      829938 :       if (kappa < zeros+2 + (keepfirst ? 1: 0)) break;
    1994      708019 :     } while (dpe_cmpmul(Dmael(r,kappa-1,kappa-1), &delta, Del(s,kappa-1)) >= 0);
    1995      326175 :     update_alpha(alpha, kappa, kappa2, kappamax);
    1996             : 
    1997             :     /* Step6: Update the mu's and r's */
    1998      326175 :     dperotate(mu, kappa2, kappa);
    1999      326175 :     dperotate(r, kappa2, kappa);
    2000      326175 :     affdpe(Del(s,kappa), Dmael(r,kappa,kappa));
    2001             : 
    2002             :     /* Step7: Update G, B, U */
    2003      326175 :     if (U) rotate(U, kappa2, kappa);
    2004      326175 :     if (B) rotate(B, kappa2, kappa);
    2005      326175 :     rotateG(G,kappa2,kappa, maxG, Gtmp);
    2006             : 
    2007             :     /* Step8: Prepare the next loop iteration */
    2008      326175 :     if (kappa == zeros+1 && !signe(gmael(G,kappa,kappa)))
    2009             :     {
    2010       35161 :       zeros++; kappa++;
    2011       35161 :       affidpe(gmael(G,kappa,kappa), Dmael(r,kappa,kappa));
    2012             :     }
    2013             :   }
    2014     1603418 :   if (pr) *pr = dpeM_diagonal_shallow(r,d);
    2015     1603418 :   *pG = G; *pB = B; *pU = U; return zeros; /* success */
    2016             : }
    2017             : 
    2018             : 
    2019             : /************************** PROVED version (t_INT) *************************/
    2020             : 
    2021             : /* Babai's Nearest Plane algorithm (iterative).
    2022             :  * Size-reduces b_kappa using mu_{i,j} and r_{i,j} for j<=i <kappa
    2023             :  * Update B[,kappa]; compute mu_{kappa,j}, r_{kappa,j} for j<=kappa and s[kappa]
    2024             :  * mu, r, s updated in place (affrr). Return 1 on failure, else 0. */
    2025             : static int
    2026           0 : Babai(pari_sp av, long kappa, GEN *pG, GEN *pB, GEN *pU, GEN mu, GEN r, GEN s,
    2027             :       long a, long zeros, long maxG, GEN eta, long prec)
    2028             : {
    2029           0 :   GEN G = *pG, B = *pB, U = *pU, ztmp;
    2030           0 :   long k, aa = a > zeros? a: zeros+1;
    2031           0 :   const long n = B? nbrows(B): 0, d = U ? lg(U)-1: 0, bit = prec2nbits(prec);
    2032           0 :   long emaxmu = EX0, emax2mu = EX0;
    2033             :   /* N.B: we set d = 0 (resp. n = 0) to avoid updating U (resp. B) */
    2034             : 
    2035           0 :   for (;;) {
    2036           0 :     int go_on = 0;
    2037           0 :     long i, j, emax3mu = emax2mu;
    2038             : 
    2039           0 :     if (gc_needed(av,2))
    2040             :     {
    2041           0 :       if(DEBUGMEM>1) pari_warn(warnmem,"Babai[1], a=%ld", aa);
    2042           0 :       gc_lll(av,3,&G,&B,&U);
    2043             :     }
    2044             :     /* Step2: compute the GSO for stage kappa */
    2045           0 :     emax2mu = emaxmu; emaxmu = EX0;
    2046           0 :     for (j=aa; j<kappa; j++)
    2047             :     {
    2048           0 :       pari_sp btop = avma;
    2049           0 :       GEN g = gmael(G,kappa,j);
    2050           0 :       for (k = zeros+1; k < j; k++)
    2051           0 :         g = mpsub(g, mulrr(gmael(mu,j,k), gmael(r,kappa,k)));
    2052           0 :       affgr(g, gmael(r,kappa,j));
    2053           0 :       affrr(divrr(gmael(r,kappa,j), gmael(r,j,j)), gmael(mu,kappa,j));
    2054           0 :       emaxmu = maxss(emaxmu, expo(gmael(mu,kappa,j)));
    2055           0 :       set_avma(btop);
    2056             :     }
    2057           0 :     if (emax3mu != EX0 && emax3mu <= emax2mu + 5) /* precision too low */
    2058           0 :     { *pG = G; *pB = B; *pU = U; return 1; }
    2059             : 
    2060           0 :     for (j=kappa-1; j>zeros; j--)
    2061           0 :       if (abscmprr(gmael(mu,kappa,j), eta) > 0) { go_on = 1; break; }
    2062             : 
    2063             :     /* Step3--5: compute the X_j's  */
    2064           0 :     if (go_on)
    2065           0 :       for (j=kappa-1; j>zeros; j--)
    2066             :       {
    2067             :         pari_sp btop;
    2068           0 :         GEN tmp = gmael(mu,kappa,j);
    2069           0 :         if (absrsmall(tmp)) continue; /* size-reduced */
    2070             : 
    2071           0 :         if (gc_needed(av,2))
    2072             :         {
    2073           0 :           if(DEBUGMEM>1) pari_warn(warnmem,"Babai[2], a=%ld, j=%ld", aa,j);
    2074           0 :           gc_lll(av,3,&G,&B,&U);
    2075             :         }
    2076           0 :         btop = avma;
    2077             :         /* we consider separately the case |X| = 1 */
    2078           0 :         if (absrsmall2(tmp))
    2079             :         {
    2080           0 :           if (signe(tmp) > 0) { /* in this case, X = 1 */
    2081           0 :             for (k=zeros+1; k<j; k++)
    2082           0 :               affrr(subrr(gmael(mu,kappa,k), gmael(mu,j,k)), gmael(mu,kappa,k));
    2083           0 :             set_avma(btop);
    2084           0 :             for (i=1; i<=n; i++)
    2085           0 :               gmael(B,kappa,i) = subii(gmael(B,kappa,i), gmael(B,j,i));
    2086           0 :             for (i=1; i<=d; i++)
    2087           0 :               gmael(U,kappa,i) = subii(gmael(U,kappa,i), gmael(U,j,i));
    2088           0 :             btop = avma;
    2089           0 :             ztmp = subii(gmael(G,j,j), shifti(gmael(G,kappa,j), 1));
    2090           0 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    2091           0 :             gmael(G,kappa,kappa) = gc_INT(btop, ztmp);
    2092           0 :             for (i=1; i<=j; i++)
    2093           0 :               gmael(G,kappa,i) = subii(gmael(G,kappa,i), gmael(G,j,i));
    2094           0 :             for (i=j+1; i<kappa; i++)
    2095           0 :               gmael(G,kappa,i) = subii(gmael(G,kappa,i), gmael(G,i,j));
    2096           0 :             for (i=kappa+1; i<=maxG; i++)
    2097           0 :               gmael(G,i,kappa) = subii(gmael(G,i,kappa), gmael(G,i,j));
    2098             :           } else { /* otherwise X = -1 */
    2099           0 :             for (k=zeros+1; k<j; k++)
    2100           0 :               affrr(addrr(gmael(mu,kappa,k), gmael(mu,j,k)), gmael(mu,kappa,k));
    2101           0 :             set_avma(btop);
    2102           0 :             for (i=1; i<=n; i++)
    2103           0 :               gmael(B,kappa,i) = addii(gmael(B,kappa,i),gmael(B,j,i));
    2104           0 :             for (i=1; i<=d; i++)
    2105           0 :               gmael(U,kappa,i) = addii(gmael(U,kappa,i),gmael(U,j,i));
    2106           0 :             btop = avma;
    2107           0 :             ztmp = addii(gmael(G,j,j), shifti(gmael(G,kappa,j), 1));
    2108           0 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    2109           0 :             gmael(G,kappa,kappa) = gc_INT(btop, ztmp);
    2110           0 :             for (i=1; i<=j; i++)
    2111           0 :               gmael(G,kappa,i) = addii(gmael(G,kappa,i), gmael(G,j,i));
    2112           0 :             for (i=j+1; i<kappa; i++)
    2113           0 :               gmael(G,kappa,i) = addii(gmael(G,kappa,i), gmael(G,i,j));
    2114           0 :             for (i=kappa+1; i<=maxG; i++)
    2115           0 :               gmael(G,i,kappa) = addii(gmael(G,i,kappa), gmael(G,i,j));
    2116             :           }
    2117           0 :           continue;
    2118             :         }
    2119             :         /* we have |X| >= 2 */
    2120           0 :         if (expo(tmp) < BITS_IN_LONG)
    2121             :         {
    2122           0 :           ulong xx = roundr_safe(tmp)[2]; /* X fits in an ulong */
    2123           0 :           if (signe(tmp) > 0) /* = xx */
    2124             :           {
    2125           0 :             for (k=zeros+1; k<j; k++)
    2126           0 :               affrr(subrr(gmael(mu,kappa,k), mulur(xx, gmael(mu,j,k))),
    2127           0 :                   gmael(mu,kappa,k));
    2128           0 :             set_avma(btop);
    2129           0 :             for (i=1; i<=n; i++)
    2130           0 :               gmael(B,kappa,i) = submuliu_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
    2131           0 :             for (i=1; i<=d; i++)
    2132           0 :               gmael(U,kappa,i) = submuliu_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
    2133           0 :             btop = avma;
    2134           0 :             ztmp = submuliu2n(mulii(gmael(G,j,j), sqru(xx)), gmael(G,kappa,j), xx, 1);
    2135           0 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    2136           0 :             gmael(G,kappa,kappa) = gc_INT(btop, ztmp);
    2137           0 :             for (i=1; i<=j; i++)
    2138           0 :               gmael(G,kappa,i) = submuliu_inplace(gmael(G,kappa,i), gmael(G,j,i), xx);
    2139           0 :             for (i=j+1; i<kappa; i++)
    2140           0 :               gmael(G,kappa,i) = submuliu_inplace(gmael(G,kappa,i), gmael(G,i,j), xx);
    2141           0 :             for (i=kappa+1; i<=maxG; i++)
    2142           0 :               gmael(G,i,kappa) = submuliu_inplace(gmael(G,i,kappa), gmael(G,i,j), xx);
    2143             :           }
    2144             :           else /* = -xx */
    2145             :           {
    2146           0 :             for (k=zeros+1; k<j; k++)
    2147           0 :               affrr(addrr(gmael(mu,kappa,k), mulur(xx, gmael(mu,j,k))),
    2148           0 :                   gmael(mu,kappa,k));
    2149           0 :             set_avma(btop);
    2150           0 :             for (i=1; i<=n; i++)
    2151           0 :               gmael(B,kappa,i) = addmuliu_inplace(gmael(B,kappa,i), gmael(B,j,i), xx);
    2152           0 :             for (i=1; i<=d; i++)
    2153           0 :               gmael(U,kappa,i) = addmuliu_inplace(gmael(U,kappa,i), gmael(U,j,i), xx);
    2154           0 :             btop = avma;
    2155           0 :             ztmp = addmuliu2n(mulii(gmael(G,j,j), sqru(xx)), gmael(G,kappa,j), xx, 1);
    2156           0 :             ztmp = addii(gmael(G,kappa,kappa), ztmp);
    2157           0 :             gmael(G,kappa,kappa) = gc_INT(btop, ztmp);
    2158           0 :             for (i=1; i<=j; i++)
    2159           0 :               gmael(G,kappa,i) = addmuliu_inplace(gmael(G,kappa,i), gmael(G,j,i), xx);
    2160           0 :             for (i=j+1; i<kappa; i++)
    2161           0 :               gmael(G,kappa,i) = addmuliu_inplace(gmael(G,kappa,i), gmael(G,i,j), xx);
    2162           0 :             for (i=kappa+1; i<=maxG; i++)
    2163           0 :               gmael(G,i,kappa) = addmuliu_inplace(gmael(G,i,kappa), gmael(G,i,j), xx);
    2164             :           }
    2165             :         }
    2166             :         else
    2167             :         {
    2168             :           long e;
    2169           0 :           GEN X = truncexpo(tmp, bit, &e); /* tmp ~ X * 2^e */
    2170           0 :           btop = avma;
    2171           0 :           for (k=zeros+1; k<j; k++)
    2172             :           {
    2173           0 :             GEN x = mulir(X, gmael(mu,j,k));
    2174           0 :             if (e) shiftr_inplace(x, e);
    2175           0 :             affrr(subrr(gmael(mu,kappa,k), x), gmael(mu,kappa,k));
    2176             :           }
    2177           0 :           set_avma(btop);
    2178           0 :           for (i=1; i<=n; i++)
    2179           0 :             gmael(B,kappa,i) = submulshift(gmael(B,kappa,i), gmael(B,j,i), X, e);
    2180           0 :           for (i=1; i<=d; i++)
    2181           0 :             gmael(U,kappa,i) = submulshift(gmael(U,kappa,i), gmael(U,j,i), X, e);
    2182           0 :           btop = avma;
    2183           0 :           ztmp = submulshift(mulshift(gmael(G,j,j), sqri(X), 2*e),
    2184           0 :               gmael(G,kappa,j), X, e+1);
    2185           0 :           ztmp = addii(gmael(G,kappa,kappa), ztmp);
    2186           0 :           gmael(G,kappa,kappa) = gc_INT(btop, ztmp);
    2187           0 :           for (i=1; i<=j; i++)
    2188           0 :             gmael(G,kappa,i) = submulshift(gmael(G,kappa,i), gmael(G,j,i), X, e);
    2189           0 :           for (   ; i<kappa; i++)
    2190           0 :             gmael(G,kappa,i) = submulshift(gmael(G,kappa,i), gmael(G,i,j), X, e);
    2191           0 :           for (i=kappa+1; i<=maxG; i++)
    2192           0 :             gmael(G,i,kappa) = submulshift(gmael(G,i,kappa), gmael(G,i,j), X, e);
    2193             :         }
    2194             :       }
    2195           0 :     if (!go_on) break; /* Anything happened? */
    2196           0 :     aa = zeros+1;
    2197             :   }
    2198             : 
    2199           0 :   affir(gmael(G,kappa,kappa), gel(s,zeros+1));
    2200             :   /* the last s[kappa-1]=r[kappa][kappa] is computed only if kappa increases */
    2201           0 :   av = avma;
    2202           0 :   for (k=zeros+1; k<=kappa-2; k++)
    2203           0 :     affrr(subrr(gel(s,k), mulrr(gmael(mu,kappa,k), gmael(r,kappa,k))),
    2204           0 :           gel(s,k+1));
    2205           0 :   *pG = G; *pB = B; *pU = U; return gc_bool(av, 0);
    2206             : }
    2207             : 
    2208             : /* G integral Gram matrix, LLL-reduces (G,B,U) in place [apply base change
    2209             :  * transforms to B and U]. If (keepfirst), never swap with first vector.
    2210             :  * If G = NULL, we compute the Gram matrix incrementally.
    2211             :  * Return -1 on failure, else zeros = dim Kernel (>= 0) */
    2212             : static long
    2213           0 : fplll(GEN *pG, GEN *pB, GEN *pU, GEN *pr, double DELTA, double ETA,
    2214             :       long keepfirst, long prec)
    2215             : {
    2216             :   pari_sp av, av2;
    2217           0 :   GEN mu, r, s, tmp, Gtmp, alpha, G = *pG, B = *pB, U = *pU;
    2218           0 :   GEN delta = dbltor(DELTA), eta = dbltor(ETA);
    2219           0 :   long d, maxG, kappa, kappa2, i, j, zeros, kappamax, incgram = !G, cnt = 0;
    2220             : 
    2221           0 :   if (incgram)
    2222             :   { /* incremental Gram matrix */
    2223           0 :     maxG = 2; d = lg(B)-1;
    2224           0 :     G = zeromatcopy(d, d);
    2225             :   }
    2226             :   else
    2227           0 :     maxG = d = lg(G)-1;
    2228             : 
    2229           0 :   mu = cgetg(d+1, t_MAT);
    2230           0 :   r  = cgetg(d+1, t_MAT);
    2231           0 :   s  = cgetg(d+1, t_VEC);
    2232           0 :   for (j = 1; j <= d; j++)
    2233             :   {
    2234           0 :     GEN M = cgetg(d+1, t_COL), R = cgetg(d+1, t_COL);
    2235           0 :     gel(mu,j)= M;
    2236           0 :     gel(r,j) = R;
    2237           0 :     gel(s,j) = cgetr(prec);
    2238           0 :     for (i = 1; i <= d; i++)
    2239             :     {
    2240           0 :       gel(R,i) = cgetr(prec);
    2241           0 :       gel(M,i) = cgetr(prec);
    2242             :     }
    2243             :   }
    2244           0 :   Gtmp = cgetg(d+1, t_VEC);
    2245           0 :   alpha = cgetg(d+1, t_VECSMALL);
    2246           0 :   av = avma;
    2247             : 
    2248             :   /* Step2: Initializing the main loop */
    2249           0 :   kappamax = 1;
    2250           0 :   i = 1;
    2251             :   do {
    2252           0 :     if (incgram) gmael(G,i,i) = ZV_dotsquare(gel(B,i));
    2253           0 :     affir(gmael(G,i,i), gmael(r,i,i));
    2254           0 :   } while (!signe(gmael(G,i,i)) && ++i <= d);
    2255           0 :   zeros = i-1; /* all basis vectors b_i with i <= zeros are zero vectors */
    2256           0 :   kappa = i;
    2257           0 :   for (i=zeros+1; i<=d; i++) alpha[i]=1;
    2258             : 
    2259           0 :   while (++kappa <= d)
    2260             :   {
    2261           0 :     if (kappa > kappamax)
    2262             :     {
    2263           0 :       if (DEBUGLEVEL>=4) err_printf("K%ld ",kappa);
    2264           0 :       kappamax = kappa;
    2265           0 :       if (incgram)
    2266             :       {
    2267           0 :         for (i=zeros+1; i<=kappa; i++)
    2268           0 :           gmael(G,kappa,i) = ZV_dotproduct(gel(B,kappa), gel(B,i));
    2269           0 :         maxG = kappamax;
    2270             :       }
    2271             :     }
    2272             :     /* Step3: Call to the Babai algorithm, mu,r,s updated in place */
    2273           0 :     if (Babai(av, kappa, &G,&B,&U, mu,r,s, alpha[kappa], zeros, maxG, eta, prec))
    2274           0 :     { *pG = incgram? NULL: G; *pB = B; *pU = U; return -1; }
    2275           0 :     av2 = avma;
    2276           0 :     if ((keepfirst && kappa == 2) ||
    2277           0 :         cmprr(mulrr(gmael(r,kappa-1,kappa-1), delta), gel(s,kappa-1)) <= 0)
    2278             :     { /* Step4: Success of Lovasz's condition */
    2279           0 :       alpha[kappa] = kappa;
    2280           0 :       tmp = mulrr(gmael(mu,kappa,kappa-1), gmael(r,kappa,kappa-1));
    2281           0 :       affrr(subrr(gel(s,kappa-1), tmp), gmael(r,kappa,kappa));
    2282           0 :       set_avma(av2); continue;
    2283             :     }
    2284             :     /* Step5: Find the right insertion index kappa, kappa2 = initial kappa */
    2285           0 :     if (DEBUGLEVEL>=4 && kappa==kappamax && signe(gel(s,kappa-1)))
    2286           0 :       if (++cnt > 20) { cnt = 0; err_printf("(%ld) ", expo(gel(s,1))); }
    2287           0 :     kappa2 = kappa;
    2288             :     do {
    2289           0 :       kappa--;
    2290           0 :       if (kappa < zeros+2 + (keepfirst ? 1: 0)) break;
    2291           0 :       tmp = mulrr(gmael(r,kappa-1,kappa-1), delta);
    2292           0 :     } while (cmprr(gel(s,kappa-1), tmp) <= 0);
    2293           0 :     set_avma(av2);
    2294           0 :     update_alpha(alpha, kappa, kappa2, kappamax);
    2295             : 
    2296             :     /* Step6: Update the mu's and r's */
    2297           0 :     rotate(mu, kappa2, kappa);
    2298           0 :     rotate(r, kappa2, kappa);
    2299           0 :     affrr(gel(s,kappa), gmael(r,kappa,kappa));
    2300             : 
    2301             :     /* Step7: Update G, B, U */
    2302           0 :     if (U) rotate(U, kappa2, kappa);
    2303           0 :     if (B) rotate(B, kappa2, kappa);
    2304           0 :     rotateG(G,kappa2,kappa, maxG, Gtmp);
    2305             : 
    2306             :     /* Step8: Prepare the next loop iteration */
    2307           0 :     if (kappa == zeros+1 && !signe(gmael(G,kappa,kappa)))
    2308             :     {
    2309           0 :       zeros++; kappa++;
    2310           0 :       affir(gmael(G,kappa,kappa), gmael(r,kappa,kappa));
    2311             :     }
    2312             :   }
    2313           0 :   if (pr) *pr = RgM_diagonal_shallow(r);
    2314           0 :   *pG = G; *pB = B; *pU = U; return zeros; /* success */
    2315             : }
    2316             : 
    2317             : /* do not support LLL_KER, LLL_ALL, LLL_KEEP_FIRST */
    2318             : static GEN
    2319     4848314 : ZM2_lll_norms(GEN x, long flag, GEN *pN)
    2320             : {
    2321             :   GEN a,b,c,d;
    2322             :   GEN G, U;
    2323     4848314 :   if (flag & LLL_GRAM)
    2324        7355 :     G = x;
    2325             :   else
    2326     4840959 :     G = gram_matrix(x);
    2327     4848294 :   a = gcoeff(G,1,1); b = shifti(gcoeff(G,1,2),1); c = gcoeff(G,2,2);
    2328     4848279 :   d = qfb_disc3(a,b,c);
    2329     4848272 :   if (signe(d)>=0) return NULL;
    2330     4847887 :   G = redimagsl2(mkqfb(a,b,c,d),&U);
    2331     4847928 :   if (pN) (void) RgM_gram_schmidt(G, pN);
    2332     4847928 :   if (flag & LLL_INPLACE) return ZM2_mul(x,U);
    2333     4847928 :   return U;
    2334             : }
    2335             : 
    2336             : static void
    2337      625753 : fplll_flatter(GEN *pG, GEN *pB, GEN *pU, long rank, long flag)
    2338             : {
    2339      625753 :   if (!*pG)
    2340             :   {
    2341      624792 :     GEN T = ZM_flatter_rank(*pB, rank, flag);
    2342      624792 :     if (T)
    2343             :     {
    2344      328042 :       if (*pU)
    2345             :       {
    2346      314041 :         *pU = ZM_mul(*pU, T);
    2347      314041 :         *pB = ZM_mul(*pB, T);
    2348             :       }
    2349       14001 :       else *pB = T;
    2350             :     }
    2351             :   }
    2352             :   else
    2353             :   {
    2354         961 :     GEN T, G = *pG;
    2355         961 :     long i, j, l = lg(G);
    2356        7207 :     for (i = 1; i < l; i++)
    2357       43383 :       for(j = 1; j < i; j++) gmael(G,j,i) = gmael(G,i,j);
    2358         961 :     T = ZM_flattergram_rank(G, rank, flag);
    2359         961 :     if (T)
    2360             :     {
    2361         961 :       if (*pU) *pU = ZM_mul(*pU, T);
    2362         961 :       *pG = qf_ZM_apply(*pG, T);
    2363             :     }
    2364             :   }
    2365      625753 : }
    2366             : 
    2367             : static GEN
    2368     1098789 : get_gramschmidt(GEN M, long rank)
    2369             : {
    2370             :   GEN B, Q, L;
    2371     1098789 :   long r = lg(M)-1, bitprec = 3*r + 30;
    2372     1098789 :   long prec = nbits2prec64(bitprec);
    2373     1098789 :   if (rank < r) M = vconcat(gshift(M,1), matid(r));
    2374     1098789 :   if (!QR_init(RgM_gtofp(M, prec), &B, &Q, &L, prec) || !gsisinv(L)) return NULL;
    2375      475068 :   return L;
    2376             : }
    2377             : 
    2378             : static GEN
    2379       44536 : get_gaussred(GEN M, long rank)
    2380             : {
    2381       44536 :   pari_sp ltop = avma;
    2382       44536 :   long r = lg(M)-1, bitprec = 3*r + 30, prec = nbits2prec64(bitprec);
    2383             :   GEN R;
    2384       44534 :   if (rank < r) M = RgM_Rg_add(gshift(M, 1), gen_1);
    2385       44534 :   R = RgM_Cholesky(RgM_gtofp(M, prec), prec);
    2386       44538 :   if (!R) return NULL;
    2387       43577 :   return gc_GEN(ltop, R);
    2388             : }
    2389             : 
    2390             : /* Assume x a ZM, if pN != NULL, set it to Gram-Schmidt (squared) norms
    2391             :  * The following modes are supported:
    2392             :  * - flag & LLL_INPLACE: x a lattice basis, return x*U
    2393             :  * - flag & LLL_GRAM: x a Gram matrix / else x a lattice basis; return
    2394             :  *     LLL base change matrix U [LLL_IM]
    2395             :  *     kernel basis [LLL_KER, nonreduced]
    2396             :  *     both [LLL_ALL] */
    2397             : GEN
    2398     7137337 : ZM_lll_norms(GEN x, double DELTA, long flag, GEN *pN)
    2399             : {
    2400     7137337 :   pari_sp av = avma;
    2401     7137337 :   const double ETA = 0.51;
    2402     7137337 :   const long keepfirst = flag & LLL_KEEP_FIRST;
    2403     7137337 :   long p, zeros = -1, n = lg(x)-1, is_upper, is_lower, useflatter = 0, rank;
    2404     7137337 :   GEN G, B, U, L = NULL;
    2405             :   pari_timer T;
    2406     7137337 :   long thre[]={31783,34393,20894,22525,13533,1928,672,671,
    2407             :                 422,506,315,313,222,205,167,154,139,138,
    2408             :                 110,120,98,94,81,75,74,64,74,74,
    2409             :                 79,96,112,111,105,104,96,86,84,78,75,70,66,62,62,57,56,47,45,52,50,44,48,42,36,35,35,34,40,33,34,32,36,31,
    2410             :                 38,38,40,38,38,37,35,31,34,36,34,32,34,32,28,27,25,31,25,27,28,26,25,21,21,25,25,22,21,24,24,22,21,23,22,22,22,22,21,24,21,22,19,20,19,20,19,19,19,18,19,18,18,20,19,20,18,19,18,21,18,20,18,18};
    2411     7137337 :   long thsn[]={23280,30486,50077,44136,78724,15690,1801,1611,
    2412             :                981,1359,978,1042,815,866,788,775,726,712,
    2413             :                626,613,548,564,474,481,504,447,453,508,
    2414             :                705,794,1008,946,767,898,886,763,842,757,
    2415             :                725,774,639,655,705,627,635,704,511,613,
    2416             :                583,595,568,640,541,640,567,540,577,584,
    2417             :                546,509,526,572,637,746,772,743,743,742,800,708,832,768,707,692,692,768,696,635,709,694,768,719,655,569,590,644,685,623,627,720,633,636,602,635,575,631,642,647,632,656,573,511,688,640,528,616,511,559,601,620,635,688,608,768,658,582,644,704,555,673,600,601,641,661,601,670};
    2418     7137337 :   if (n <= 1) return lll_trivial(x, flag);
    2419     7027293 :   if (nbrows(x)==0)
    2420             :   {
    2421       15173 :     if (flag & LLL_KER) return matid(n);
    2422       15173 :     if (flag & (LLL_INPLACE|LLL_IM)) return cgetg(1,t_MAT);
    2423           0 :     retmkvec2(matid(n), cgetg(1,t_MAT));
    2424             :   }
    2425     7012258 :   if (n==2 && nbrows(x)==2  && (flag&LLL_IM) && !keepfirst)
    2426             :   {
    2427     4848315 :     U = ZM2_lll_norms(x, flag, pN);
    2428     4848314 :     if (U) return U;
    2429             :   }
    2430     2164328 :   if (flag & LLL_GRAM)
    2431       60540 :   { G = x; B = NULL; U = matid(n); is_upper = 0; is_lower = 0; }
    2432             :   else
    2433             :   {
    2434     2103788 :     G = NULL; B = x; U = (flag & LLL_INPLACE)? NULL: matid(n);
    2435     2103792 :     is_upper = (flag & LLL_UPPER) || ZM_is_upper(B);
    2436     2103789 :     is_lower = !B || is_upper || keepfirst ? 0: ZM_is_lower(B);
    2437     2103786 :     if (is_lower) L = RgM_flip(B);
    2438             :   }
    2439     2164323 :   rank = (flag&LLL_NOFLATTER) ? 0: ZM_rank(x);
    2440     2164308 :   if (n > 2 && !(flag&LLL_NOFLATTER))
    2441     1749620 :   {
    2442     1705089 :     GEN R = B ? (is_upper ? B : (is_lower ? L : get_gramschmidt(B, rank)))
    2443     3454704 :               : get_gaussred(G, rank);
    2444     1749621 :     if (R)
    2445             :     {
    2446     1124946 :       long spr = spread(R), sz = mpexpo(gsupnorm(R, DEFAULTPREC)), thr;
    2447     1124944 :       if (DEBUGLEVEL>=5) err_printf("LLL: dim %ld, size %ld, spread %ld\n",n, sz, spr);
    2448     1124944 :       if ((is_upper && ZM_is_knapsack(B)) || (is_lower && ZM_is_knapsack(L)))
    2449       92384 :         thr = thsn[minss(n-3,numberof(thsn)-1)];
    2450             :       else
    2451             :       {
    2452     1032560 :         thr = thre[minss(n-3,numberof(thre)-1)];
    2453     1032560 :         if (n>=10) sz = spr;
    2454             :       }
    2455     1124945 :       useflatter = sz >= thr;
    2456             :     } else
    2457      624675 :       useflatter = 1;
    2458      414685 :   } else useflatter = 0;
    2459     2164305 :   if(DEBUGLEVEL>=4) timer_start(&T);
    2460     2164305 :   if (useflatter)
    2461             :   {
    2462      625753 :     if (is_lower)
    2463             :     {
    2464           0 :       fplll_flatter(&G, &L, &U, rank, flag | LLL_UPPER);
    2465           0 :       B = RgM_flop(L);
    2466           0 :       if (U) U = RgM_flop(U);
    2467             :     }
    2468             :     else
    2469      625753 :       fplll_flatter(&G, &B, &U, rank, flag | (is_upper? LLL_UPPER:0));
    2470      625753 :     if (DEBUGLEVEL>=4  && !(flag & LLL_NOCERTIFY))
    2471           0 :       timer_printf(&T, "FLATTER");
    2472             :   }
    2473     2164304 :   if (!(flag & LLL_GRAM))
    2474             :   {
    2475             :     long t;
    2476     2103769 :     long heu_max = n<100 ? 1: 2; /* need better tuning */
    2477     2103769 :     B = gcopy(B);
    2478     2103784 :     if(DEBUGLEVEL>=4)
    2479           0 :       err_printf("Entering L^2 (double): dim %ld, LLL-parameters (%.3f,%.3f)\n",
    2480             :                  n, DELTA,ETA);
    2481     2103784 :     zeros = fplll_fast(&B, &U, DELTA, ETA, keepfirst);
    2482     2103793 :     if (DEBUGLEVEL>=4) timer_printf(&T, zeros < 0? "LLL (failed)": "LLL");
    2483     2108039 :     for (p = DEFAULTPREC, t = 0; zeros < 0 && t < heu_max ; p += EXTRAPREC64, t++)
    2484             :     {
    2485        4246 :       if (DEBUGLEVEL>=4)
    2486           0 :         err_printf("Entering L^2 (heuristic): LLL-parameters (%.3f,%.3f), prec = %d/%d\n", DELTA, ETA, p, p);
    2487        4246 :       zeros = fplll_heuristic(&B, &U, DELTA, ETA, keepfirst, p, p);
    2488        4246 :       gc_lll(av, 2, &B, &U);
    2489        4246 :       if (DEBUGLEVEL>=4) timer_printf(&T, zeros < 0? "LLL (failed)": "LLL");
    2490             :     }
    2491             :   } else
    2492       60535 :     G = gcopy(G);
    2493     2164328 :   if (zeros < 0 || !(flag & LLL_NOCERTIFY))
    2494             :   {
    2495     1603433 :     if(DEBUGLEVEL>=4)
    2496           0 :       err_printf("Entering L^2 (dpe): LLL-parameters (%.3f,%.3f)\n", DELTA,ETA);
    2497     1603433 :     zeros = fplll_dpe(&G, &B, &U, pN, DELTA, ETA, keepfirst);
    2498     1603417 :     if (DEBUGLEVEL>=4) timer_printf(&T, zeros < 0? "LLL (failed)": "LLL");
    2499     1603419 :     if (zeros < 0)
    2500           0 :       for (p = DEFAULTPREC;; p += EXTRAPREC64)
    2501             :       {
    2502           0 :         if (DEBUGLEVEL>=4)
    2503           0 :           err_printf("Entering L^2: LLL-parameters (%.3f,%.3f), prec = %d\n",
    2504             :               DELTA,ETA, p);
    2505           0 :         zeros = fplll(&G, &B, &U, pN, DELTA, ETA, keepfirst, p);
    2506           0 :         if (DEBUGLEVEL>=4) timer_printf(&T, zeros < 0? "LLL (failed)": "LLL");
    2507           0 :         if (zeros >= 0) break;
    2508           0 :         gc_lll(av, 3, &G, &B, &U);
    2509             :       }
    2510             :   }
    2511     2164314 :   return lll_finish(U? U: B, zeros, flag);
    2512             : }
    2513             : 
    2514             : /********************************************************************/
    2515             : /**                                                                **/
    2516             : /**                        LLL OVER K[X]                           **/
    2517             : /**                                                                **/
    2518             : /********************************************************************/
    2519             : static int
    2520         504 : pslg(GEN x)
    2521             : {
    2522             :   long tx;
    2523         504 :   if (gequal0(x)) return 2;
    2524         448 :   tx = typ(x); return is_scalar_t(tx)? 3: lg(x);
    2525             : }
    2526             : 
    2527             : static int
    2528         196 : REDgen(long k, long l, GEN h, GEN L, GEN B)
    2529             : {
    2530         196 :   GEN q, u = gcoeff(L,k,l);
    2531             :   long i;
    2532             : 
    2533         196 :   if (pslg(u) < pslg(B)) return 0;
    2534             : 
    2535         140 :   q = gneg(gdeuc(u,B));
    2536         140 :   gel(h,k) = gadd(gel(h,k), gmul(q,gel(h,l)));
    2537         140 :   for (i=1; i<l; i++) gcoeff(L,k,i) = gadd(gcoeff(L,k,i), gmul(q,gcoeff(L,l,i)));
    2538         140 :   gcoeff(L,k,l) = gadd(gcoeff(L,k,l), gmul(q,B)); return 1;
    2539             : }
    2540             : 
    2541             : static int
    2542         196 : do_SWAPgen(GEN h, GEN L, GEN B, long k, GEN fl, int *flc)
    2543             : {
    2544             :   GEN p1, la, la2, Bk;
    2545             :   long ps1, ps2, i, j, lx;
    2546             : 
    2547         196 :   if (!fl[k-1]) return 0;
    2548             : 
    2549         140 :   la = gcoeff(L,k,k-1); la2 = gsqr(la);
    2550         140 :   Bk = gel(B,k);
    2551         140 :   if (fl[k])
    2552             :   {
    2553          56 :     GEN q = gadd(la2, gmul(gel(B,k-1),gel(B,k+1)));
    2554          56 :     ps1 = pslg(gsqr(Bk));
    2555          56 :     ps2 = pslg(q);
    2556          56 :     if (ps1 <= ps2 && (ps1 < ps2 || !*flc)) return 0;
    2557          28 :     *flc = (ps1 != ps2);
    2558          28 :     gel(B,k) = gdiv(q, Bk);
    2559             :   }
    2560             : 
    2561         112 :   swap(gel(h,k-1), gel(h,k)); lx = lg(L);
    2562         112 :   for (j=1; j<k-1; j++) swap(gcoeff(L,k-1,j), gcoeff(L,k,j));
    2563         112 :   if (fl[k])
    2564             :   {
    2565          28 :     for (i=k+1; i<lx; i++)
    2566             :     {
    2567           0 :       GEN t = gcoeff(L,i,k);
    2568           0 :       p1 = gsub(gmul(gel(B,k+1),gcoeff(L,i,k-1)), gmul(la,t));
    2569           0 :       gcoeff(L,i,k) = gdiv(p1, Bk);
    2570           0 :       p1 = gadd(gmul(la,gcoeff(L,i,k-1)), gmul(gel(B,k-1),t));
    2571           0 :       gcoeff(L,i,k-1) = gdiv(p1, Bk);
    2572             :     }
    2573             :   }
    2574          84 :   else if (!gequal0(la))
    2575             :   {
    2576          28 :     p1 = gdiv(la2, Bk);
    2577          28 :     gel(B,k+1) = gel(B,k) = p1;
    2578          28 :     for (i=k+2; i<=lx; i++) gel(B,i) = gdiv(gmul(p1,gel(B,i)),Bk);
    2579          28 :     for (i=k+1; i<lx; i++)
    2580           0 :       gcoeff(L,i,k-1) = gdiv(gmul(la,gcoeff(L,i,k-1)), Bk);
    2581          28 :     for (j=k+1; j<lx-1; j++)
    2582           0 :       for (i=j+1; i<lx; i++)
    2583           0 :         gcoeff(L,i,j) = gdiv(gmul(p1,gcoeff(L,i,j)), Bk);
    2584             :   }
    2585             :   else
    2586             :   {
    2587          56 :     gcoeff(L,k,k-1) = gen_0;
    2588          56 :     for (i=k+1; i<lx; i++)
    2589             :     {
    2590           0 :       gcoeff(L,i,k) = gcoeff(L,i,k-1);
    2591           0 :       gcoeff(L,i,k-1) = gen_0;
    2592             :     }
    2593          56 :     gel(B,k) = gel(B,k-1); fl[k] = 1; fl[k-1] = 0;
    2594             :   }
    2595         112 :   return 1;
    2596             : }
    2597             : 
    2598             : static void
    2599         168 : incrementalGSgen(GEN x, GEN L, GEN B, long k, GEN fl)
    2600             : {
    2601         168 :   GEN u = NULL; /* gcc -Wall */
    2602             :   long i, j;
    2603         420 :   for (j = 1; j <= k; j++)
    2604         252 :     if (j==k || fl[j])
    2605             :     {
    2606         252 :       u = gcoeff(x,k,j);
    2607         252 :       if (!is_extscalar_t(typ(u))) pari_err_TYPE("incrementalGSgen",u);
    2608         336 :       for (i=1; i<j; i++)
    2609          84 :         if (fl[i])
    2610             :         {
    2611          84 :           u = gsub(gmul(gel(B,i+1),u), gmul(gcoeff(L,k,i),gcoeff(L,j,i)));
    2612          84 :           u = gdiv(u, gel(B,i));
    2613             :         }
    2614         252 :       gcoeff(L,k,j) = u;
    2615             :     }
    2616         168 :   if (gequal0(u)) gel(B,k+1) = gel(B,k);
    2617             :   else
    2618             :   {
    2619         112 :     gel(B,k+1) = gcoeff(L,k,k); gcoeff(L,k,k) = gen_1; fl[k] = 1;
    2620             :   }
    2621         168 : }
    2622             : 
    2623             : static GEN
    2624         168 : lllgramallgen(GEN x, long flag)
    2625             : {
    2626         168 :   long lx = lg(x), i, j, k, l, n;
    2627             :   pari_sp av;
    2628             :   GEN B, L, h, fl;
    2629             :   int flc;
    2630             : 
    2631         168 :   n = lx-1; if (n<=1) return lll_trivial(x,flag);
    2632          84 :   if (lgcols(x) != lx) pari_err_DIM("lllgramallgen");
    2633             : 
    2634          84 :   fl = cgetg(lx, t_VECSMALL);
    2635             : 
    2636          84 :   av = avma;
    2637          84 :   B = scalarcol_shallow(gen_1, lx);
    2638          84 :   L = cgetg(lx,t_MAT);
    2639         252 :   for (j=1; j<lx; j++) { gel(L,j) = zerocol(n); fl[j] = 0; }
    2640             : 
    2641          84 :   h = matid(n);
    2642         252 :   for (i=1; i<lx; i++)
    2643         168 :     incrementalGSgen(x, L, B, i, fl);
    2644          84 :   flc = 0;
    2645          84 :   for(k=2;;)
    2646             :   {
    2647         196 :     if (REDgen(k, k-1, h, L, gel(B,k))) flc = 1;
    2648         196 :     if (do_SWAPgen(h, L, B, k, fl, &flc)) { if (k > 2) k--; }
    2649             :     else
    2650             :     {
    2651          84 :       for (l=k-2; l>=1; l--)
    2652           0 :         if (REDgen(k, l, h, L, gel(B,l+1))) flc = 1;
    2653          84 :       if (++k > n) break;
    2654             :     }
    2655         112 :     if (gc_needed(av,1))
    2656             :     {
    2657           0 :       if(DEBUGMEM>1) pari_warn(warnmem,"lllgramallgen");
    2658           0 :       (void)gc_all(av,3,&B,&L,&h);
    2659             :     }
    2660             :   }
    2661         140 :   k=1; while (k<lx && !fl[k]) k++;
    2662          84 :   return lll_finish(h,k-1,flag);
    2663             : }
    2664             : 
    2665             : static GEN
    2666         168 : lllallgen(GEN x, long flag)
    2667             : {
    2668         168 :   pari_sp av = avma;
    2669         168 :   if (!(flag & LLL_GRAM)) x = gram_matrix(x);
    2670          84 :   else if (!RgM_is_square_mat(x)) pari_err_DIM("qflllgram");
    2671         168 :   return gc_GEN(av, lllgramallgen(x, flag));
    2672             : }
    2673             : GEN
    2674          42 : lllgen(GEN x) { return lllallgen(x, LLL_IM); }
    2675             : GEN
    2676          42 : lllkerimgen(GEN x) { return lllallgen(x, LLL_ALL); }
    2677             : GEN
    2678          42 : lllgramgen(GEN x)  { return lllallgen(x, LLL_IM|LLL_GRAM); }
    2679             : GEN
    2680          42 : lllgramkerimgen(GEN x)  { return lllallgen(x, LLL_ALL|LLL_GRAM); }
    2681             : 
    2682             : static GEN
    2683       36699 : lllall(GEN x, long flag)
    2684       36699 : { pari_sp av = avma; return gc_GEN(av, ZM_lll(x, LLLDFT, flag)); }
    2685             : GEN
    2686         183 : lllint(GEN x) { return lllall(x, LLL_IM); }
    2687             : GEN
    2688          35 : lllkerim(GEN x) { return lllall(x, LLL_ALL); }
    2689             : GEN
    2690       36439 : lllgramint(GEN x)
    2691       36439 : { if (!RgM_is_square_mat(x)) pari_err_DIM("qflllgram");
    2692       36439 :   return lllall(x, LLL_IM | LLL_GRAM); }
    2693             : GEN
    2694          35 : lllgramkerim(GEN x)
    2695          35 : { if (!RgM_is_square_mat(x)) pari_err_DIM("qflllgram");
    2696          35 :   return lllall(x, LLL_ALL | LLL_GRAM); }
    2697             : 
    2698             : GEN
    2699     5370934 : lllfp(GEN x, double D, long flag)
    2700             : {
    2701     5370934 :   long n = lg(x)-1;
    2702     5370934 :   pari_sp av = avma;
    2703             :   GEN h;
    2704     5370934 :   if (n <= 1) return lll_trivial(x,flag);
    2705     4709364 :   if (flag & LLL_GRAM)
    2706             :   {
    2707        9270 :     if (!RgM_is_square_mat(x)) pari_err_DIM("qflllgram");
    2708        9256 :     if (isinexact(x))
    2709             :     {
    2710        9165 :       x = RgM_Cholesky(x, gprecision(x));
    2711        9165 :       if (!x) return NULL;
    2712        9165 :       flag &= ~LLL_GRAM;
    2713             :     }
    2714             :   }
    2715     4709350 :   h = ZM_lll(RgM_rescale_to_int(x), D, flag);
    2716     4709297 :   return gc_GEN(av, h);
    2717             : }
    2718             : 
    2719             : GEN
    2720        9089 : lllgram(GEN x) { return lllfp(x,LLLDFT,LLL_GRAM|LLL_IM); }
    2721             : GEN
    2722     1243328 : lll(GEN x) { return lllfp(x,LLLDFT,LLL_IM); }
    2723             : 
    2724             : static GEN
    2725          63 : qflllgram(GEN x)
    2726             : {
    2727          63 :   GEN T = lllgram(x);
    2728          42 :   if (!T) pari_err_PREC("qflllgram");
    2729          42 :   return T;
    2730             : }
    2731             : 
    2732             : GEN
    2733         301 : qflll0(GEN x, long flag)
    2734             : {
    2735         301 :   if (typ(x) != t_MAT) pari_err_TYPE("qflll",x);
    2736         301 :   switch(flag)
    2737             :   {
    2738          49 :     case 0: return lll(x);
    2739          63 :     case 1: return lllfp(x, LLLDFT, LLL_IM | LLL_NOFLATTER);
    2740          49 :     case 2: RgM_check_ZM(x,"qflll"); return lllintpartial(x);
    2741           7 :     case 3: RgM_check_ZM(x,"qflll"); return lllall(x, LLL_INPLACE);
    2742          49 :     case 4: RgM_check_ZM(x,"qflll"); return lllkerim(x);
    2743          42 :     case 5: return lllkerimgen(x);
    2744          42 :     case 8: return lllgen(x);
    2745           0 :     default: pari_err_FLAG("qflll");
    2746             :   }
    2747             :   return NULL; /* LCOV_EXCL_LINE */
    2748             : }
    2749             : 
    2750             : GEN
    2751         245 : qflllgram0(GEN x, long flag)
    2752             : {
    2753         245 :   if (typ(x) != t_MAT) pari_err_TYPE("qflllgram",x);
    2754         245 :   switch(flag)
    2755             :   {
    2756          63 :     case 0: return qflllgram(x);
    2757          49 :     case 1: return lllfp(x, LLLDFT, LLL_IM | LLL_GRAM | LLL_NOFLATTER);
    2758          49 :     case 4: RgM_check_ZM(x,"qflllgram"); return lllgramkerim(x);
    2759          42 :     case 5: return lllgramkerimgen(x);
    2760          42 :     case 8: return lllgramgen(x);
    2761           0 :     default: pari_err_FLAG("qflllgram");
    2762             :   }
    2763             :   return NULL; /* LCOV_EXCL_LINE */
    2764             : }
    2765             : 
    2766             : /********************************************************************/
    2767             : /**                                                                **/
    2768             : /**                   INTEGRAL KERNEL (LLL REDUCED)                **/
    2769             : /**                                                                **/
    2770             : /********************************************************************/
    2771             : static GEN
    2772          70 : kerint0(GEN M)
    2773             : {
    2774             :   /* return ZM_lll(M, LLLDFT, LLL_KER); */
    2775          70 :   GEN U, H = ZM_hnflll(M,&U,1);
    2776          70 :   long d = lg(M)-lg(H);
    2777          70 :   if (!d) return cgetg(1, t_MAT);
    2778          70 :   return ZM_lll(vecslice(U,1,d), LLLDFT, LLL_INPLACE);
    2779             : }
    2780             : GEN
    2781          42 : kerint(GEN M)
    2782             : {
    2783          42 :   pari_sp av = avma;
    2784          42 :   return gc_GEN(av, kerint0(M));
    2785             : }
    2786             : /* OBSOLETE: use kerint */
    2787             : GEN
    2788          28 : matkerint0(GEN M, long flag)
    2789             : {
    2790          28 :   pari_sp av = avma;
    2791          28 :   if (typ(M) != t_MAT) pari_err_TYPE("matkerint",M);
    2792          28 :   M = Q_primpart(M);
    2793          28 :   RgM_check_ZM(M, "kerint");
    2794          28 :   switch(flag)
    2795             :   {
    2796          28 :     case 0:
    2797          28 :     case 1: return gc_GEN(av, kerint0(M));
    2798           0 :     default: pari_err_FLAG("matkerint");
    2799             :   }
    2800             :   return NULL; /* LCOV_EXCL_LINE */
    2801             : }

Generated by: LCOV version 1.16