Lien vers le problème :

In [1]:

import IPython.display

In [8]:

IPython.display.IFrame(src='https://projecteuler.net/problem=500', width=800, height=300)

Out[8]:

Explication pour 120 :

In [9]:

2**3 * 3 * 5

Out[9]:

Le nombre de diviseurs différents est de $4 * 2 * 2$.

In [10]:

4 * 2 * 2

Out[10]:

Si on avait une puissance de 2 avec autant de diviseurs ce serait :

In [12]:

2 ** 15

Out[12]:

Donc effectivement, c'est plus compact de rajouter des nombres premiers pour un total de diviseurs égal à 16. En fait, on peut toujours réduire le nombre de diviseurs en rajoutant une puissance d'un autre nombre premier plus grand.

In [13]:

2 ** 14 * 3

Out[13]:

En fait là on a maintenant 15 * 2 = 30 diviseurs. Du coup, si on en veut 16, il faut mettre 2 à la puissance 7.

In [14]:

2 ** 7 * 3

Out[14]:

Effectivement, c'est déjà beaucoup plus petit. Et on vient d'apprendre la règle que quand on rajoute un nombre premier, on doit baisser le nombre de diviseurs de 2 d'un facteur 2 et rajouter un 1 sur le nombre suivant.

In [15]:

2 ** 3 * 3 * 5

Out[15]:

In [16]:

2 ** 1 * 3 * 5 * 7

Out[16]:

In [18]:

210 * 4 / 7

Out[18]:

120.0

In [17]:

2 * 3 * 5 * 7 * 11

Out[17]:

Autre propriété : si les exposants sont tous 1 alors pour avoir 16 diviseurs, il y a maximum 4 nombres premiers dans l'écriture recherchée car $2 * 2 * 2 * 2 = 16$. Dans le cas de l'exposé, il y a au maximum $2^n = 2^{500500}$ c'est à dire $n = 500500$ nombres premiers dans l'écriture du nombre cherché. On pourrait donc déjà calculer une table de nombres premiers de cette taille là.

La stratégie pourrait donc être :

on connaît le nombre maximums de nombres premiers
on cherche à en éliminer, sachant qu'on a un tradeoff :
- si je diminue l'exposant, je dois en augmenter un autre, j'ai tout intérêt à augmenter un petit exposant
- si on gagne dans cette opération, alors il faut la faire
- sinon, on a trouvé le bon nombre

Formellement : le nombre cherché s'écrit à l'aide d'un certain nombre de nombres premiers $n$ (inconnu a priori)

$$ x = \prod_{i=1}^{n} p_i^{w_i} $$

avec

$$ \prod_{i=1}^{n} (w_i + 1) = 2^{500500} $$

On sait que $n$ vaut au maximum $500500$.

Les règles d'optimisation sont que si on baisse l'exposant du nombre le plus grand $n$, et que l'on incrémente l'exposant du nombre $k$ alors on obtient un nouveau nombre qui est multiplié par

$$\alpha = \frac{p_k^2}{p_n}$$

Si $\alpha < 1$ alors l'opération est bénéfique.

Par contre, on veut conserver le nombre de diviseurs total, qui passe de $\prod_{i=1}^{n} (w_i + 1) = 2^{500500}$ à $\prod_{i=1 i \neq k}^{n-1} (w_i + 1) * (w_k + 3)$. Il est donc multiplié par

$$ \frac{w_k + 3}{(w_n + 1)(w_k + 1)} $$

Si on veut que le changement du nombre de diviseurs soit égale à 1, c'est-à-dire qu'il y ait le même nombre de diviseurs au début comme à la fin, il faut que :

$$ w_n (w_k + 1) = 2 $$

Donc en fait ce qu'il faudrait connaître c'est la décomposition en nombres premiers de 500500 pour savoir combien on peut incrémenter de nombre sur ce principe. Car on ne peut pas faire toutes les transformations que l'on veut !

Bonne nouvelle, Wolfram Alpha nous indique que :

$$500500 = 2^2 * 5^3 * 7 * 11 * 13$$

Donc

$$2^{500500} = 2^{2^2 * 5^3 * 7 * 11 * 13}$$

Si on redémarre dans le cas 120 avec

In [19]:

2 * 3 * 5 * 7

Out[19]:

In [20]:

2**3 * 3**3

Out[20]:

In [21]:

2**7 * 3

Out[21]:

Le nombre de diviseurs est le bon : $2^4$.

Tentative d'écriture d'un algorithme¶

L'idée est la suivante : on donne les poids et on essaye de modifier itérativement les poids au fur et à mesure.

Exemple, on boucle sur k en prenant l'indice le plus bas. Si la condition d'incrémentation est vérifiée, on calcule le facteur $\alpha$ obtenu. Si on gagne effectivement quelque chose, alors on le fait, sinon on passe.

L'algorithme sur les nombres premiers est tiré de http://stackoverflow.com/questions/2068372/fastest-way-to-list-all-primes-below-n/3035188#3035188.

In [2]:

def rwh_primes1(n):
    # http://stackoverflow.com/questions/2068372/fastest-way-to-list-all-primes-below-n-in-python/3035188#3035188
    """ Returns  a list of primes < n """
    sieve = [True] * int(n/2)
    for i in range(3,int(n**0.5)+1,2):
        if sieve[int(i/2)]:
            sieve[int(i*i/2)::i] = [False] * int((n-i*i-1)/(2*i)+1)
    return [2] + [2*i+1 for i in range(1, int(n/2)) if sieve[i]]

In [37]:

print(rwh_primes1(100))

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]

In [97]:

from math import log

class euler500_solver():
    def __init__(self, number_of_divisors, primes):
        self.number_of_divisors = number_of_divisors
        self.max_primes = int(log(number_of_divisors) / log(2))
        self.primes = primes[:self.max_primes]
        self.weights = [1] * self.max_primes
    
    def step(self):
        max_index = [(ind, v) for (ind, v) in enumerate(self.weights) if v!= 0][-1][0]
        for i in range(max_index + 1):
            if self.weights[max_index] * (self.weights[i] + 1) == 2:
                if self.primes[i]**2 / self.primes[max_index] < 1:
                    self.weights[i] += 2
                    self.weights[max_index] -= 1
                    return True
        return False
        
    def compute_current_number(self, modulo=None):
        factors = ([p**w for (p, w) in zip(self.primes, self.weights)])

        if modulo == None:
            product = 1
            for f in factors:
                product *= f
            return product
        else:
            product = 1
            for f in factors:
                product = (product * f) % modulo
            return product

In [98]:

e = euler500_solver(16, rwh_primes1(100))

In [99]:

e.primes

Out[99]:

[2, 3, 5, 7]

In [100]:

e.weights

Out[100]:

[1, 1, 1, 1]

In [101]:

e.compute_current_number()

Out[101]:

In [102]:

e.step()

Out[102]:

True

In [103]:

e.compute_current_number()

Out[103]:

In [104]:

e.step()

Out[104]:

False

In [105]:

e.compute_current_number()

Out[105]:

On trouve la bonne solution. Comment étendre ça au cas qui nous intéresse ? Il faudrait idéalement un cas intermédiaire qui ne fasse pas exploser l'algorithme.

In [4]:

primes = rwh_primes1(10000000)

In [78]:

len(primes) / 500500

Out[78]:

1.3278301698301698

Okay, on a assez de nombres premiers.

In [106]:

e = euler500_solver(2**500500, primes)

In [107]:

e.step()

Out[107]:

True

In [108]:

e.step()

Out[108]:

True

In [109]:

e.step()

Out[109]:

True

In [110]:

last_step = e.step()
while last_step:
    last_step = e.step()

In [111]:

e.compute_current_number(modulo=500500507)

Out[111]:

493807392

In [115]:

%matplotlib inline
from pylab import plot, array, xlim

In [116]:

plot(e.weights)
xlim(0, 10000)

Out[116]:

(0, 10000)

In [96]:

plot(array(e.weights).cumsum())

Out[96]:

[<matplotlib.lines.Line2D at 0x10c9a3470>]

In [112]:

max(e.weights)

Out[112]:

Exemple avec 32 diviseurs¶

In [123]:

def compute_number_of_divisors(weights):
    prod = 1
    for weight in weights:
        if weight != 0:
            prod *= (weight + 1)
    return prod

In [125]:

def compute_current_number(primes, weights):
    product = 1
    for p, w in zip(primes, weights):
        if w != 0:
            product *= p ** w
    return product

On initialise :

In [117]:

p = primes[:5]

In [118]:

Out[118]:

[2, 3, 5, 7, 11]

In [154]:

weights = [1, 1, 1, 1, 1]

Notre position de départ est :

In [155]:

compute_number_of_divisors(weights)

Out[155]:

In [156]:

compute_current_number(p, weights)

Out[156]:

On veut améliorer ce résultat. On essaye donc de se débarasser du plus haut nombre premier :

In [157]:

weights[4] = 0
weights

Out[157]:

[1, 1, 1, 1, 0]

Ceci réduit le nombre de diviseurs :

In [158]:

compute_number_of_divisors(weights)

Out[158]:

In [159]:

 compute_current_number(p, weights)

Out[159]:

On peut augmenter n'importe lequel des facteurs premiers dans ce cas là :

In [160]:

weights[0] += 2

In [161]:

weights

Out[161]:

[3, 1, 1, 1, 0]

In [162]:

compute_number_of_divisors(weights)

Out[162]:

In [163]:

compute_current_number(p, weights)

Out[163]:

On se retrouve au status quo. Et si on diminuait encore l'exposant le plus grand ?

In [164]:

weights[3] = 0

In [165]:

weights

Out[165]:

[3, 1, 1, 0, 0]

In [167]:

compute_number_of_divisors(weights)

Out[167]:

In [166]:

compute_current_number(p, weights)

Out[166]:

On peut envisager deux possibilités :

soit augmenter le poids de 2, qui est déjà 3
soit augmenter le poids de 3, qui est 1

Comparons les deux cas.

In [172]:

compute_number_of_divisors([7, 1, 1, 0, 0])

Out[172]:

In [173]:

compute_current_number(p, [7, 1, 1, 0, 0])

Out[173]:

In [174]:

compute_number_of_divisors([3, 3, 1, 0, 0])

Out[174]:

In [176]:

compute_current_number(p, [3, 3, 1, 0, 0])

Out[176]:

Donc là, on a plutôt intérêt à augmenter le facteur 3!

In [177]:

weights = [3, 3, 1, 0, 0]

On peut encore essayer d'aller plus loin.

In [179]:

compute_number_of_divisors([7, 3, 0, 0, 0])

Out[179]:

In [178]:

compute_current_number(p, [7, 3, 0, 0, 0])

Out[178]:

Conclusions sur l'exemple avec 32 : j'ai appris que les poids ne pouvaient être que des puissances de 2 moins 1. Et que du coup pour choisir correctement, il fallait toujours vérifier le prochain voisin de poids différents des poids initiaux.

Nouvelle tentative¶

In [235]:

class euler500_solver():
    def __init__(self, number_of_divisors, primes):
        self.number_of_divisors = number_of_divisors
        self.max_primes = int(log(number_of_divisors) / log(2))
        self.primes = primes[:self.max_primes]
        self.weights = [1] * self.max_primes
    
    def step(self):
        max_index = [(ind, v) for (ind, v) in enumerate(self.weights) if v!= 0][-1][0]
        max_prime = self.primes[max_index]
        for current_index in range(max_index + 1):
            current_weight = self.weights[current_index]
            current_prime = self.primes[current_index]
            next_weight = 2 * current_weight + 1
            delta_weight = next_weight - current_weight
            if current_prime ** delta_weight / max_prime < 1:
                self.weights[max_index] -= 1
                self.weights[current_index] = next_weight
                return True
                break
        return False
        
    def compute_current_number(self, modulo=None):
        factors = ([p**w for (p, w) in zip(self.primes, self.weights)])

        if modulo == None:
            product = 1
            for f in factors:
                product *= f
            return product
        else:
            product = 1
            for f in factors:
                product = (product * f) % modulo
            return product

On teste le nouvel algorithme sur le cas 16 :

In [181]:

e = euler500_solver(16, rwh_primes1(100))

In [182]:

e.step()

Out[182]:

True

In [183]:

e.compute_current_number()

Out[183]:

In [184]:

e.step()

Out[184]:

False

Sur le cas 32 :

In [185]:

e = euler500_solver(32, rwh_primes1(100))

In [186]:

e.step()

Out[186]:

True

In [187]:

e.compute_current_number()

Out[187]:

In [189]:

e.weights

Out[189]:

[3, 1, 1, 1, 0]

In [192]:

compute_number_of_divisors(e.weights)

Out[192]:

Le résultat attendu semble marcher.

In [193]:

e = euler500_solver(128, rwh_primes1(100))

In [194]:

e.step()

Out[194]:

True

In [195]:

e.step()

Out[195]:

True

In [196]:

e.step()

Out[196]:

False

In [197]:

e.weights

Out[197]:

[3, 3, 1, 1, 1, 0, 0]

On peut maintenant tester le vrai cas :

In [236]:

e = euler500_solver(2**500500, primes)

In [237]:

%%time
last_step = e.step()
while last_step:
    last_step = e.step()

CPU times: user 1min 23s, sys: 18.5 s, total: 1min 42s
Wall time: 1min 50s

In [240]:

e.weights[:20]

Out[240]:

[31, 15, 15, 15, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 3, 3, 3, 3, 3]

In [239]:

e.compute_current_number(modulo=500500507)

Out[239]:

35407281

Solution optimisée Numpy¶

In [208]:

a = np.array([0, 1, 1, 0])

In [212]:

a.nonzero()[0][-1]

Out[212]: