Divide et Impera

Per spiegare la tecnica usiamo come esempio il problema della selezione:

Data una lista A di $n$ interi distinti ed un intero $k$ con $1 \leq k \leq n$ vogliamo sapere quale elemento occuperebbe la posizione $k$ se il vettore venisse ordinato.

Individuiamo alcuni casi particolari:

Per $k = 1$ abbiamo il minimo di $A$
Per $k = n$ avremo il massimo di $A$
Per $k = ⌈ \frac{n}{2} ⌉$ avremo il mediano di $A$

Un semplice algoritmo potrebbe essere:

def selezione1(A, k):
	A.sort()
	return A[k-1]

Che ha come costo $Θ (n lo g n)$ .

Usando però il divide et impera avremo un costo di $Θ (n)$ nel caso generale, dimostreremo quindi che il problema della selezione è computazionalmente più semplice di quello dell’ordinamento che richiede tempo $Ω (n lo g n)$

Approccio basato sul Divide et Impera:

Scegli nella lista A l’elemento in posizione $A [0]$ che chiamiamo perno
A partire da $A$ costruisci due liste $A_{1}, A_{2}$ , la prima contiene gli elementi di $A$ minori del perno e la seconda i maggiori
Dove si trova l’elemento di rango $k$ ?
- Se $∣ A_{1} ∣ \geq k$ allora l’elemento di rango $k$ è nel vettore $A_{1}$
- Se $∣ A_{1} ∣ = k - 1$ allora l’elemento di rango $k$ è proprio il perno
- Se $∣ A_{1} ∣ < k - 1$ allora l’elemento di rango $k$ è in $A_{2}$ , è l’elemento di rango $k - ∣ A_{1} ∣ - 1$ in $A_{2}$

Implementazione:

def selezione2(A,k):
	if len(A) == 1:
		return A[0]
	perno = A[0]
	A1, A2 = [], []
	for i in range(len(A)):
		if A[i] < perno:
			A1.append(A[i])
		else:
			A2.append(A[i])
	if len(A1) >= k:
		return selezione2(A1, k)
	elif len(A1) == k-1:
		return perno
	return selezione2(A2, k - len(A1) - 1)

Questa procedura che tripartisce la lista può però restituire una partizione massimamente sbilanciata in cui si ha ad esempio $∣ A 1∣ = 0, ∣ A 2 = n - 1∣$ ovvero quando il perno è l’ultimo elemento della lista.

Se poi questo caso si ripete ad ogni partizione creata dall’algoritmo allora la complessità di questo sarebbe catturata da:

T (n) T (n) = T (n - 1) + Θ (n) = Θ (n^{2})

In generale la complessità superiore dell’algoritmo è data da:

T (n) = T (m) + Θ (n)

Dove $m = ma x {∣ A 1∣, ∣ A 2∣}$

Quindi se avessimo una scelta del perno che garantisca sempre un equilibrio fra le liste che crea l’algoritmo avremo che:

m = ma x {∣ A 1∣, ∣ A 2∣} \approx \frac{n}{2}

E quindi la complessità diventa:

T (n) T (n) = T (\frac{n}{2}) + Θ (n) = Θ (n)

Ovviamente avere sempre un perno che divide a metà le liste è troppo, osserviamo che in realtà possiamo accontentarci di una qualsiasi frazione $n$ anche piuttosto vicina ed ottenere sempre $T (n) = Θ (n)$ .

Ad esempio se $m = ma x {∣ A 1∣, ∣ A 2∣} \approx \frac{3 n}{4}$ abbiamo:

T (n) \leq T (\frac{3}{4} n) + Θ (n) = Θ (n)

Proviamo quindi a scegliere il perno a caso in modo equiprobabile tra gli elementi della lista, in questo modo anche se la scelta non produce una lista perfettamente bilanciata avremo comunque una complessità lineare.

def selezione2R(A, k):
 
	if len(A)==1
		return A[0]
	perno = A[randint(0, len(A) - 1)]
	A1, A2 = [], []
	for x in A:
		if x < perno:
			A1.append(x)
		elif x > perno:
			A2.append(x)
	if len(A1) >= k:
		return selezione2R(A1, k)
	elif len(A1) == k - 1:
		return perno
	return selezione2R(A2, k - len(A1) - 1)

Con questo algoritmo abbiamo che con alta probabilità il costo è lineare mentre al caso peggiore, che accade con una probabilità molto piccola è di $O (n^{2})$ .

C’è in realtà un algoritmo deterministico che garantisce una complessità di $O (n)$ anche al caso pessimo.

Questo modo noto come mediano dei mediani garantisce che il perno scelto produce sempre due sottoliste A1 e A2 ciascuna delle quali ha non più di $\frac{3}{4} n$ elementi.

Dividi l’insieme A da $n$ elementi in gruppi da 5, ovviamente l’ultimo potrebbe non averne 5. Si prendono in considerazione soltanto i primi $⌊ \frac{n}{5} ⌋$ gruppi.
Si trova il mediano all’interno di ciascuno di questi gruppi
Si calcola il mediano $p$ dei mediani precedenti
Si usa $p$ come pivot per $A$

def selezione(A, k):
	if len(A) <= 120:
		A.sort()
		return A[k - 1]
	B = [sorted(A[5*i:5*i+5])[2] for i in range(len(A)//5)]
	perno = selezione(B, ceil(len(A)/10))
	A1, A2 = [], []
	for x in A:
		if x < perno:
			A1.append()
		elif x > perno:
			A2.append()
	if len(A1) >= k:
		return selezione(A1, k)
	elif len(A1) == k - 1:
		return perno
	return selezione(A2, k - len(A1) - 1)

Questo algoritmo quindi risolve il problema in modo lineare anche al caso pessimo, però a causa delle grandi costanti nascoste nell’ $O (n)$ , in realtà l’algoritmo random di prima si comporta meglio.

👨🏻‍💻 Alem's Notes

Divide et Impera

Backlinks