Lucrarea nr. 3 TEHNICI DE SORTARE A TABLOURILOR 1. Scopul lucrarii: prezentarea celor mai cunoscute metode de sortare a tablourilor. 2. Aspecte teoretice In cele ce urmeaza vom presupune ca tablourile de sortat sint definite dupa cum urmeaza: TYPE TipElement=RECORD cheie:Integer; {alte cimpuri} END; TipIndex=1..N; TipTablou=ARRAY[TipIndex] OF TipElement; VAR a : TipTablou; Se mentioneaza ca tipul cimpului "cheie" poate fi orice tip pe care e definita o relatie de ordonare (intreg, real, sir de caractere, enumerare). Algoritmii de sortare se deosebesc intre ei prin eficienta, timp de executie necesar, exprimat prin functia O. Sint folositi pentru aprecierea eficientei si: numarul compararilor de chei efectuate pentru sortare (C), mai ales atunci cind cheile sint siruri lungi de caractere si numarul miscarilor (asignarilor) de elemente (M),atunci cind dimensiunea elementelor tabloului este mare, in aceasta situatie fiind indicat ca pentru sortare sa se foloseasca un tablou paralel de cursori la elementele celui initial. Acesti indicatori depind de numarul elementelor tabloului (N). 2.1 Metode de sortare care nu iau in considerare structura si valorile cheilor. 2.1.1 Metode directe de sortare Se caracterizeaza prin claritate, simplitate si eficienta pentru valori mici ale lui N (<100), timpii lor de executie fiind O(N*N). 2.1.1.a. Sortarea prin insertie Principiu: tabloul este vazut ca fiind format din doua subtablouri a[1], a[2],..., a[i-1] si respectiv a[i], a[i+1],..., a[N] (i=2,N). Secventa a[1],...,a[i-1] este ordonata si urmeaza ca a[i] sa fie inserat in aceasta secventa la locul potrivit, astfel incit secventa a[1],...,a[i-1],a[i] sa devina ordonata, urmind ca in pasul urmator cele doua subtablouri considerate sa fie a[1],...,a[i] si a[i+1],...,a[N]. Pentru a gasi locul in care trebuie sa fie inserat a[i] se parcurge sirul a[1],...,a[i-1] de la dreapta spre stinga, pina cind fie se gaseste un element cu cheia <= a[i].cheie, fie s-a atins capatul sirului. Aici se poate utiliza metoda fanionului, extinzind tabloul spre stinga cu elementul a[0] care se asigneaza initial cu a[i] (deci TipIndex=0..N). Implementarea algoritmului in Pascal: procedure Insertie; VAR i,j : TipIndex; begin for i:=2 to N do begin {insereaza a[i] la locul potrivit in sirul a[1]...a[i]} a[0]:=a[i]; j:=i-1; {cauta locul de inserare} while a[j].cheie > a[0].cheie do begin a[j+1]:=a[j]; j:=j-1 end; a[j+1]:=a[0] end; end; {Insertie} In cazul sortarii prin insertie C si M sint de ordinul N*N, avind valori minime cind tabloul e ordonat si maxime cind tabloul e ordonat descrescator. Aceasta metoda este stabila. 2.1.1.b. Sortarea prin insertie binara Principiu: reprezinta o varianta a sortarii prin insertie, in care cautarea locului de inserare se face aplicind cautarea binara, stiind ca secventa a[1],...,a[i-1] este deja ordonata. Implementarea algoritmului in Pascal: procedure InsertieBinara; VAR i,j,s,d,m : TipIndex; x : TipElement; begin for i:=2 to N do begin x:=a[i]; s:=1; d:=i-1; while s<=d do begin m:=(s+d) div 2; if a[m].cheie > x.cheie then d:=m-1 else s:=m+1 end; for j:=i-1 downto s do a[j+1]:=a[j]; a[s]:=x end end; {InsertieBinara} In cadrul acestei metode, C este de ordinul N*log N, iar M de N*N. Se obtin valori minime ale lui C pentru tablouri ordonate invers si valori maxime pentru tablouri ordonate. 2.1.1.c. Sortarea prin selectie Principiu: se considera subtabloul a[i],...,a[N], se cauta elementul cu cheia minima din acest subtablou si apoi se interschimba acest element cu elementul a[i], repetindu-se procedeul pentru valori ale lui i de la 1 la N-1. Implementarea algoritmului in Pascal: procedure Selectie; VAR i,j,k : TipIndex; x : TipElement; begin for i:=1 to N-1 do begin k:=i; x:=a[i]; for j:=i+1 to N do if a[j].cheie < x.cheie then begin x:=a[j]; k:=j end; a[k]:=a[i]; a[i]:=x end end; {Selectie} In cazul sortarii prin selectie C este de ordinul N*N , iar M este de ordinul N*ln N. Aceasta metoda este mai putin rapida pentru tablouri ordonate sau aproape ordonate. 2.1.1.d. Sortarea prin selectie performanta Principiu: reprezinta o varianta a sortarii prin selectie, in care determinarea elementului cu cheia minima dintr-o portiune de tablou se reduce la determinarea pozitiei acestuia. In felul acesta se poate renunta la asignarea x:=a[j] care apare in ciclul "for" controlat de j. Implementarea algoritmului in Pascal: procedure SelectiePerform; VAR i,j,min : TipIndex; x : TipElement; begin for i:=1 to N-1 do begin min:=i; for j:=i+1 to N do if a[j].cheiea[j].cheie then begin x:=a[j-1]; a[j-1]:=a[j]; a[j]:=x end end; {BubbleSort} 2.1.1.f. Sortarea prin amestecare (shakersort) Principiu: reprezinta o varianta a metodei bubblesort, avind urmatoarele imbunatatiri: -la fiecare parcurgere a subtabloului a[i],...,a[N] se memoreaza indicele k al ultimei interschimbari efectuate, astfel incit la urmatoarea trecere un capat al subtabloului va fi marcat de k (intre 1 si k tabloul este ordonat); -se schimba alternativ sensul de parcurgere al subtablourilor pentru doua treceri consecutive. Implementarea algoritmului in Pascal: procedure ShakerSort; VAR j,k,l,r : TipIndex; x : TipElement; begin l:=2; r:=N; k:=N; repeat for j:=r downto l do if a[j-1].cheie>a[j].cheie then begin x:=a[j-1]; a[j-1]:=a[j]; a[j]:=x; k:=j end; l:=k+1; for j:=l to r do if a[j-1].cheie>a[j].cheie then begin x:=a[j-1]; a[j-1]:=a[j]; a[j]:=x; k:=j end; r:=k-1 until l > r end; {ShakerSort} La sortarile bubblesort si shakersort, M si C sint proportionali cu N*N, metodele fiind mai putin performante decit cele anterioare. 2.1.2 Metode avansate de sortare Sint mai complexe, mai dificil de inteles, dar mai rapide, avind timpii de executie O(N*log N). 2.1.2.a. Sortarea prin insertie cu diminuarea incrementului (Shellsort) Principiu: reprezinta o perfectionare a metodei de sortare prin insertie. Se alege o secventa de numere naturale h1, h2,..., ht numite incrementi, care satisfac conditiile: ht=1 si h(i+1) < hi pentru i=1,t-1 Se realizeaza t treceri asupra tabloului, la fiecare trecere i luindu-se in considerare elementele a[1], a[1+hi], a[1+2*hi] etc. Aceste elemente se sorteaza aplicind metoda insertiei, cu utilizarea fanionului. S-a demonstrat ca eficienta algoritmului creste daca valorile incrementilor nu sint puteri ale lui 2. Pentru a putea folosi tehnica fanionului la aceasta metoda este necesar sa se prelungeasca tabloul a spre stinga cu inca h1 elemente. Implementarea algoritmului in Pascal: procedure ShellSort; const h1=...; var i,j,k,s : -h1+1..N; x : TipElement; m : 1..t; h : ARRAY[1..t] OF Integer; a : ARRAY[-h1+1..N] OF TipElement; begin {initializarea elementelor lui h} for m:=1 to t do begin k:=h[m]; s:=-k; {pozitia fanionului} for i:=k+1 to N do begin j:=i-k; if s=0 then s:=-k; inc(s); a[s]:=a[i]; while a[s].cheie 1 do begin s:=s-1; Deplasare(s,N); end; {sortare} while d > 1 do begin x:=a[1]; a[1]:=a[d]; a[d]:=x; d:=d-1; Deplasare(1,d) end end; {HeapSort} Procedura Deplasare(s,d) realizeaza glisarea elementului a[s] astfel ca subtabloul a[s],...,a[d] (sx.cheie. Apoi se parcurge tabloul de la dreapta, pina cind se gaseste primul element a[j].cheie x.cheie. Procedura descrisa se aplica in continuare pe rind celor doua partitii obtinute, apoi celor patru partitii s.a.m.d., pina cind fiecare partitie ajunge sa fie formata dintr-un singur element. Implementarea algoritmului in Pascal: metoda Quicksort se poate implementa in doua moduri: recursiv si nerecursiv. In ambele cazuri s-a convenit ca elementul x sa fie ales la mijlocul tabloului (respectiv partitiei). procedure QuickSort_Recursiv; VAR m:TipIndex; procedure Sortare(s,d:TipIndex); VAR i,j:TipIndex; x,w:TipElement; begin i:=s; j:=d; x:=a[(s+d) div 2]; repeat while a[i].cheiex.cheie do j:=j-1; if i<=j then begin w:=a[i]; a[i]:=a[j]; a[j]:=w; i:=i+1; j:=j-1 end until i>j; if si then Sortare(i,d); end; {Sortare} begin m:=1; Sortare(m,N) end; {QuickSort_Recursiv} procedure QuickSort_Nerecursiv; CONST m=12; {dimensiunea stivei} TYPE NodStiva=RECORD s,d:TipIndex end; VAR i,j,s,d:TipIndex; x,w:TipElement; is : 0..m; Stiva : ARRAY[1..m] OF NodStiva; begin is:=1; Stiva[1].s:=1; Stiva[1].d:=N; repeat {extragere limite partiale din virful stivei} s:=Stiva[is].s; d:=Stiva[is].d; is:=is-1; repeat {partitionarea sirului a[s],...,a[d]} i:=s; j:=d; x:=a[(s+d) div 2]; repeat while a[i].cheiex.cheie do j:=j-1; if i<=j then begin w:=a[i]; a[i]:=a[j]; a[j]:=w; i:=i+1; j:=j-1 end until i>j; if i=d until is=0 end; {QuickSort_Nerecursiv} In cazul algoritmului nerecursiv este necesara o stiva care memoreaza limitele uneia dintre cele doua partitii care apar la o trecere, si anume limitele partitiei care este tratata a doua (aici, partitia dreapta). Timpul de executie este O(N* log N) si O(N*N), in cazul cel mai defavorabil. 2.2. Metode de sortare care tin cont de valorile cheilor 2.2.1. Tehnica binsort Se poate aplica in cazul in care cheile sint valori de tip intreg cuprinse in intervalul 1..N si nu exista duplicate. Principiu: se parcurge tabloul a, verificindu-se daca elementul a[i] are cheia j egala cu i. Daca j<>i se interschimba elementele a[i] si a[j]. Implementarea algoritmului in Pascal: procedure BinSort; VAR i:TipIndex; temp:TipElement; begin for i:=1 to N do while a[i].cheie<>i do begin temp:=a[i]; a[i]:=a[temp.cheie]; a[temp.cheie]:=temp end end; {BinSort} Timpul de executie este O(N). 2.3. Metode de sortare care folosesc baze de numeratie (Radix Sort) Aceste metode trateaza cheile de sortat ca numere reprezen- tate intr-o anumita baza de numeratie R (radix) si lucreaza cu cifrele individuale ale numarului. Pentru implementarea pe sisteme de calcul se preteaza metodele care utilizeaza R=2 si care lucreaza deci cu bitii ce formeaza numerele. In sortarea radix cu R=2 operatia fundamentala necesara este extractia unui set contiguu de biti dintr-un numar. In Pascal aceasta operatie se poate simula cu ajutorul operatorilor "div" si "mod". Ca atare se va defini o functie care va returna "j biti care apar la k pozitii de la marginea dreapta a lui x", unde x este numarul considerat: function Biti(x,k,j:Integer):Integer; VAR doik,doij,i:Integer; begin doik:=1; doij:=1; for i:=1 to k do doik:=doik*2; {2 la puterea k} for i:=1 to j do doij:=doij*2; {2 la puterea j} Biti:=(x div doik) mod doij end; {Biti} 2.3.a Sortarea radix prin interschimbare Principiu: se bazeaza pe faptul ca rezultatul comparatiei a doua chei este determinat numai de valoarea bitilor din prima pozitie la care ele difera (considerind bitii de la stinga spre dreapta). Astfel, cheile care au primul bit=0 sint trecute in fata celor care au primul bit=1; in continuare in fiecare grup se aplica aceeasi metoda, pentru bitul urmator s.a.m.d. Procesul se desfasoara ca si la metoda Quicksort: se baleiaza tabloul de la stinga spre dreapta pina se gaseste o cheie care incepe cu 1; se baleiaza apoi de la dreapta spre stinga pina se gaseste o cheie care incepe cu 0; se interschimba cele doua chei; se continua in felul acesta pina cind indicii de parcurgere se intilnesc: in acest moment tabloul are doua partitii. Se reia procedura expusa, considerind al doilea bit, pentru fiecare din partitiile rezultate etc. Implementarea algoritmului in Pascal: procedure RadixSchimb(s,d:TipIndex; b:Integer); {s,d - limitele partitiei de sortat b - lungimea cheii-1 exprimata in biti=14 (chei pozitive)} VAR i,j:TipIndex; t:TipElement; begin if (d>s) and (b>=0) then begin i:=s;j:=d; repeat while (Biti(a[i].cheie,b,1)=0) and (i