w10 1, pk niestac 2st IIsem, MZT, wykłady
[ Pobierz całość w formacie PDF ]
Metody, alternatywne metodzie wielofrontalnej Û Zalety. Metoda wielofrontalna oszczędnie pracuje z pamięcią główną, nadaje się do wirtualizacji – jeśli rozmiar zadania przekracza możliwości pamięci głównej, dane, przeznaczone dla przechowywania macierzy poprawek, mogą być zapisane na dysk. Oprócz tego, bloki, zawierające części macierzy sfaktoryzowanej, też mogą być wyładowane na dysk. Û Wady. Metoda wielofrontalna wykonuje dużo transferów danych z jednego obszaru pamięci do innego, nawet jeśli zadanie mieści się w pamięci głównej. Występuje to przy kopiowaniu kompletnie sfaktoryzowanej części macierzy frontalnej, przy agregowaniu kolejnej macierzy frontalnej itd. Metody, alternatywne metodzie wielofrontalnej Û Takie operacji należą do procedur niskiej wydajności, oprócz tego dla komputerów z pamięcią wspólną procedury kopiowania są przyspieszone bardzo słabo przy zwiększeniu ilości wątków. Û Obniża to wydajność solwerów wielofrontalnych oraz ich speed up. Û Powstaje interes do rozwinięcia metod alternatywnych, orientowanych w pierwszej kolejce na komputery wielordzeniowe. PARDISO (Intel Math Kernel Library) Û Ograniczymy się rozważaniem solwera PARDISO dla macierzy symetrycznych, mających niezerowe elementy diagonalne. To są typowe macierzy sztywności MES dla zadań mechaniki ciała sztywnego oraz mechaniki konstrukcji. Takie macierzy nie wymagają wykonania permutacji w trakcie faktoryzacji numerycznej, ponieważ na każdym kroku wiodącym elementem służy odpowiedni element diagonalny. Û Liczne testy świadczą o to, że PARDISO wykazuje znacznie większą wydajność oraz speedup na komputerach wielordzeniowych w porównaniu do solwera wielofrontalnego. Û Formalnie PARDISO ma tryb OOC (out-of-core), jednak dla dużych zadań ten tryb nie działa. PARFES Û Posłużyło to motywacją do opracowania solwera PARFES (Parallel Finite Element Solver), który O w trybie core mode (CM) powinien wykazywać wydajność i speedup, porównywalny do PARDISO O jeśli rozmiar zadania przekracza możliwości pamięci głównej, solwer powinien automatycznie przejść do trybu OOC – podłączyć dysk. Nawet w trybie OOC solwer powinien wykazywać stabilny speedup. Przykład ramy płaskiej Graf przyległości dla węzłów modelu obliczeniowego przed uporządkowaniem Rama płaska [ Pobierz całość w formacie PDF ] |