w10 1

w10 1, pk niestac 2st IIsem, MZT, wykłady
[ Pobierz całość w formacie PDF ]
Metody, alternatywne metodzie wielofrontalnej
Û
Zalety.
Metoda wielofrontalna oszczędnie pracuje z
pamięcią główną, nadaje się do wirtualizacji – jeśli rozmiar
zadania przekracza możliwości pamięci głównej, dane,
przeznaczone dla przechowywania macierzy poprawek, mogą
być zapisane na dysk. Oprócz tego, bloki, zawierające części
macierzy sfaktoryzowanej, też mogą być wyładowane na dysk.
Û
Wady.
Metoda wielofrontalna wykonuje dużo transferów
danych z jednego obszaru pamięci do innego, nawet jeśli
zadanie mieści się w pamięci głównej. Występuje to przy
kopiowaniu kompletnie sfaktoryzowanej części macierzy
frontalnej, przy agregowaniu kolejnej macierzy frontalnej itd.
Metody, alternatywne metodzie wielofrontalnej
Û
Takie operacji należą do procedur niskiej wydajności,
oprócz tego dla komputerów z pamięcią wspólną procedury
kopiowania są przyspieszone bardzo słabo przy zwiększeniu
ilości wątków.
Û
Obniża to wydajność solwerów wielofrontalnych oraz ich
speed up.
Û
Powstaje
interes
do
rozwinięcia
metod
alternatywnych,
orientowanych
w
pierwszej
kolejce
na
komputery
wielordzeniowe.
PARDISO
(Intel Math Kernel Library)
Û
Ograniczymy się rozważaniem solwera PARDISO dla macierzy
symetrycznych, mających niezerowe elementy diagonalne. To są typowe
macierzy sztywności MES dla zadań mechaniki ciała sztywnego oraz mechaniki
konstrukcji. Takie macierzy nie wymagają wykonania permutacji w trakcie
faktoryzacji numerycznej, ponieważ na każdym kroku wiodącym elementem
służy odpowiedni element diagonalny.
Û
Liczne testy świadczą o to, że PARDISO wykazuje znacznie większą
wydajność oraz speedup na komputerach wielordzeniowych w porównaniu do
solwera wielofrontalnego.
Û
Formalnie PARDISO ma tryb OOC (out-of-core), jednak dla dużych zadań
ten tryb nie działa.
PARFES
Û
Posłużyło to motywacją do opracowania solwera PARFES
(Parallel Finite Element Solver), który
O
w trybie core mode (CM) powinien wykazywać wydajność i
speedup, porównywalny do PARDISO
O
jeśli rozmiar zadania przekracza możliwości pamięci
głównej, solwer powinien automatycznie przejść do trybu
OOC – podłączyć dysk. Nawet w trybie OOC solwer powinien
wykazywać stabilny speedup.
Przykład ramy płaskiej
Graf przyległości dla węzłów
modelu obliczeniowego przed
uporządkowaniem
Rama płaska
[ Pobierz całość w formacie PDF ]
  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • diabelki.xlx.pl
  • Podobne
    Powered by wordpress | Theme: simpletex | © Spojrzeliśmy na siebie szukając słów, które nie istniały.