Ειδικά Συστήματα Ελέγχου Πλοίου (8.3.45.8) Ανασκόπηση Συστημάτων Ελέγχου Δρ. Γεώργιος Παπαλάμπρου 1 Δρ. Γεώργιος Παπαλάμπρου Λέκτορας ΕΜΠ Εργαστήριο Ναυτικής Μηχανολογίας Σχολή Ναυπηγών Μηχανολόγων Μηχανικών Εθνικό Μετσόβιο Πολυτεχνείο email: george.papalambrou@lme.ntua.gr http://www.lme.ntua.gr ενημέρωση: 3/5/2012 ΓΠ XELATEX Περιεχόμενα 1 Εισαγωγή 3 2 Μαθηματικά Μοντέλα 4 3 Προδιαγραφές Μεταβατικής Απόκρισης 5 4 Κλασσικός Έλεγχος 7 5 Βέλτιστος Έλεγχος 5.1 Βέλτιστος Έλεγχος LQG . . . . . . . . . . . . . . . . . . . . . . . . . . 9 11 6 Παρατηρητές και φίλτρα Kalman 13 7 Προσαρμοζόμενος Έλεγχος με Μοντέλο Αναφοράς 7.1 Ιστορική Αναδρομή . . . . . . . . . . . . . . . 7.2 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . 7.3 Απλά συστήματα Direct MRAC . . . . . . . . . 7.4 Σύστημα MRAC εισόδου-εξόδου, με n∗ = 1 . . 7.5 Εύρωστος Προσαρμοζόμενος Έλεγχος . . . . . 7.5.1 Μεθόδος leakage . . . . . . . . . . . . 7.5.2 Μέθοδος dead-zone . . . . . . . . . . . 7.6 Άσκηση Robust MRAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 14 14 15 17 18 20 21 22 8 Αυτοπροσαρμοζόμενος Έλεγχος 23 8.1 Tοποθέτηση πόλων . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 8.2 Ελάχιστη μεταβλητότητα . . . . . . . . . . . . . . . . . . . . . . . . . 25 2 1 Εισαγωγή Στο παρόν κεφάλαιο γίνεται ανασκόπηση της θεωρίας συστημάτων ελέγχου, ώστε να είναι κατανοητές οι διαφορετικές εφαρμογές συστημάτων ελέγχου πλοίων που θα παρουσιαστούν στη συνέχεια. Παραθέτονται στοιχεία από κλασσικό έλεγχο και ελεγκτές PID, βέλτιστο έλεγχο και ελεγκτές Linear Quadratic, παρατηρητές, αυτοπροσαρμοζόμενο έλεγχο (self-tuning) προσαρμοζόμενο έλεγχο με μοντέλο (MRAC). Επίσης παρουσιάζονται τα βασικά χαρακτηριστικά ψηφιακών συστημάτων ελέγχου. Ο σχεδιασμός συστημάτων ελέγχου με ανατροφοδότηση εξόδου (feedback control) έχει δύο στόχους. Ο πρώτος είναι να τροποποιήσει κατά κάποιο τρόπο την δυναμική απόκριση του συστήματος. Ο δεύτερος είναι να μειώσει την ευαισθησία της εξόδου του συστήματος σε διαταραχές. Για παράδειγμα, πολλές φορές είναι επιθυμητό η έξοδος να ακολουθεί το σήμα εισόδου με αποδεκτά γρήγορο τρόπο είτε σε μόνιμη κατάσταση, με σταθερή την είσοδο αναφοράς, η έξοδος να είναι ίση με την αναφορά, παρουσία διαταραχών. Η εικόνα 1 δείχνει τις διαφορετικές μεθόδους συστημάτων ελέγχου που έχουν υιοθετηθεί μέχρι σήμερα σε προσεγγίσεις προβλημάτων ναυπηγικής, όπως ship autopilots, trajectory tracking control, maneuvering, dynamic positioning, κλπ. Τα στοιχεία είναι από τον T. Fossen, [Fos11]. Σχήμα 1: Μέθοδοι συστημάτων ελέγχου που έχουν υιοθετηθεί στην ναυπηγική 3 2 Μαθηματικά Μοντέλα Ως μοντέλο εννοούμε τη μαθηματική περιγραφή δυναμικής μεταβολής του συστήματος που πρόκειται να ελεγχθεί. Τα μοντέλα μας ενδιαφέρουν από τη σκοπιά του σχεδιασμού των συστημάτων ελέγχου και για αυτό τον λόγο έχουν χαμηλή τάξη και μειωμένη πολυπλοκότητα. Τα μοντέλα προέρχονται από τις διαφορικές εξισώσεις που διέπουν το πρόβλημα, από εφαρμογή μεθόδων αναγνώρισης συστημάτων (system identi cation) ή και συνδιασμό τους. Τα μοντέλα έχουν τη μορφή συναρτήσεων μεταφοράς (transfer functions) ή εξισώσεων στο χώρο κατάστασης (state space). Βασική απαίτηση είναι η ικανότητα τους να περιγράφουν τη δυναμική του συστήματος. Στην περίπτωση συναρτήσεων μεταφοράς, περιγράφεται ο λόγος της εξόδου Y (s) πρός την είσοδο U (s), όπου s είναι ο τελεστής Laplace G(s) = Y (s) U (s) (1) Χρησιμοποιούνται τα διαγράμματα Bode, που παριστούν την μεταβολή του μέτρου και της φάσης σε συνάρτηση με την συχνότητα ω. Παράδειγμα Προκειμένου να διατηρείται η πορεία του πλοίου κατά την πλεύση σε επιθυμητή τιμή, χρησιμοποιείται αυτόματος πιλότος πορείας (course-keeping auto-pilot). Οι απλουστευμένες εξισώσεις που περιγράφουν την κίνηση ενός πλοίου στο επίπεδο προέρχονται από τον Nomoto [Fos94]. Η διαφορική εξίσωση είναι T ψ¨ + ψ˙ = Kδ (2) ψ K (s) = δ s(1 + T s) (3) και η συνάρτηση μεταφοράς είναι όπου Τ είναι η σταθερά χρόνου, Κ το κέρδος, ψ η γωνία διεύθυνσης με τον άξονα X0 (heading angle) και δ η γωνία του πηδαλίου (rudder angle). Η εικόνα 2 δείχνει την κίνηση του πλοίου στο οριζόντιο επίπεδο. Η εξίσωση 3 ισχύει για χαμηλές συχνότητες και μικρές τιμές δ (μέχρι 35 μοίρες). Ως είσοδο (μεταβλητή ελέγχου) θεωρούμε τη γωνία του πηδαλίου και ως έξοδο (ελεγχόμενη μεταβλητή) τη γωνία διεύθυνσης. Στην περίπτωση εξισώσεων στο χώρο κατάστασης, x˙ = Ax + Bu, y = Cx + Du όπου x οι καταστάσεις (states), u η είσοδος(οι), y η έξοδος(οι). A είναι ο πίνακας συστήματος, B ο πίνακας εισόδου και C ο πίνακας εξόδου. 4 (4) Σχήμα 2: Η κίνηση του πλοίου στο οριζόντιο επίπεδο Θεωρούμε ότι όλες οι καταστάσεις είναι διαθέσιμες από μετρήσεις. Στην πράξη κάτι τέτοιο είναι δύσκολο λόγω δαπάνης σε όργανα μέτρησης ή αδυναμίας μέτρησης του μεγέθους. Παράδειγμα Δίνεται ηλεκτρομηχανικό σύστημα, σε μορφή εξισώσεων χώρου κατάστασης, με είσοδο ελέγχου. Το διάνυσμα μεταβλητών κατάστασης είναι x(t) = [ταχύτητα επιτάχυνση]. Από τις μεταβλητές κατάστασης μετρούνται και οι δύο με αισθητήρια μοναδιαίου κέρδους, ενώ δεν υπάρχει απευθείας τροφοδότηση εισόδου στην έξοδο. [ ] [ ] [ ] 0 −2 1.5 A= , B= , C= 1 1 (5) 1 −3 3 Πλήρες σύστημα κλειστού βρόχου με ελεγκτή φαίνεται στην εικόνα 3. r u Σ x˙ = Ax + Bu x C y − K Σχήμα 3: Δομικό διάγραμμα για το πλήρες σύστημα κλειστού βρόχου με ελεγκτή Θεωρούμε έλεγχο με μεταβλητές κατάστασης, με μορφή u = −Kx. Οι τιμές του K υπολογίζονται με μέθοδο Ackermann ή βέλτιστο έλεγχο. 3 Προδιαγραφές Μεταβατικής Απόκρισης Σε μια συνάρτηση μεταφοράς, ως πόλοι (poles) ορίζονται οι ρίζες του παρονομαστή και ως μηδενιστές (zeroes) οι ρίζες του αριθμητή. Οι πόλοι του συστήματος καθορίζουν την ευστάθειά του και την μεταβατική του απόκριση. Περιγραφές 5 εφαρμογών με συστήματα πρώτης και δεύτερης τάξης καλύπτουν τις περισσότερες εφαρμογές συστημάτων ελέγχου. Για συστήματα πρώτης τάξης, με συνάρτηση μεταφοράς G(s) = f as + 1 (6) όπου f το κέρδος και a η σταθερά χρόνου, η απόκριση σε βηματική είσοδο φαίνεται στο σχήμα 4. Σχήμα 4: Προδιαγραφές μεταβατικής απόκρισης συστημάτων πρώτης τάξης Το αρχικό σύστημα έχει απόκριση σε βηματική είσοδο u(t) που σχετίζεται με τη σταθερά χρόνου α. Ζητούμενο από ένα σύστημα ελέγχου είναι να αυξηθεί η ταχύτητα απόκρισης σύμφωνα με την νέα επιθυμητή σταθερά χρόνου β. Για συστήματα δεύτερης τάξης, με συνάρτηση μεταφοράς κλειστού βρόχου G(s) = ωn2 s2 + 2ζωn s + ωn2 (7) όπου ωn είναι η φυσική συχνότητα και ζ ο λόγος απόσβεσης, η απόκριση σε βηματική είσοδο φαίνεται στο σχήμα 5. Σχήμα 5: Προδιαγραφές μεταβατικής απόκρισης συστημάτων δεύτερης τάξης Η απόκριση χαρακτηρίζεται από τα ακόλουθα μεγέθη. Ως χρόνος ανύψωσης (rise time), tr , θεωρείται ο χρόνος που απαιτείται για να ανέλθει η απόκριση από 10% σε 90%. Ο χρόνος κορυφής (peak time), tp , είναι ο χρόνος που απαιτείται για να φτάσει η απόκριση στην πρώτη κορυφή της καμπύλης. Η μέγιστη υπερακόντιση (maximum 6 overshoot), Mp , είναι η τιμή της μέγιστης κορυφής της καμπύλης απόκρισης μετρούμενης από τη μονάδα. Ο χρόνος αποκατάστασης (settling time), ts , είναι ο χρόνος που απαιτείται για να φτάσει και να παραμείνει η καμπύλη απόκρισης μέσα σε ορισμένα όρια γύρω από την τελική τιμή, π.χ. 2%. Σε αυτήν την περίπτωση ισχύει ότι ts = 4τ = 4 , τ = 1/ζωn ζωn (8) π √ ωn 1 − ζ 2 (9) Για τον χρόνο κορυφής tp ισχύει tp = Επίσης στην περίπτωση που ισχύει 0.3 ≤ ζ ≤ 0.8, τότε ο χρόνος ανύψωσης tr είναι tr = 2.16ζ + 0.6 ωn (10) Περισσότερα στοιχεία για την μεταβατική απόκριση μπορούν να βρεθούν στα [DB01], [FPEN05], [WZ91]. 4 Κλασσικός Έλεγχος Σε πολλές περιπτώσεις η συμπεριφορά μιας εγκατάστασης σε μεταβατική ή μόνιμη απόκριση δεν είναι ικανοποιητική. Η τροποποίηση των χαρακτηριστικών γίνεται με την εισαγωγή κατάλληλης διάταξης ελέγχου που ονομάζεται κατευθυντής (controller). Ο πιο διαδεδομένος τύπος βιομηχανικού ελεγκτή είναι ο Αναλογικός-Ολοκληρωτικός-Διαφορικός (Proportional-Integral-Derivative/PID). Για ένα τέτοιο ελεγκτή, η σχέση μεταξύ εισόδου u και σφάλματος e είναι u(t) = Kc e(t) + Kc TD de(t) Kc + dt Ti ∫ t e(t) dt (11) 0 Η συνάρτηση μεταφοράς είναι Gc (s) = Kc (1 + TD s + 1 ) Ti s (12) όπου Kc είναι το αναλογικό κέρδος, TD είναι ο χρόνος διαφόρισης και Ti είναι ο χρόνος ολοκλήρωσης. Οι σταθερές μπορούν να προσαρμόζονται ώστε να επιτυγχάνεται η επιθυμητή απόκριση. Βλέπουμε από τη συνάρτηση μεταφοράς ότι ο ελεγκτής αυτού του τύπου περιλαμβάνει δύο μηδενιστές και ένα πόλο στο 0. Σύστημα PID φαίνεται στο Σχήμα 6. 7 − r e u PID Plant Set−Point y Output Σχήμα 6: Σύστημα κλειστού βρόχου με ελεγκτή PID Παράδειγμα PID Δίνεται σύστημα κεφαλής σκληρού δίσκου, με συνάρτηση μεταφοράς G(s) = 700 s2 + 15s + 100000 (13) που συνδέει τη γωνιακή θέση (σε rad) με την εντολή στον κινητήρα θέσης (σε mA). Ζητείται να σχεδιαστεί ελεγκτής PID. Χρησιμοποιούμε ελεγκτή τύπου PI με συνάρτηση μεταφοράς s + 1100 (14) s Οι αποκρίσεις ελεγκτών PI, PID φαίνονται στο σχήμα 7. Όπως φαίνεται στην απόκριση του συστήματος ανοιχτού βρόχου, η συμπεριφορά είναι έντονα ταλαντωτική, λόγω της πολύ χαμηλής απόσβεσης. Με χρήση της εντολής damp(den) προκύπτουν οι ιδιοτιμές, ο συντελεστήςς απόσβεσης και η φυσική συχνότητα. Έτσι εδώ έχουμε ζ = 2.37e − 02, ωn = 3.16e + 02rad/s. Για το συγκεκριμένο παράδειγμα έχουμε τις παρακάτω εντολές. K(s) = den=[1 15 1e5]; num=700; gg=tf(num,den); step(gg) % PI K1=tf([1 1100],[1 0]) L=series(gg,K1) % series connection Gcl1=feedback(L,1); % closed-loop with negative feedback step(Gcl) %PID K2=tf([1.0459 191.64 42857],[1 0]) L2=series(gg,K2) Gcl2=feedback(L2,1); step(Gc2) Στην περίπτωση ελεγκτή PID, ο χρόνος αποκατάστασης (settling time) είναι 0.0025 sec, σε σύγκριση με τα 0.7 sec του συστήματος. Επίσης δεν υπάρχουν οι ταλαντώσεις υψηλής συχνότητας. Το διάγραμμα Bode για το σύστημα κλειστού βρόχου φαίνεται στο Σχήμα 8 . Περισσότερα στοιχεία σχετικά με τα συστήματα κλασσικού ελέγχου υπάρχουν στα [DB01], [FPEN05]. 8 Step response of system Amplitude 0.015 0.01 0.005 Amplitude 0 0.1 0.2 0.3 0.4 0.5 Time (sec) Step response of closed−loop system with PI 0.6 0.7 1 0.5 0 Amplitude 0 0 0.1 0.2 0.3 0.4 0.5 0.6 Time (sec) Step response of closed−loop system with PID 0.7 0.8 1.5 1 0.5 0 0 0.005 0.01 0.015 Time (sec) 0.02 0.025 Σχήμα 7: Απόκριση ελεγκτή PI, PID 5 Βέλτιστος Έλεγχος Ο βέλτιστος έλεγχος εισήχθη το 1960, ταυτόχρονα σε ΗΠΑ και πρώην Σοβιετική Ένωση, την εποχή που παρουσίαζε ενδιαφέρον η έρευνα για καθοδήγηση (guidance) και ελιγμούς (maneuvering). Ο Βέλτιστος Έλεγχος (Optimal control) επιδιώκει η απόδοση να είναι εκτός από αποδεκτή και βέλτιστη. Στον Κλασσικό έλεγχο προσπαθούμε να ελαχιστοποιήσουμε το σφάλμα σε καθορισμένα χρονικά σημεία, π.χ. σφάλμα μόνιμης κατάστασης. Στον Βέλτιστο έλεγχο ελαχιστοποιούμε το σφάλμα παντού. Συνάρτηση κόστους ή δείκτης λειτουργικής απόδοσης (ΔΛΑ-performance index) μπορεί να είναι το ολοκλήρωμα σφάλματος J1 ή το ολοκλήρωμα απόλυτης τιμής σφάλματος J2 ∫ tf ∫ tf J1 = e2 (t)dt, J2 = |e(t)|dt (15) ti ti Για γραμμικό μοντέλο και τετραγωνική συνάρτηση σφάλματος, το πρόβλημα είναι 9 0.03 Bode Diagram 10 Magnitude (dB) 5 0 −5 −10 −15 Phase (deg) −20 30 0 −30 −60 1 10 2 10 Frequency (rad/sec) 3 10 Σχήμα 8: Το διάγραμμα Bode για το σύστημα κλειστού βρόχου γνωστό ως Γραμμικό Τετραγωνικό (Linear Quadratic-LQ). Η συνάρτηση κόστους ορίζεται ως ∫ 1 ∞ T J= (x Qx + uT Ru)dt 2 0 Ο βέλτιστος νόμος ελέγχου (Linear Quadratic Regulator-LQR) προκύπτει με ανατροφοδότηση κατάστασης u = Kx(t) (16) (17) Το κέρδος του ελεγκτή δίνεται από K = −R−1 B T P (18) όπου P είναι συμμετρική θετικά ημιορισμένη λύση της αλγεβρικής εξίσωσης Riccati AT P + P A − P BR−1 B T P + Q = 0 (19) Οι πίνακες βάρους Q,R αποτελούν επιλογή του μηχανικού και επιδρούν στις μεταβλητές x,u. Συνήθως έχουν διαγώνια μορφή (qii , rii ̸= 0), και τα στοιχεία τους καθορίζουν τη συμμετοχή των μεταβλητών κατάστασης και εισόδων ελέγχου στη συνολική συνάρτηση κόστους. Η ενέργεια του συστήματος σχετίζεται με τον παράγοντα xT Qx. Κατά τη μεταβατική κατάσταση, πρέπει η ενέργεια να πέφτει γρήγορα στο μηδέν. Η μέγιστη τιμή της 10 σχετίζεται με την υπερακόντιση, ενώ ο χρόνος μείωσης της ενέργειας στο μηδέν σχετίζεται με τον χρόνο αποκατάστασης (settling time). Η ενέργεια ελέγχου σχετίζεται με τον παράγοντα uT Ru. Παράδειγμα LQR Δίνεται σύστημα διπλού ολοκληρωτή, με συνάρτηση μεταφοράς G(s) = 1/s2 . Θεωρούμε ότι x = [x1 x2 ]. Σε μορφή εξισώσεων χώρου κατάστασης έχουμε x˙ = Ax + Bu, y = Cx + Du (20) με A = [0 1; 0 0]; B = [0; 1]; C = [1 0]; D = [0]. Ζητείται να σχεδιαστεί βέλτιστος ελεγκτής LQR. Ο βέλτιστος ελεγκτής LQR στο MATLAB υλοποιείται με την εντολή [k,m,e]=lqr(A,B,Q,R). k είναι το κέρδος του ελεγκτή, m είναι η λύση της εξίσωσης Riccati και e οι ιδιοτιμές του συστήματος κλειστού βρόχου. Q, R είναι πίνακες βαρών για τις καταστάσεις και τις εισόδους αντίστοιχα. Για το συγκεκριμένο παράδειγμα έχουμε τις παρακάτω εντολές. Q=[1 0 ; 0 0] R=0.016 %R=0.016, 0.05, 0.5, 10 [k,m,e]=lqr(A,B,Q,R) sys1=ss(a-b*k,zeros(2,1),c,zeros(1,1)) [y1,t1,X1]=initial(sys1,[1 0]'); u=k=-k*X1'; Οι αποκρίσεις και οι εντολές ελέγχου για διαφορετικές τιμές του R = 0.016, 0.05, 0.5, 10 φαίνονται στο Σχήμα 9. Για R = 0.016, το κέρδος K = [7.9057 3.9764]. Για R = 0.05, το κέρδος K = [4.4721 2.9907]. Για R = 0.5, το κέρδος K = [1.4142 1.6818]. Τέλος, για R = 10, το κέρδος K = [0.3162 0.7953]. 5.1 Βέλτιστος Έλεγχος LQG Στον Βέλτιστο Έλεγχο LQG θεωρούμε γραμμικό, χρονικά αμετάβλητο σύστημα, με εξισώσεις χώρου κατάστασης συνεχούς χρόνου x(t) ˙ = Ax(t) + Bu(t) + Ew(t), y(t) = Cx(t) + v(t) (21) όπου x είναι το διάνυσμα κατάστασης, u είναι το διάνυσμα εισόδων ελέγχου, y είναι το διάνυσμα μετρήσιμων εξόδων. w, v είναι τυχαία διαταραχή και τυχαίος θόρυβος στις μετρήσεις, με γνωστά στατιστικά χαρακτηριστικά. A, B, C, E είναι πίνακες με σταθερά στοιχεία. Ο βέλτιστος νόμος ελέγχου (Linear Quadratic Gaussian-LQG) προκύπτει με ανατροφοδότηση βέλτιστης εκτιμούμενης κατάστασης ˆ u = K x(t) 11 (22) r=0.016, u(−−) r=0.05 2 1 0 0 −1 −2 −2 −4 −3 −6 −8 −4 0 10 20 30 40 50 60 −5 0 10 20 r=0.5 30 40 50 60 40 50 60 r=10 1 1 0.8 0.5 0.6 0 0.4 0.2 −0.5 0 −1 −0.2 −1.5 0 10 20 30 40 50 60 −0.4 0 10 20 30 Σχήμα 9: Η μεταβολή των καταστάσεων και οι εντολές ελέγχου στον βέλτιστο έλεγχο, για διαφορετικές τιμές του R Το δίνεται από K = −R−1 B T P (23) όπου P είναι συμμετρική θετικά ημιορισμένη λύση της αλγεβρικής εξίσωσης Riccati. Το x ˆ δίνεται από φίλτρο Kalman και αποτελεί την εκτίμηση της κατάστασης. Το φίλτρο Kalman ονομάζεται παρατηρητής (observer) και παρέχει την εκτίμηση της κατάστασης. Δέχεται πληροφορίες από την είσοδο u και την παρατηρούμενη μεταβλητή y. Περισσότερα στοιχεία σχετικά με συστήματα βέλτιστου ελέγχου υπάρχουν στα [?], [DB01], [FPEN05], [?]. 12 6 Παρατηρητές και φίλτρα Kalman Στην παράγραφο αυτή παρουσιάζονται πληροφορίες για τους παρατηρητές και τα φίλτρα Kalman Πολλές φορές οι νόμοι ελέγχου προυποθέτουν τη διαθεσιμότητα των καταστάσεων (states, x) του συστήματος προς έλεγχο. Στην πράξη δεν λαμβάνονται μετρήσεις από όλες τις μεταβλητές καταστάσεων, για λόγους κόστους (αισθητήρια και διατάξεις δειγματοληψίας) ή εφικτότητας, εφόσον μπορεί να μην υπάρχει πρόσβαση στα σημεία μέτρησης. Χρησιμοποιούνται τότε παρατηρητές (observers), όπου από μετρήσεις ορισμένων καταστάσεων μπορούν να ανακατασκευαστούν άλλες καταστάσεις που δεν είναι διαθέσιμες. Η εικόνα 2 δείχνει τη δομή συστήματος ελέγχου με παρατηρητή. Ο παρατηρητής δέχεται τα δεδομένα από την είσοδο ελέγχου u και την έξοδο y και παρέχει εκτίμηση x b του διανύσματος κατάστασης. r u Σ x˙ = Ax + Bu x C y − K xˆ Observer Σχήμα 10: Σύστημα ελέγχου με παρατηρητή Στην περίπτωση που οι μετρήσεις περιέχουν θόρυβο, τότε χρησιμοποιούνται φίλτρα Kalman. Περισσότερα στοιχεία για την εφαρμογή της μεθόδου αυτή υπάρχουν στο [Kri85]. 13 7 Προσαρμοζόμενος Έλεγχος με Μοντέλο Αναφοράς 7.1 Ιστορική Αναδρομή Η έρευνα στον προσαρμοζόμενο έλεγχο (adaptive control) έχει μακρά ιστορία έντονης δραστηριότητας και περιλαμβάνει διαφωνίες για τον ακριβή ορισμό του προσαρμοζόμενου ελέγχου, παραδείγματα με αστάθειες, αποδείξεις ευστάθειας και ευρωστότητας (robustness) καθώς και εφαρμογές. Ξεκινώντας στις αρχές του 1950, ο σχεδιασμός αυτόματων πιλότων για αεροσκάφη υψηλών επιδόσεων δημιούργησε το κίνητρο για την έρευνα στον Προσαρμοζόμενο Έλεγχο. Σε τέτοια αεροσκάφη, κατά την πτήση από το ένα σημείο λειτουργίας στο άλλο η δυναμική του αεροσκάφους μεταβάλλεται σημαντικά και δεν καλύπτεται από ελεγκτές με σταθερές παραμέτρους (constant gain). Ένας ελεγκτής όπως ο προσαρμοζόμενος ελεγκτής μπορεί να αντιμετωπίσει τέτοιες αλλαγές. Στον προσαρμοζόμενο έλεγχο ό σχεδιασμός αποτελείται συνήθως από τρία στάδια: • επιλογή του νόμου ελέγχου που θα περιλαμβάνει μεταβλητές παραμέτρους • επιλογή του νόμου προσαρμογής των μεταβλητών παραμέτρων • ανάλυση των ιδιοτήτων σύγκλισης του συστήματος ελέγχου που προκύπτει. Αυτο συνήθως γίνεται με χρήση συνάρτησης Lyapunov V, περιγράφοντας το συνολικό σφάλμα, και έλέγχοντας κατόπιν πότε η παράγωγος αυτής γίνεται αρνητική. Προσαρμοζόμενος έλεγχος με μοντέλο αναφοράς (Model Reference Adaptive Control-MRAC) προτάθηκε από τον Whitaker το 1958 με χρήση του νόμου ΜΙΤ (MIT rule) και τη μέθοδο ευαισθησίας (sensitivity), όπου η υλοποίηση του μοντέλου έγινε με αναλογικό υπολογιστή. Οι επιτυχίες συνεχίστηκαν μέχρι το 1970, με διάφορες εφαρμογές. Ακολούθησε αμφισβήτηση της μεθόδου το 1979, καθώς παρατηρήθηκε ότι δημιουργείται αστάθεια με την παρουσία μικρών διαταραχών ή μη-μοντελοποιημένης δυναμικής. Έτσι τη δεκαετία του 1980 μελετήθηκαν αλλαγές, οδηγώντας πλέον στη σημερινή μορφή του εύρωστου προσαρμοζόμενου ελέγχου (Robust Adaptive Control). Επιτυχή παραδείγματα MRAC είναι ο αυτόματος πιλότος πορείας πλοίου [vA84]. Περισσότερα στοιχεία για συστήματα MRAC υπάρχουν στα [NA89], [IS96], [SL91]. 7.2 Εισαγωγή Στον προσαρμοζόμενο έλεγχο με μοντέλο αναφοράς (MRAC) οι παράμετροι κέρδους του ελεγκτή προσαρμόζονται αυτόματα προκειμένου να πλησιάζει η απόκριση του συστήματος την απόκριση του μοντέλου αναφοράς. Η δομή φαίνεται στο Σχ. 11. Η συνάρτηση μεταφοράς Wm (s) του μοντέλου αναφοράς επιλέγεται έτσι ώστε για δεδομένη είσοδο αναφοράς r(t) η έξοδος ym (t) του μοντέλου αναφοράς παριστά την επιθυμητή απόκριση που θέλουμε να ακολουθήσει το σύστημα yp (t). Ο ελεγκτής C(θc∗ ) σχεδιάζεται έτσι ώστε όλα τα σήματα να είναι φραγμένα (bounded) και η συνάρτηση μεταφοράς κλειστού βρόχου από το r στο y είναι ίση με Wm (s). Η ομοιότητα αυτή στη συνάρτηση μεταφοράς εγγυάται ότι για κάθε είσοδο αναφοράς r το σφάλμα e1 = yp − ym , που παριστά την απόκλιση της εξόδου του συστήματος από 14 Reference Model ym (t) − r(t) Σ e1 (t) + u yp (t) Controller Plant Adaptation law Σχήμα 11: Διάταξη Προσαρμοζόμενου Ελέγχου με Μοντέλο Αναφοράς. την επιθυμητή τροχιά της, συγκλίνει στο μηδέν με την πάροδο του χρόνου. Η ομοιότητα της συνάρτησης μεταφοράς είναι δυνατή με ακύρωση των μηδενιστών της συνάρτησης μεταφοράς (zeros cancellation) και αντικατάστασή τους με αυτούς της Wm (s), μέσω του ελεγκτή C(θc∗ ). Η ακύρωση μηδενιστών δημιουργεί περιορισμό στον τύπο του συστήματος, ώστε αυτό να είναι ελάχιστης φάσης (minimum phase), έχοντας ευσταθείς μηδενιστές (stable zeros). Εάν το σύστημα είναι ασταθές, η ακύρωση θα οδηγήσει σε σήματα μη-φραγμένα. Ο σχεδιασμός του C(θc∗ ) απαιτεί την γνώση των συντελεστών του συστήματος G(s). Αν θc∗ είναι διάνυσμα που περιλαμβάνει όλους τους συντελεστές της G(s) = G(s, θ∗ ), τότε το διάνυσμα παραμέτρων θc∗ υπολογίζεται λύνοντας την αλγεβρική εξίσωση θc∗ = F (θ∗ ) (24) Διακρίνουμε δύο τύπους ελέγχου MRAC: τον ευθύ (direct), όπου το διάνυσμα παραμέτρων θ, του ελεγκτή C(θ) ενημερώνεται απευθείας από ένα νόμο προσαρμογής καθώς και τον έμμεσο(indirect), όπου το θ υπολογίζεται από σχέση που το συνδέει με τις εκτιμούμενες σε πραγματικό χρόνο παραμέτρους του συστήματος (plant parameters). Στο παρόν κεφάλαιο εξετάζεται η πρώτη περίπτωση, δηλ. direct MRAC. Υπάρχουν διάφορες περιπτώσεις MRAC, ανάλογα με τον τύπο του συστήματος. Η πιό απλή περιπτωση αφορά σύστημα πρώτης τάξης γραμμικό αλλά και μη γραμμικό. Γενικεύοντας εδώ, έχουμε περιπτώσεις συστήματος με πλήρες διανύσμα κατάστασης, με την προυπόθεση ότι αυτό μετράται. Κατόπιν έχουμε περιπτώσεις εισόδου-εξόδου, ανάλογα με τον σχετικό βαθμό (relative degree) n∗ (διαφορά πόλων-μηδενιστών). 7.3 Απλά συστήματα Direct MRAC Θεωρούμε την απλή περίπτωση scalar adaptive tracking, δηλ. έλεγχο όπου σύστημα πρώτης τάξης προσπαθεί να ακολουθήσει την είσοδο. Θεωρούμε σύστημα πρώτης τάξης x˙ = αx + bu 15 (25) με α, b άγνωστες σταθερές, με γνωστό το πρόσημο της b. Στόχος του συστήματος ελέγχου είναι να καθορίσει νόμο ελέγχου u ώστε όλα τα σήματα στο σύστημα κλειστού βρόχου να είναι φραγμένα και το x να ακολουθεί την κατάσταση xm του μοντέλου αναφοράς που δίνεται από την x˙ m = −αm xm + bm r ⇒ xm = bm r s + αm (26) με τα αm > 0, bm γνωστά και τα xm (t), r(t) μετρημένα σε κάθε χρονική στιγμή t. Νόμος Ελέγχου (control law). Για να ακολουθεί το x την τιμή του xm για κάθε είσοδο αναφοράς r(t), τότε ο νόμος ελέγχου θα πρέπει να επιλεγεί έτσι ώστε η συνάρτηση μεταφοράς κλειστού βρόχου από την είσοδο r στην έξοδο x να είναι ίδια με αυτή του μοντέλου αναφοράς. Προτείνεται ως νόμος ελέγχου ο u = −k ∗ x + l∗ r (27) με τα k ∗ , l∗ υπολογισμένα έτσι ώστε x(s) bl∗ bm xm (s) = = = r(s) s − α + bk ∗ s + am r(s) (28) Η (28) ικανοποιείται αν θέσουμε l∗ = bm ∗ am + a ,k = b b (29) Εφόσον τα α, b είναι άγνωστα, τότε η (27) δεν μπορεί να υλοποιηθεί. Μπορούμε τότε να θέσουμε u = −k(t)x + l(t)r (30) αντικαθιστώντας τα k ∗ , l∗ με τις εκτιμήσεις τους k, l, αναζητώντας πλέον νόμο προσαρμογής για να τα υπολογιζει on-line. Νόμος Προσαρμογής (adaptation law). Θεωρούμε την εξίσωση σφάλματος που συνδέει τα σφάλματα παραμέτρων k˜ = k − k ∗ , ˜l = l − l∗ με το σφάλμα εκτίμησης ϵ1 = x, δηλ. ˜ + ˜lr), ϵ1 = e = x − xm ϵ˙1 = −αm ϵ1 + b(−kx (31) Θεωρούμε τη συνάρτηση 2 ˜2 ˜2 ˜ ˜l) = ϵ1 + k |b| + l |b| V (ϵ1 , k, 2 2γ1 2γ2 (32) με γ1 , γ2 > 0 ως συνάρτηση Lyapunov. Παραγωγίζοντας λαμβάνουμε την V˙ ως ˜ ˜ ˜ 1 x + b˜lϵ1 r + |b|k f1 + |b|l f2 V˙ = −αm ϵ21 − bkϵ γ1 γ2 Επειδή |b| = b sgn(b), οι μη-ορισμένοι όροι της (33) φεύγουν αν επιλέξουμε f1 = γ1 ϵ1 x sgn(b), f2 = −γ2 ϵ1 r sgn(b). 16 (33) Έτσι για το νόμο πρσαρμογής k˙ = γ1 ϵ1 x sgn(b), l˙ = −γ2 ϵ1 r sgn(b) (34) V˙ = −αm ϵ21 (35) έχουμε Υλοποίηση Ο προσαρμοζόμενος ελεγκτής δίνεται από τις εξισώσεις (30), (34). Το δομικό του διάγραμμα φαίνεται στο Σχ. 12. xm bm s+am − = 1 Σ u r(t) l(t) 1 s−a Σ x + − 1 s k(t) l(0) −γ2 sgn(b) 1 s X γ1 sgn(b) X k(0) Σχήμα 12: Δομικό διάγραμμα που υλοποιεί τον προσαρμοζόμενο ελεγκτή των (30), (34). Τα προσαρμοζόμενα κέρδη γ1 , γ2 είναι παράμετροι σχεδιασμού και επηρεάζουν την μεταβατική απόκριση του συστήματος κλειστού βρόχου. Επίσης επιλέγονται οι τιμές l(0), k(0) . Αποτελέσματα προσομοίωσης συστήματος 1ης τάξης και μοντέλου αναφοράς x˙ = x + 3u (36) x˙ m = −4xm + 4r (37) για είσοδο αναφοράς r(t) = 4 και r(t) = 3 + 3sin(t) φαίνονται στα Σχ. 13 και 14 αντίστοιχα. Θεωρούμε γ1 = γ2 = 2. 7.4 Σύστημα MRAC εισόδου-εξόδου, με n∗ = 1 Το δομικό διάγραμμα φαίνεται στο Σχ. 15. 17 Σχήμα 13: MRAC συστήματος 1ης τάξης με r(t) = 4. 7.5 Εύρωστος Προσαρμοζόμενος Έλεγχος Στην περίπτωση που υπάρχουν διαταραχές, σφάλματα στη μοντελοποίηση και μεταβολές παραμέτρων, οι ιδιότητες ευστάθειας που παρουσιάστηκαν ως τώρα παύουν να ισχύουν. Τη δεκαετία του 1980 νέοι σχεδιασμοί προτάθηκαν και αναλύθηκαν, καταλήγοντας στο σημερινό εύρωστο προσαρμοζόμενο έλεγχο (robust MRAC). Οι αλλαγές στο νόμο προσαρμογής περιλαμβάνουν leakage, νεκρή ζώνη (dead zone), κ.α., και παρουσιάζονται παρακάτω. Πρώτα όμως ας δούμε πως μη-παραμετρικές ασάφειες (non-parametric uncertainties) οδηγούν ένα σύστημα MRAC σε αστάθεια, εξετάζοντας το γνωστό παράδειγμα του Rohr, από το [SL91]. Παράδειγμα Εδώ ένα σύστημα πρώτης τάξης που περιέχει μη-μοντελοποιημένη δυναμική και θόρυβο στις μετρήσεις έχει σύστημα ελέγχου MRAC. Το βασικό (nominal) μοντέλο του συστήματος θεωρείται ως H(s) = kp s + ap 18 (38) Σχήμα 14: MRAC συστήματος 1ης τάξης με r(t) = 3 + 3sin(t). Το μοντέλο αναφοράς, έχοντας SPR function, είναι M (s) = km 3 = s + am s+3 (39) Το πραγματικό σύστημα έχει συνάρτηση μεταφοράς y(s) = 2 229 u s + 1 s2 + 30s + 229 (40) οπότε βλέπουμε ότι είναι τρίτης τάξης σε αντίθεση με το βασικό μοντέλο που θεωρήσαμε ότι είναι πρώτης τάξης. Η μη-μοντελοποιημένη δυναμική προκύπτει ότι 229 είναι s2 +30s+229 , δηλ. πόλοι σε υψηλή συχνότητα με μικρή απόσβεση στα (—15 +j) and (—15 —j). Επιπλέον υπάρχει θόρυβος στις μετρήσεις, n(t), ίσος με n(t) = 0.5 sin(16.1t). Το πλήρες σύστημα προσαρμοζόμενου ελέγχου φαίνεται στο Σχ. 16. Αποτελέσματα για είσοδο αναφοράς r = 2, φαίνoνται στο Σχ. 17. Η έξοδος y(t) αρχικά συγκλίνει στην περιοχή y = 2, κατόπιν εμφανίζεται μικρή ταλάντωση στο σφάλμα λόγω του θορύβου και τελικά αποκλίνει στο άπειρο. Σήμερα υπάρχουν αρκετοί μέθοδοι εύρωστου MRAC, όπως leakage, dead-zone, dynamic normalization, parameter projection. Στην συνέχεια παρουσιάζονται οι δύο πρώτοι. 19 r(t) ym (t) km Zm (s) Rm (s) − Σ e1 (t) + k(t) yp (t) kp Zp (s) Rp (s) Σ Λ, l Λ, l ω1 (t) ω2 (t) θ1T θ2T θ0T Σχήμα 15: Δομικό διάγραμμα που υλοποιεί τον προσαρμοζόμενο ελεγκτή εισόδουεξόδου, με n∗ = 1. Σχήμα 16: MRAC με μη-μοντελοποιημένη δυναμική και θόρυβο στις μετρήσεις. 7.5.1 Μεθόδος leakage Εδώ η ιδέα είναι να τροποιηθεί η ο νόμος προσαρμογής ώστε η χρονική παράγωγος της συνάρτησης Lyapunov γίνεται αρνητική στο διάστημα εκτιμησης παραμέτρων, όταν οι παράμετροι αυτοί ξεπερνούν ορισμένα όρια. Θεωρούμε αρχικό νόμο προσαρμογής ως θ˙ = γϵ1 u, ϵ1 = y − θu (41) Κάνουμε αλλαγή του αρχικού νόμου προσαρμογής ως θ˙ = γϵ1 u − γ wθ, ϵ1 = y − θu (42) όπου ο όρος wθ, με w > 0, μετατρέπει την αρχική ολοκληρωτική δράση του νόμου (41) σε δράση με ”διαρροή” (leakage). Υπάρχουν διάφορες επιλογές για τον όρο w(t) ως εξής. 1. αλλαγή σ (σ-modi cation). Η πιό απλή μορφή είναι w(t) = σ > 0, ∀t ≥ 0 20 (43) Σχήμα 17: Αστάθεια και απόκλιση των παραμέτρων. με σ μια μικρή σταθερά. Ο νόμος ελέγχου γίνεται θ˙ = γϵ1 u − γ σθ (44) 2. εναλλαγή στο σ (switching−σ). Η παράμετρος σ δεν θα είναι ενεργή όταν οι εκτιμούμενοι παράμετροι βρίσκονται εντος αποδεκτων ορίων. Έτσι τώρα το σ αλλάζει ως w(t) = σs , { σs = 0, |θ| < M0 σ0 , |θ| ≥ M0 3. αλλαγή στο ϵ1 (ϵ1 -modi cation). 7.5.2 Μέθοδος dead-zone Η μέθοδος dead-zone θεωρεί ότι μικρά σφάλματα στην έξοδο (tracking errors) περιέχουν τις πιο πολλές φορές θόρυβο και διαταραχές, οπότε μπορεί να σταματήσει ο μηχανισμός προσαρμογής όταν αυτά τα σφάλματα γίνουν μικρά. Αλλάζουμε τον νόμο προσαρμογής της μορφής a ˆ˙ = −γ v e (45) { κατά a ˆ˙ = −γ v e, |e|>∆ 0, |e|<∆ με ∆ το μέγεθος της dead-zone. Οπως φαίνεται και στο ακόλουθο παράδειγμα, αυτή η απλή μετατροπή μειώνει δραστικά την επίδραση διαταραχών. Παράδειγμα-συνέχ. Θεωρώντας πάλι το παράδειγμα του Rohr, αλλάζουμε τον νόμο προσαρμογής θέτοντας dead-zone ∆ = 0.7. Τα αποτελέσματα φαίνoνται στο Σχ. 18. Το σφάλμα εξόδου μένει κοντά στην ιδεατή απόκριση y = 2, με τάλαντωση λόγω του θορύβου μέτρησης. Οι παράμετροι τώρα δεν παρουσιάζουν ένδειξη απόκλισης. Η ταλάντωση είναι γρήγορη εφόσον η κλίμακα χρόνου στην εικόνα είναι μεγάλη και ο θόρυβος έχει υψηλή συχνότητα. 21 Σχήμα 18: Προσαρμοζόμενος έλεγχος με dead-zone. 7.6 Άσκηση Robust MRAC Θεωρούμε σύστημα ελέγχου διατήρησης ταχύητας οχήματος (cruise control). Η σχέση ταχύτητας οχήματος, V , και γωνίας πεντάλ γκαζιού, θ, είναι V = b θ + d, s+α (46) όπου d είναι διαταραχή λόγω φορτίου. Οι τιμές των α, b είναι άγνωστες. Εξετάζεται η χρήση ελέγχου MRAC, με μοντέλο αναφοράς Vm = bm Vsetpoint s + αm (47) όπου bm = 0.5, αm = 0.5. Ζητούνται: 1. Σχεδιάστε σύστημα direct MRAC, με τις τιμές των α, b, d άγνωστες. 2. Κάντε προσομοίωση του συστήματος, με Vsetpoint =35 km/h, με τιμές (αʹ) α = 0.02, b = 1.3, d = 10 (βʹ) α = 0.02(2 + sin(0.01t)), b = 1.3, d = 10sin(0.02t) 3. Προσθέστε στο σύστημα (plant) καθυστέρηση ως Pade πρώτης τάξης 0.25 sec. Επαναλάβατε την προσομοίωση όπως πρίν, ρυθμίζοντας πάλι τα κέρδη του MRAC. 4. Αλλάξτε το αρχικό σύστημα ώστε τώρα να περιλαμβάνει δυναμική που δεν είχε αρχικά ληφθεί υπόψη (unmodeled dynamics), προκαλώνας έτσι αστάθεια κατά τον έλεγχο με MRAC. 5. Εφαρμόστε μεθόδους robust MRAC (leakage ή deadzone), κάνοντας το σύστημα κλειστού βρόχου ευσταθές. Δείξτε τα residuals και το ρυθμό προσαρμογής (adaptation rate). 22 8 Αυτοπροσαρμοζόμενος Έλεγχος Σε αντίθεση με τον κλασσικό έλεγχο, όπου όλες οι παράμετροι του ελεγκτή είναι σταθερές (χρονικά αμετάβλητες) και προεπιλεγμένες, στον αυτοπροσαρμοζόμενο έλεγχο (self-tuning control) οι παράμετροι προασαρμόζονται αυτόματα λαμβάνοντας υπόψη μετρήσεις σε πραγματικό χρόνο των μεταβλητών της διεργασίας ή των διαταραχών. Η ανάγκη για προσαρμογή των παραμέτρων του ελεγκτή προκύπτει σε περιπτώσεις μεγάλης μεταβολής του σημείου λειτουργίας. Ο κλασσικός ελεγκτής ρυθμίζεται μόνον για συγκεκριμένο σημείο λειτουργίας. Θεωρούμε τη διάταξη αυτοπροσαρμοζόμενου ελέγχου του Σχ. 19. Σε σχέση με ένα συμβατικό σύστημα ελέγχου, υπάρχουν δύο επιπλέον αλγόριθμοι υπολογισμού. Ο αλγόριθμος εκτίμησης (estimator) των παραμέτρων του συστήματος, χρησιμεύει στην αναγνώριση παραμέτρων του μοντέλου και λαμβάνει ως είσοδο την απόκριση του συστήματος και την εντολή ελέγχου. Σε κάθε χρονική στιγμή δειγματοληψίας, οι πιο πρόσφατες εκτιμούμενες παράμετροι δίνονται στον αλγόριθμο σχεδιασμού του ελεγκτή (controller synthesis), ο οποίος συνθέτει με ορισμένους κανόνες τις παραμέτρους του ελεγκτή. Οι ενημερωμένες παράμετροι του ελεγκτή δίνονται στον ελεγκτή και με βάση αυτές υπολογίζει την επόμενη εντολή ελέγχου. Η απλούστερη μέθοδος εκτίμησης παραμέτρων (system identi cation) είναι τα ελάχιστα τετράγωνα (least squares). Για τον σχεδιασμό του ελεγκτή, χρησιμοποιούνται κριτήρια ελαχιστοποίησης όπως ελάχιστη μεταβλητότητα (minimum variance-MV), ή γραμμικός τετραγωνικός νόμος ελέγχου (linear quadratic) ή και τοποθέτηση πόλων συστήματος κλειστού βρόχου σε επιιθυμητές θέσεις (pole assignment). Σχήμα 19: Διάταξη αυτοπροσαρμοζόμενου ελέγχου. Στα συστήματα αυτοπροσαρμοζόμενου ελέγχου χρησιμοποιείται συχνά μοντέλο εγκατάστασης σε διακριτό χρόνο, της μορφής CARMA: Controlled Auto Regressive Moving Average A(z −1 )y(t) = B(z −1 )u(t) + C(z −1 )e(t) ⇒ y(t) = B(z −1 ) C(z −1 ) u(t) + e(t) A(z −1 ) A(z −1 ) 23 (48) (49) όπου A(z −1 ) = 1 + a1 z −1 + ... + ana z −na B(z −1 ) = b0 + b1 z −1 −1 + ... + bnb z −nb (50) (51) −1 Οι τιμές των πολυωνύμων A(z ), B(z ) προκύπτουν απο τον μετασχηματισμό Ζ της συνάρτησης μεταφοράς, περιέχοντας παράγοντα zero order hold (ZOH). 8.1 Tοποθέτηση πόλων Με τη μέθοδο τοποθέτησης πόλων (pole assignment), προσπαθούμε να πλησιάζουμε την μορφή χαρακτηριστικής εξίσωσης συστήματος κλειστού βρόχου. Θεωρούμε το σύστημα Ay(t) = Bz −1 u(t) + Ce(t) (52) όπου ο ελεγκτής έχει τη μορφή F u(t) = Hr(t) − Gy(t) (53) Οι δύο παραπάνω εξισώσεις δίνουν (F A + z −1 BG)y(t) = z −1 BHr(t) + CF e(t) (54) Οι πόλοι συστήματος κλειστού βρόχου που αντιστοιχούν στις επιθυμητές θέσεις και ορίζονται από το πολυώνυμο T , προκύπτουν από τις τιμές των F, G απο την ισότητα (Diophantine) F A + z −1 BG = T C (55) Τα πολυώνυμα F, G, H ορίζονται ως F = 1 + f1 z −1 + ... + fnf z −nf (56) G = g0 + g1 z −1 + ... + gng z −ng (57) H = h0 + h1 z −1 + ... + hnh z −nh Ο αντισταθμιστής (precompensator) H επιλέγεται ως [ ] T H=C B z=1 (58) (59) Κατά την τοποθέτηση πόλων συστήματος κλειστού βρόχου σε επιθυμητές θέσεις, λαμβάνονται συνήθως υπόψη συστήματα πρώτης και δεύτερης τάξης. Σε συστήματα πρώτης τάξης, η επιθυμητή θέση πόλων σχετίζεται με τον μηδενιστή του πολυωνύμου T = 1 − t1 (z −1 ), t1 = exp(−τs /b) (60) όπου β είναι η επιθυμητή σταθερά χρόνου. Στα συστήματα δεύτερης τάξης, οι τιμές επιθυμητών πόλων σχετίζεται με τους δύο μηδενιστές του πολυωνύμου T = 1 − t1 (z −1 ) + t2 (z −1 ) 24 (61) όπου t1 = −2 exp(−ζωn τs ) ( ) √ cos τs ωn 1 − ζ 2 , t2 = exp(−2ζωn τs ) (62) με ωn τη φυσική συχνότητα και ζ το λόγο απόσβεσης. Παράδειγμα Για το ακόλουθο σύστημα διακριτού χρόνου σχεδιάζεται σύστημα αυτοπροσαρμοζόμενου ελέγχου με τοποθέτηση πόλων συστήματος κλειστού βρόχου σε επιιθυμητές θέσεις. (1 + 0.5z −1 + 0.7z −2 )y(t) = (z −1 + 0.2z −2 )u(t) με επιθυμητές θέσεις πόλων (63) T = 1 − 0.6(z −1 ) (64) Τυχαίες αρχικές τιμές δόθηκαν στις παραμέτρους του μοντέλου, ενώ οι αρχικές τιμές για τις παραμέτρους του ελεγκτή ήταν f1 = 0.15, g0 = −1.25, g1 = −0.525. Η έξοδος και το τετραγωνικό σήμα αναφοράς καθώς και το σήμα ελέγχου φαίνονται στο Σχ. 20, η αναγνώριση παραμέτρων φαίνονται στο σχήμα 21. 3 output & ref 2 1 0 −1 −2 0 10 20 30 40 50 time steps 60 70 80 90 100 0 10 20 30 40 50 time steps 60 70 80 90 100 4 control input 3 2 1 0 −1 −2 Σχήμα 20: Εξοδος, σήμα αναφοράς και σήμα ελέγχου. 8.2 Ελάχιστη μεταβλητότητα Με τον ελεγκτή ελάχιστης μεταβλητότητας (MV), προσπαθούμε να θέσουμε την έξοδο ενός στοχαστικού συστήματος σε ένα σταθερό (μηδενικό) σημείο αναφοράς. Έτσι σε κάθε χρονική στιγμή, επιλέγουμε την είσοδο ελέγχου έτσι ώστε να μηδενίζεται η μεταβλητότητα της εξόδου J = E[y 2 (t + k)] (65) 25 parameter estimates controller parameters 1.5 2 1.5 1 b1 1 a2 0.5 a1 0.5 h0 b2 f1 0 0 −0.5 g1 −0.5 −1 g0 −1 0 20 40 60 time steps 80 −1.5 100 0 20 40 60 time steps 80 100 Σχήμα 21: Αναγνώριση παραμέτρων. με k την καθυστέρηση. Για ένα σύστημα της μορφής y(t) = ay(t − 1) + bu(t − 1) + e(t) + ce(t) (66) ο ελεγκτής MV έχει την μορφή u(t) = − (a + c) y(t) b (67) Διάφορες μορφές αυτοπροσαρμοζόμενου ελέγχου μελετήθηκαν από τον Kalman το 1958, τους Astrom και Wittenmark το 1973, τους Clarke και Gawthrop το 1975 και τον Wellstead και την ομάδα του το 1979. Περισσότερα στοιχεία σχετικά με τα συστήματα αυτοπροσαρμοζόμενου ελέγχου υπάρχουν στα [WZ89], [WZ91], [AW73], [WEPZ79]. Αναφορές [AW73] K. Astrom and B. Wittenmark. On self tuning regulators. Automatica, 9(1), 1973. [DB01] R. Dorf and R. Bishop. Modern Control Systems. Ninth edition, Prentice Hall, 2001. 26 [Fos94] T. Fossen. Guidance and Control of Ocean Vehicles. John Wiley and Sons, 1994. [Fos11] T. Fossen. TTK 4190 Guidance and Control. NTNU Lecture Notes, 2011. [FPEN05] G. Franklin, D. Powel, and A. Enami-Naeimi. Feedback Control of Dynamic Systems. Addison Wesley Longman, 5th edition, 2005. [IS96] P. Ioannou and J. Sun. Robust Adaptive Control. Prentice-Hall, 1996. [Kri85] N. Krikelis. Modeling and Optimal Control of Systems. (in greek) Plaisio, 1985. [NA89] K. Narendra and A. Annaswammy. Stable Adaptive Control. Prentice Hall, 1989. [SL91] Jean-Jacques Slotine and Weiping Li. Applied Nonlinear Control. Prentice Hall, 1991. [vA84] J. van Amerongen. Adaptive steering of ships-a model reference approach. Automatica, 20(1), 1984. [WEPZ79] P.E. Wellstead, J. Edmunds, D. Prager, and P. Zanker. Self-tuning pole/zero assignment regulators. International Journal of Control, 30(1), 1979. [WZ89] P. Wellstead and P. Zanker. Application of self-tuning to engine control. Billings, S. and Harris, C. (Eds) Peter Peregrinus, 1989. [WZ91] P. Wellstead and M. Zarrop. Self-tuning systems. John Wiley, 1991. 27
© Copyright 2024 Paperzz