Εισαγωγή στον Αυτόματο Έλεγχο (8.3.01.5) Σημειώσεις Μαθήματος 2011-2012 Μέρος 2ο: Μοντέρνος Έλεγχος Γεώργιος Παπαλάμπρου 2 Δρ. Γεώργιος Παπαλάμπρου Λέκτορας ΕΜΠ Εργαστήριο Ναυτικής Μηχανολογίας Σχολή Ναυπηγών Μηχανολόγων Μηχανικών Εθνικό Μετσόβιο Πολυτεχνείο email: george.papalambrou@lme.ntua.gr http://www.lme.ntua.gr ενημέρωση: 9/12/2011 ΓΠ XELATEX Περιεχόμενα 1 Ελεγκτές στο Χώρο Κατάστασης 1.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Χώρος Κατάστασης . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Επίλυση Εξισώσεων Κατάστασης . . . . . . . . . . . . . . . . . 1.3.1 Επίλυση της Ομογενούς Εξίσωσης Κατάστασης . . . . . 1.3.2 Ιδιότητες Εκθετικής Μήτρας . . . . . . . . . . . . . . . 1.3.3 Μεταβατική Μήτρα Κατάστασης . . . . . . . . . . . . . 1.3.4 Επίλυση της Μη-Ομογενούς Εξίσωσης Κατάστασης . . 1.3.5 Μέθοδοι Προσδιορισμού Μήτρας eAt . . . . . . . . . . 1.4 Ελεγξιμότητα . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Παρατηρησιμότητα . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Έλεγχος με Πλήρη Ανατροφοδότηση Καταστάσεων . . . . . . . 1.7 Τοποθέτηση Πόλων . . . . . . . . . . . . . . . . . . . . . . . . 1.7.1 Τοποθέτηση Πόλων-Μέθοδος για Συστήματα 2ης τάξης 1.7.2 Τοποθέτηση Πόλων-Μέθοδος Ackermann . . . . . . . 1.7.3 Τεχνικές για την Επιλογή Θέσεων Πόλων . . . . . . . . 1.8 Βέλτιστος Έλεγχος . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Παρατηρητές Καταστάσεων . . . . . . . . . . . . . . . . . . . . 1.10 Παράρτημα: Πράξεις με Μήτρες . . . . . . . . . . . . . . . . . . 1.11 Αναφορές . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 10 10 11 12 13 14 16 17 18 19 20 22 23 26 32 35 37 4 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Ελεγκτές στο Χώρο Κατάστασης 1.1 Εισαγωγή Στο κεφάλαιο αυτό παρουσιάζονται μέθοδοι σχεδιασμού ελεγκτών στο χώρο κατάστασης (state space), όπως η μέθοδος τοποθέτησης πόλων (pole placement) και η μέθοδος βέλτιστου τετραγωνικού ρυθμιστή (quadratic optimal regulator). Οι τεχνικές ελέγχου που χρησιμοποιούν μεταβλητές κατάστασης λέγονται ”μοντέρνος έλεγχος”, παρότι οι βάσεις τους βρίσκονται στην δεκαετία του 1950. Ο όρος αυτός δηλώνει την αντίθεση με τον κλασσικό έλεγχο (χρήση πεδίου συχνότητας, ελεγκτές διαμόρφωσης, ελεγκτές προπορευόμενης/υπολειπόμενης φάσης). Στην αρχή παρουσιάζονται στοιχεία από το χώρο κατάστασης. Παρουσιάζεται η μέθοδος τοποθέτησης πόλων και τρόποι εύρεσης επιθυμητών θέσεων πόλων. Παρουσιάζεται η σημαντική μέθοδος βέλτιστου ρυθμιστή. Τέλος παρουσιάζεται η μέθοδος ελέγχου με χρήση παρατηρητή. Στο Παράρτημα παρουσιάζονται ως ανασκόπηση βασικές πράξεις με μήτρες. Αναπόσπαστο κομμάτι είναι η χρήση του MATLAB/Simulink κατά την παράσταση φυσικών συστημάτων στο χώρο κατάστασης αλλά και το σχεδιασμό ελεγκτών. Έχει γίνει προσπάθεια να υπάρχει ο σχετικός κώδικας σε κάθε λυμμένο παράδειγμα, δίνοντας έτσι τη δυνατότητα στο σπουδαστή να επαληθεύσει τα αποτελέσματα. Προβλέπεται επίσης η χρήση εργαστηριακής διάταξης ανεστραμένου εκκρεμούς για εφαρμογή των παραπάνω μεθοδολογιών στην πράξη. 1.2 Χώρος Κατάστασης Κατάσταση (state) ενός δυναμικού συστήματος ονομάζεται το μικροτερο δυνατό σύνολο μεταβλητών των οποίων η γνώση της τιμής κατά τη χρονική στιγμή t = t0 σε συνδιασμό με τη γνώση της εισόδου για t ≥ t0 , καθορίζει πλήρως τη συμπεριφορά του συστήματος για t ≥ t0 . Οι μεταβλητές κατάστασης δεν είναι υποχρεωτικά ποσότητες που μπορούν να μετρηθούν με τεχνικά μέσα. Όπως θα δούμε στην συνέχεια, στην περίπτωση αδυναμίας μέτρησης 5 6 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ μίας μεταβλητής κατάστασης, αυτή μπορεί να ”εκτιμηθεί” με μαθηματικό τρόπο. Στην πράξη πρέπει να επιλέγουμε μεταβλητές κατάστασης που μετρώνται εύκολα. Στην παράσταση συστήματος στο χώρο κατάστασης (state space), το σύστημα χαρακτηρίζεται από σύνολο διαφορικών εξισώσεων (ΔΕ) πρώτης τάξης που συνδέουν τις μεταβλητές κατάστασης. Οι εξισώσεις κατάστασης έχουν τη μορφή x˙ = Ax + Bu (1.1) y = Cx + Du (1.2) όπου Α είναι ό πίνακας του συστήματος, Β ο πίνακας των εισόδων ελέγχου, C ο πίνακας της εξόδου και D ο πίνακας που συνδέει απευθείας την είσοδο ελέγχου (u) με την έξοδο. Θεωρούμε ότι οι πίνακες A, B, C, D είναι σταθεροί, χρονικά αμετάβλητοι. x είναι το διάνυσμα των καταστάσεων, y είναι η έξοδος και u είναι η εντολή ελέγχου. Οι εξισώσεις κατάστασης παριστάνoνται γραφικά όπως στην εικόνα 1.1 D u B x˙ R Σ dt x C y Σ A Σχήμα 1.1: Γραφική παράσταση των εξισώσεων κατάστασης Τις περισσότερες φορές η αρχική περιγραφή ενός δυναμικού συστήματος περιλαμβάνει ΔΕ υψηλότερης τάξης από πρώτη. Τότε εισάγουμε επιπλέον μεταβλητές για να κατασκευάσουμε το διάνυσμα κατάστασης x = [x1 x2 ... xn ]. Έστω η ΔΕ n τάξης dn y dy dn−1 y = Φ(y, , ..., , u) dtn dt dtn−1 (1.3) Ορίζουμε μεταβλητές (x1 x2 ... xn ) θέτοντας x1 x2 =y = dy dt (1.4) (1.5) ... = ... (1.6) xn = dn−1 y dtn−1 (1.7) 1.2. ΧΩΡΟΣ ΚΑΤΑΣΤΑΣΗΣ 7 Λαμβάνουμε έτσι τις εξισώσεις = x2 = ... (1.8) (1.9) = xn = Φ(x1 , x2 , ... xn , u) (1.10) (1.11) x˙ 1 ... x˙ n−1 x˙ n Η έξοδος δίνεται ως (1.12) y = x1 Το διάνυσμα κατάστασης δίνεται ως x = [x1 x2 ... xn ]T (1.13) Τις εξισώσεις κατάστασης χρησιμοποιούν ευρύτατα τεχνικές ελέγχου όπως η ανατροφοδότηση καταστάσεων (state feedback), η τοποθέτηση πόλων (pole placement) και ο βέλτιστος έλεγχος (optimal control). Παράδειγμα 1.2.1 Θεωρούμε γραμμικό ταλαντωτή, με στοιχεία μάζα m, ελατήριο, με k τη σταθερά ελατηρίου, αποσβεστήρα, με c το συντελεστή απόσβεσης, εφαρμοζόμενη δύναμη f(t) και μετρούμενη μετατόπιση x(t). Ζητούμενο είναι να παρασταθεί το σύστημα με τη μορφή εξισώσεων χώρου κατάστασης. Το μηχανικό σύστημα μαζας, ελατηρίου αποσβεστήρα παριστάνεται στην εικόνα 1.2. x(t) k m f (t) c Σχήμα 1.2: Το σύστημα γραμμικού ταλαντωτή Με το δεύτερο νόμο του Newton σχηματίζουμε τη διαφορική εξίσωση (ΔΕ) δεύτερης τάξης που περιγράφει τη συμπεριφορά του συστήματος m¨ x + cx˙ + kx = fa ⇒ x ¨+ c k f x˙ + x = m m m (1.14) Λαμβάνουμε ως μεταβλητές κατάστασης τη μετατόπιση και την ταχύτητα x1 = x, x2 = x˙ ⇒ x2 = x˙1 , x˙ 2 = x ¨ (1.15) Έτσι η εξ. 1.14 γίνεται x˙ 2 = − c f k x1 − x2 + m m m (1.16) 8 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Οι εξ. 1.15, 1.16 δίνουν [ ] [ 0 x˙1 = k x˙2 −m Τελικά έχουμε [ x˙1 x˙2 1 c −m ][ x1 x2 ] [ + 0 1 m ] (1.17) f ] (1.18) = Ax + Bu Η ΔΕ παριστάνεται γραφικά όπως στην εικόνα 1.3 f m¨ x Σ − 1 m x¨ 1 s x˙ 1 s x = x1 − c k Σχήμα 1.3: Γραφική παράσταση της ΔΕ γραμμικού ταλαντωτή με μεταβλητές κατάστασης. Στο παράδειγμα αυτό το διάνυσμα κατάστασης αποτελείται από την μετατόπιση και την ταχύτητα της μάζας m. Ακολουθεί επίλυση παραδείγματος 1.2.2 με το MATLAB, στην περίπτωση που k = 10, m = 0.1, c = 0.5. k=10; % spring constant m=0.1; % mass c=0.5; % damper A=[0 1;-k/m -c/m]; B=[0; 1/m]; C=[1 0]; D=[0]; t=[0:0.001:2]; % time vector sys=ss(A,B,C,D) % system in state space [y,tt,x]=step(sys,t); % step response plot(tt,y,'LineWidth',2); ylabel('position');xlabel('time, [s]') grid; title('response to unit step input') plot(x(:,1),x(:,2), 'LineWidth',2);grid xlabel('x1=x'); ylabel('x2=x\_dot'); title('phase portrait') 1.2. ΧΩΡΟΣ ΚΑΤΑΣΤΑΣΗΣ 9 Η απόκριση του x1 (μετατόπιση) σε μοναδιαία βηματική είσοδο παριστάνεται γραφικά στην εικόνα 1.4. Σχήμα 1.4: Απόκριση του x1 σε μοναδιαία βηματική είσοδο. Η εικόνα φάσεων 1.5 δείχνει την μεταβολή των x1 , x2 , κατά την απόκριση σε μοναδιαία βηματική είσοδο. Η αρχική κατάσταση είναι x(0) = [0 0], σημείο από όπου ξεκινάει η Σχήμα 1.5: Οι φάσεις κατά την απόκριση σε μοναδιαία βηματική είσοδο. τροχιά, για να καταλήξει στο σημείο με θέση x1 = 0.1 και μηδενική ταχύτητα, x2 = 0. Παράδειγμα 1.2.2 Θεωρούμε σύστημα με διαφορική εξίσωση d2 y dy d3 y + 6 + 11 = 6u dt3 dt2 dt (1.19) Ζητούμενο είναι να παρασταθεί το σύστημα με τη μορφή εξισώσεων χώρου κατάστασης. Επιλέγουμε ως μεταβλητές κατάστασης τις x1 =y (1.20) x2 = dy dt 2 = ddt2y (1.21) x3 (1.22) 10 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ οπότε dx1 dx2 = x2 , = x3 , dt dt (1.23) dx3 = −6x1 − 11x2 − 6x3 + 6u (1.24) dt Με χρήση παράστασης μητρών, οι τρεις παραπάνω ΔΕ πρώτης τάξης μπορούν να περιγραφούν με μία, σε μορφή x˙ = Ax + Bu x 0 1 0 x1 0 d 1 x2 = 0 0 1 x2 + 0 [u] (1.25) dt x3 −6 −11 −6 x3 6 Η εξίσωση εξόδου περιγράφεται σε μορφή ως y = Cx + Du [ ] x1 y = 1 0 0 x2 x3 Έτσι τελικά έχουμε 0 1 0 A= 0 −6 −11 0 0 [ 1 ,B = 0 ,C = 1 0 −6 6 (1.26) 0 ] , D = [0] (1.27) για τις μήτρες A, B, C, D των εξισώσεων χώρου κατάστασης. 1.3 Επίλυση Εξισώσεων Κατάστασης Οι εξισώσεις κατάστασης έχουν τη μορφή x˙ = Ax + Bu (1.28) y = Cx + Du (1.29) Σε αυτή την παράγραφο παρουσιάζεται η γενική λύση των εξισώσεων κατάστασης. Πρώτα εξετάζεται η περίπτωση της ομογενούς εξίσωσης κατάστασης και κατοπιν αυτή της μη-ομογενούς. Επιλύοντας την πρώτη εξίσωση βρίσκεται η απόκριση του διανύσματος καταστάσεων, έχοντας λάβει υπόψη την αρχική κατάσταση x(t0 ) = x0 καθώς και το διάνυσμα εισόδου ελέγχου u(t). Η επίλυση της δεύτερης εξίσωσης χαρακτηρίζει την έξοδο του συστήματος, βασισμένη στις καταστάσεις και την είσοδο ελέγχου. 1.3.1 Επίλυση της Ομογενούς Εξίσωσης Κατάστασης θεωρούμε τη διαφορική εξίσωση σε διανυσματική-μητρική μορφή x˙ = Ax (1.30) 1.3. ΕΠΙΛΥΣΗ ΕΞΙΣΩΣΕΩΝ ΚΑΤΑΣΤΑΣΗΣ 11 όπου x(n × 1) είναι το διάνυσμα των καταστάσεων και (n × n) είναι μήτρα. Υποθέτουμε λύση σειράς xc (t) της μορφής xc (t) = c0 + c1 t + c2 t2 + ... + ck tk + ... (1.31) Αντικαθιστούμε την υποτιθέμενη λύση στην εξ. 1.30 και λαμβάνουμε c1 + 2c2 t + 3c3 t2 + ... + ck tk−1 + ... = (1.32) A(c0 + c1 t + c2 t2 + ... + ck tk + ...) (1.33) Για να είναι η xc (t) η πραγματική λύση, θα πρέπει η εξ. 1.33 να ισχύει για κάθε t. Εξισώνοντας τους συντελεστές των αντιστοίχων δυνάμεων του t έχουμε c1 c2 c3 = Ac0 = 12 Ac1 = 12 A2 c0 1 3 = 13 Ac2 = 3! A c0 (1.34) (1.35) (1.36) ... ck = ... 1 k = k! A c0 (1.37) (1.38) Θέτοντας t = 0 στην εξ. 1.31 βρίσκουμε ότι xc (0) = c0 (1.39) Επομένως η λύση γίνεται xc = (I + At + 1 2 2 1 A t + ... + Ak tk + ...)xc (0) 2! k! (1.40) Το αποτέλεσμα στην παρένθεση ομοιάζει με τη σειρά δυνάμεων της εκθετικής συνάρτησης και για αυτό ονομάζεται εκθετική μήτρα (matrix exponetial), δηλ. I + At + 1 2 2 1 A t + ... + Ak tk + ... = eAt 2! k! (1.41) Τελικά η λύση της εξ. 1.30 παίρνει τη μορφή x(t) = eAt x(0) (1.42) H εκθετική μήτρα έχει μεγάλη σπουδαιότητα στην ανάλυση στο χώρο κατάστασης των γραμμικών συστημάτων. 1.3.2 Ιδιότητες Εκθετικής Μήτρας Μπορεί να δειχθεί ότι η εκθετική μήτρα μιας μήτρας Α eAt = ∞ ∑ A k tk k=0 k! (1.43) 12 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ συγκλίνει απόλυτα για κάθε πεπερασμένο t. Έτσι μπορεί να χρησιμοποιηθεί η ανάπτυξη της παραπάνω σειράς για την κατά προσέγγιση εκτίμηση των στοιχείων της eAt . Λόγω της σύγκλισης της παραπάνω σειράς, είναι δυνατή η παραγώγισή της όρο προς όρο, οπότε προκύπτει d At e = AeAt = eAt A dt (1.44) Επίσης προκύπτουν οι σχέσεις eA(t+r) At −At t = −r ⇒ e e = eAt eAr −At At =e e =e (1.45) A(t−t) =I (1.46) Τέλος ισχύουν οι σχέσεις e(A+)t e(A+)t = eAt eBt , AB = BA ̸= eAt eBt , AB ̸= BA (1.47) (1.48) (1.49) 1.3.3 Μεταβατική Μήτρα Κατάστασης Η λύση της ομογενούς εξίσωσης κατάστασης x˙ = Ax (1.50) x(t) = Φ(t) x(0) (1.51) μπορεί να γραφεί ώς με Φ(t) την μήτρα (n×n) η οποία είναι μοναδική λύση της μητρικής διαφορικής εξίσωσης Παρατηρούμε ότι ˙ Φ(t) = AΦ(t), Φ(0) = I (1.52) Φ−1 (t) = e−At = Φ(−t) (1.53) Ο πίνακας Φ(t) ονομάζεται μεταβατική μήτρα κατάστασης (state transition matrix). Όταν οι ιδιοτιμές 1 , 2 , ...n της μήτρας Α είναι διακεκριμένες, η μήτρα Φ(t) θα περιλαμβάνει τις n εκθετικές συναρτήσεις eλ1 t , eλ2 t , eλ3 t , ...eλn t Αν ο πίνακας Α είναι διαγώνιος, τότε λt e 1 Φ(t) = eAt = 0 (1.54) 0 eλ2 t . . eλn t (1.55) 1.3. ΕΠΙΛΥΣΗ ΕΞΙΣΩΣΕΩΝ ΚΑΤΑΣΤΑΣΗΣ 13 Αν υπάρχουν πολλαπλές ιδιοτιμές, πχ οι ιδιοτιμές είναι λ1 , λ1 , λ1 , λ4 t, λ4 t, ...λn (1.56) τότε η μήτρα Φ(t) θα περιλαμβάνει εκτός από τους εκθετικούς όρους eλ1 t , eλ4 t , eλ5 t , ..., eλn t και όρους όπως teλ1 t , t2 eλ1 t . Τέλος έχουμε ότι Φ(t) = L−1 [Φ(s)] (1.57) με Φ(s) = [sI − A]. 1.3.4 Επίλυση της Μη-Ομογενούς Εξίσωσης Κατάστασης Θεωρούμε την πλήρη διανυσματική εξίσωση Η εξ. 1.58 γράφεται ώς x˙ = Ax + Bu (1.58) x(t) ˙ − Ax(t) = Bu(t) (1.59) At και πολλαπλασιάζουμε και τα δύο μέλη με e , λαμβάνοντας e−At [x(t) ˙ − Ax(t)] = d −At [e x(t)] = e−At Bu(t) dt Ολοκληρώνουμε την παραπάνω εξίσωση για χρόνο από 0 μέχρι t ∫ t e−At x(t) − x(0) = e−Aτ Bu(τ )dτ ⇒ (1.60) (1.61) 0 ∫ t x(t) = eAt x(0) + eA(t−τ ) Bu(τ )dτ (1.62) Φ(t − τ )Bu(τ )dτ (1.63) 0 Η εξ. 1.62 γράφεται ώς ∫ t x(t) = Φ(t)x(0) + 0 που αποτελεί την λύση της εξ. 1.58. Παράδειγμα 1.3.1 Ζητάμε τη χρονική απόκριση του συστήματος, με μήτρες [ ] [ ] 0 1 0 A= ,B = −2 −3 1 (1.64) όταν δίνεται ως είσοδος u(t) η μοναδιαία βηματική συνάρτηση, u(t) = 1. Εφαρμόζοντας Φ(t) = L−1 [Φ(s)], και λαμβάνοντας Φ(s) = [sI −A], η μεταβατική μήτρα κατάστασης Φ(t) = eAt είναι [ ] 2e−t − e2t e−t − e−2t Φ(t) = eAt = (1.65) −2e−t + 2e2t −e−t + 2e−2t 14 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Η απόκριση σε μοναδιαία βηματική συνάρτηση είναι ∫ t[ x(t) = eAt x(0)+ 0 2e−(t−τ ) − e2(t−τ ) −2e−(t−τ ) + 2e2(t−τ ) e−(t−τ ) − e−2(t−τ ) −e−(t−τ ) + 2e−2(t−τ ) ][ 0 1 ] [1] dτ (1.66) Η παραπάνω γίνεται [ ] [ x1 (t) 2e−t − e−2t = x2 (t) −2e−t + 2e−2t Η x(t) απλοποιείται σε [ ][ e−t − e−2t −e−t + 2e−2t ] x1 (t) x2 (t) [ = 1 2 x1 (0) x2 (0) − e−t + 21 e−2t e−t − e−2t ] [ + 1 2 − e−t + 12 e−2t e−t − e−2t (1.67) ] ] (1.68) σε περίπτωση που οι αρχικές συνθήκες είναι x(0) = 0. 1.3.5 Μέθοδοι Προσδιορισμού Μήτρας eAt Παρουσιάζονται εδώ δύο απ’ευθείας μέθοδοι υπολογισμού της μεταβατικής μήτρς κατάστασης, eAt , οι οποίες χρησιμοποιούνται ευρέως σε αναλυτικούς υπολογισμούς. Μέθοδος σειράς Γνωρίζουμε ότι η σειρά eAT = I + AT + 1 2 2 1 A T + ... + Ak T k 2! k! (1.69) συγκλίνει απόλυτα για πεπερασμένο Τ, οπότε και μπορεί να χρησιμοποιηθεί για τον προσεγγιστικό υπολογισμό της μήτρας eAt . Βασικό ερώτημα ειναι πόσοι όροι θα χρησιμοποιηθούν. Παράδειγμα 1.3.2 Θα υπολογίσουμε την τιμή της μήτρας eAt , μέσω ορισμένου αριθμού όρων της σειράς 1.69 για την μήτρα [ ] 0 1 A= , T = 0.25 (1.70) 0 −2 Με έναν όρο: [ eAt ≃ Με δύο όρους: [ At e ≃ Με τέσσερεις όρους: [ eAt ≃ 1 0 0 1 ] 1 0.25 0 0.5 1 0.198 0 0.604 (1.71) ] (1.72) ] (1.73) 1.3. ΕΠΙΛΥΣΗ ΕΞΙΣΩΣΕΩΝ ΚΑΤΑΣΤΑΣΗΣ 15 Σημειώνεται ότι ο πίνακας [ eAt = 1 0.196 0 0.607 ] (1.74) είναι η ακριβής τίμη της μήτρας. Μέθοδος Sylvester Η μέθοδος αυτή επιτρέπει τον ακριβή υπολογισμό της μήτρας κατάστασης eAt . Έστω ότι η συνάρτηση σειράς της τεραγωνικής nxn μήτρας Α είναι f (A) = inf ∑ ck Ak (1.75) k=1 Αν η μήτρα Α έχει διακεκριμένες ιδιοτιμές, η άπειρη σειρά μπορεί να αντικατασταθεί από το άθροισμα πεπερασμένων όρων f (A) = n ∑ f (λi )Fi (1.76) 1 (A − λj I) λi − λj (1.77) i=1 όπου οι μήτρες Fi ευρίσκονται ως Fi = n ∏ j=1,j̸=i Για τη συγκεκριμένη μήτρα eAt έχουμε eAt = n ∑ eλi t Fi (1.78) i=1 Παράδειγμα 1.3.3 Θα υπολογίσουμε πάλι την τιμή της μήτρας eAt , με [ ] 0 1 A= , T = 0.25 0 −2 (1.79) με τη μέθοδο Sylvester. Οι ιδιοτιμές ευρίσκονται ως Det {sI − A }= s(s + 2) = 0 , από όπου λ1 = 0, λ2 = −2. Με εφαρμογή των παραπάνω, έχουμε eAT = e0t F1 + e−2t F2 = F1 + e−2t F2 Υπολογίζουμε τους πίνακες F1 , F2 . [ [ ] ] [ 1 0 1 −2 1 0 1 F1 = − = 0 1 0 2 0 −2 2 (1.80) 1 2 0 ] (1.81) 16 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ [ 1 F2 = − 2 [ eAt = 1 0 1 2 0 ] [ + 0 1 0 −2 0 − 12 0 1 ] ] [ −0= e−2t = [ 0 0 1 2 (1 1 0 ] − 12 1 (1.82) − e−2t ) e−2t ] (1.83) Για t = 0.25 βρίσκουμε την τιμή [ e At = 1 0.196 0 0.607 ] (1.84) που βλέπουμε ότι είναι ίδια με την τιμή του προηγούμενου παραδείγματος. 1.4 Ελεγξιμότητα Θεωρούμε το σύστημα (1.85) x˙ = Ax + Bu όπου x είναι το διάνυσμα των καταστάσεων, u η εντολή ελέγχου, Α (n × n) είναι ό πίνακας του συστήματος, Β (n × 1) ο πίνακας των εισόδων ελέγχου. Θεωρούμε ότι οι πίνακες A, B είναι σταθεροί, χρονικά αμετάβλητοι. Το σύστημα είναι ελέγξιμο (Controllable) σε t = t0 αν μπορεί να κατασκευαστεί σήμα ελέγχου το οποίο θα μεταφέρει μία αρχική κατάσταση σε οποιαδήποτε τελική κατάσταση σε πεπερασμένο χρονικό διάστημα t0 ≤ t ≤ t1 . Όταν κάθε μεταβλητή κατάστασης είναι ελέγξιμη, τότε το σύστημα είναι πλήρως ελέγξιμο. Το σύστημα είναι πλήρως ελέγξιμο όταν και μόνον όταν η επαυξημένη μήτρα ελεγξιμότητας του συστήματος ικανοποιεί τη συνθήκη rank(Mc ) = rank[B AB An−1 B] = n (1.86) Ο βαθμός μήτρας (rank) αντιστοιχεί στη μέγιστη τετραγωνική υπομήτρα της Mc που είναι ομαλή (nonsingular). Στο MATLAB υπάρχει η σχετική εντολή CO = CTRB(A,B) που υπολογίζει τη μήτρα Mc . Παράδειγμα 1.4.1 Θεωρούμε το σύστημα [ ] [ ][ ] [ ] x˙1 1 1 x1 1 = + u 0 −1 x2 0 x˙2 (1.87) Εφόσον είναι [ rank(Mc ) = rank([B AB]) = rank το σύστημα δεν είναι πλήρως ελέγξιμο. MATLAB: 1 0 1 0 ] =1 (1.88) 1.5. ΠΑΡΑΤΗΡΗΣΙΜΟΤΗΤΑ 17 A=[1 1; 0 -1]; B=[1 ; 0]; Co=ctrb(A,B); >> Co = 1 1 0 0 rank(A)-rank(Co) >> ans = 1 Εφόσον οι βαθμοί των Α, Co είναι διαφορετικοί, το σύστημα δεν είναι πλήρως ελέγξιμο. Παράδειγμα 1.4.2 Θεωρούμε το σύστημα [ ] [ ][ ] [ ] x˙1 1 1 x1 1 = + u ˙ 1 −1 x 0 x2 2 Εδω είναι [ rank(Mc ) = rank([B AB]) = rank 0 1 1 −1 (1.89) ] =2 (1.90) όποτε το σύστημα είναι πλήρως ελέγξιμο. 1.5 Παρατηρησιμότητα Θεωρούμε το σύστημα x˙ = Ax (1.91) y = Cx (1.92) όπου x είναι το διάνυσμα των καταστάσεων, y είναι η έξοδος, Α (n × n) είναι ό πίνακας του συστήματος, C ο πίνακας της εξόδου. Θεωρούμε ότι οι πίνακες A, C είναι σταθεροί, χρονικά αμετάβλητοι. Το σύστημα είναι πλήρως παρατηρήσιμο (Observable) αν κάθε αρχική κατάσταση x0 μπορεί να προσδιοριστεί από την παρατήρηση του y(t) σε πεπερασμένο χρονικό διάστημα t0 ≤ t ≤ t1 . Συνεπώς το συστημα θα είναι πλήρως ελέγξιμο εαν κάθε μεταβολή των καταστάσεων τελικά επηρεάζει κάθε στοιχείο του διανύσματος εξόδου. Η έννοια της παρατηρησιμότητας είναι χρήσιμη στον σχεδιασμό ελεγκτών με ανατροφοδότηση καταστάσεων, στην περίπτωση που μεταβλητές κατάστασης δεν μπορούν να μετρηθούν όποτε χρειάζεται να εκτιμηθούνκ, ώστε να μπορεί να κατασκευαστεί το σήμα ελέγχου. Το σύστημα είναι πλήρως παρατηρήσιμο όταν και μόνον όταν η επαυξημένη μήτρα παρατηρησιμότητας του συστήματος ικανοποιεί τη συνθήκη rank(Mo ) = rank[C T AT C T AT (n−1) C T ] = n (1.93) Στο MATLAB υπάρχει η σχετική εντολή Mo = obsv(A,C) που υπολογίζει τη μήτρα M0 . 18 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Παράδειγμα 1.5.1 Θεωρούμε το σύστημα ] [ ][ ] [ ] [ x˙1 1 1 x1 1 = + u ˙ 1 −1 x 0 x2 2 [ ] [ ] x1 y = 1 0 x2 Είναι το σύστημα ελέγξιμο και παρατηρήσιμο ? Εδω είναι [ rank(Mc ) = rank([B AB]) = rank 0 1 1 −1 όποτε το σύστημα είναι πλήρως ελέγξιμο. Επίσης είναι rank(Mo ) = rank([C T AT C T ]) = rank [ (1.94) (1.95) ] 1 1 0 1 =2 (1.96) ] =2 (1.97) οπότε το σύστημα είναι πλήρως παρατηρήσιμο. 1.6 Έλεγχος με Πλήρη Ανατροφοδότηση Καταστάσεων Θεωρούμε σύστημα μονής εισόδου x˙ = Ax + Bu (1.98) y = Cx + Du (1.99) Η βασική ιδέα είναι να χρησιμοποιήσουμε ελεγκτή K ώστε να αλλάξουμε τις ιδιοτιμές του συστήματος , αλλάζοντας τελικά την δυναμική συμπεριφορά του συστήματος. Οι πόλοι του συστήματος κλειστού βρόχου είναι οι ιδιοτιμές του πίνακα Acl = A − BK. Θεωρούμε πλήρη ανατροφοδότηση των καταστάσεων (full-state feedback) της μορφής u = r − Kx, με u την είσοδο ελέγχου, r την είσοδο αναφοράς, Κ τα κέρδη του ελεγκτή, x τις μεταβλητές κατάστασης, όπως η εικόνα 1.6. Με βάση το σύστημα και την είσοδο ελέγχου, θα ισχύει x˙ = Ax + B(r − Kx) ⇒ x˙ = Ax + Br − BKx = (A − BK)x + Br = Acl x + Br, y = Cx + Du (1.100) (1.101) (1.102) Στόχος είναι να βρούμε τις τιμές K, ώστε ο πίνακας Acl να έχει επιθυμητές ιδιότητες: να είναι ευσταθής, με πόλους σε επιθυμητές θέσεις, κλπ. Με τη μέθοδο τοποθέτησης πόλων (pole placement), τοποθετούνται οι πόλοι κλειστού βρόχου σε επιθυμητές θέσεις. Στην περίπτωση ρυθμιστή (regulator), r = 0, όπου δεν υπάρχει εντολή εισόδου, τότε ο νόμος ελέγχου είναι ο γραμμικός συνδιασμός των μεταβλητών κατάστασης x1 x2 u = −Kx = −[K1 K2 ...Kn ] (1.103) . . xn 1.7. ΤΟΠΟΘΕΤΗΣΗ ΠΟΛΩΝ r u Σ 19 x˙ = Ax + Bu x C y − K Σχήμα 1.6: Έλεγχος με πλήρη ανατροφοδότηση καταστάσεων Για σύστημα n τάξης, θα υπάρχουν n κέρδη (συντελεστές) ανάδρασης K1 ...Kn , για n ρίζες του συστήματος ⇒ Αρκετοί βαθμοί ελευθερίας για τοποθέτηση πόλων με κατάλληλη επιλογή των Κ. 1.7 Τοποθέτηση Πόλων Με τη μέθοδο τοποθέτησης πόλων τοποθετούνται όλοι οι πόλοι του συστήματος κλειστού βρόχου σε επιθυμητές θέσεις. Πλεονεκτήματα της μεθόδου είναι η δυνατότητα καθορισμού της επιθυμητής μεταβατικής απόκρισης. Μειονέκτημα θεωρείται η δυσκολία εφαρμογής σε σύστηματα με περισσότερες από μία εισόδους/εξόδους και για αυτό εφαρμόζεται συνήθως σε συστήματα SISO. Επίσης παρότι οι πόλοι τοποθετούνται σε επιθυμητές θέσεις, δεν μπορούμε να γνωρίζουμε πόσο απέχουμε από τον βέλτιστο σχεδιασμό, κάτι που ειναι εφικτό με τη μέθοδο βέλτιστου ελέγχου. Απαραίτητη προυπόθεση ύπαρξης κέρδους Κ κατά την εφαρμογή της μεθόδου τοποθέτησης πόλων είναι οι πίνακες Α, Β του συστήματος να είναι ελέγξιμοι. Δύο είναι τα βασικά ερωτήματα που μας απασχολούν κατά την τοποθέτηση πόλων: • Πως θα τοποθετηθούν οι πόλοι στις επιθυμητές θέσεις (υπολογισμός κερδών του ελεγκτή)? • Που πρέπει να τοποθετηθούν οι πόλοι κλειστού βρόχου (υπολογισμός πόλων)? Για συστήματα 2ης τάξης, ο υπολογισμός κερδών γίνεται με απλές πράξεις. Για συστήματα μεγαλύτερης τάξης, εφαρμόζεται η μέθοδος Ackermann. Υπάρχουν 3 τεχνικές που βοηθούν στην επιλογή και υπολογισμό των επιθυμητών θέσεων πόλων προκειμένου για pole placement: • Κυριαρχούντες πόλοι συστήματος 2ης τάξης • Πρωτότυπος σχεδιασμός (Bessel/ITAE) • Συμμετρική τοποθέτηση πόλων (LQR-Linear Quadratic Regulator). Η μέθοδος αυτή εξετάζεται παρακάτω. 20 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ 1.7.1 Τοποθέτηση Πόλων-Μέθοδος για Συστήματα 2ης τάξης Έστω οτι οι επιθυμητές θέσεις πόλων είναι γνωστές (1.104) s = s1 , s2 , ..., sn Τότε η χαρακτηριστική εξίσωση είναι acl (s) = (s − s1 )(s − s2 )...(s − sn ) = 0 (1.105) Τα στοιχεία του ελέγχου Κ προκύπτουν από την ταύτιση των παραπάνω εξισώσεων Παράδειγμα 1.7.1 Ζητείται σχεδιασμός συστήματος ελέγχου με ανάδραση όλων των μεταβλητών κατάστασης, με επιθυμητή θέση πόλων κλειστού συστήματος την s= −0.5± j. Πίνακες χώρου κατάστασης είναι οι ακόλουθοι. [ A= 1 0 0 −2 ] [ ;B = 1 −1 ] (1.106) Το σύστημα έχει πόλους s=1, s= −2 και είναι ασταθές. Τοποθετούμε τους πόλους κλειστού βρόχου στις επιθυμητές θέσεις με τον πίνακα ανάδρασης K = [K1 K2 ]. Έτσι ο πίνακας Α-ΒΚ γίνεται [ ACL = A − BK = 1 − K1 K1 −K2 −2 + K2 ] (1.107) Οι ιδιοτιμές είναι s − 1 + K1 |sI − ACL | = −K1 K2 = s + 2 − K2 (s − 1 + K1 )(s + 2 − K2 ) + K1 K2 = 0 (1.108) (1.109) Οι ρίζες της εξίσωσης είναι οι ιδιοτιμές του συστήματος κλειστού βρόχου √ s1,2 = −0.5(K1 − K2 + 1) ± 0.5 K12 + K22 − 2K1 K2 − 6K1 − 2K2 + 9 (1.110) Eξισώνοντας με τους επιθυμητούς πόλους −0.5 ± j βρίσκουμε ότι η λύση για K1 , K2 δίνει K1 = K2 = 13/12 = 1.0833. Άρα ο πίνακας του ελεγκτή Κ είναι ο Κ= [1.0833 1.0833] . Η εικόνα 1.7 δείχνει την απόκριση του συστήματος κλειστού βρόχου με τον παραπάνω ελεγκτή. Το επάνω διάγραμα δείχνει την απόκριση της εξόδου (y = Cx = x1 ). Το κάτω διάγραμμα δείχνει την μεταβολή των καταστάσεων x1 , x2 . MATLAB 1.7.2 Ο υπολογισμός κερδών ελεγκτή μπορεί να γίνει εναλλακτικά με την εντολή acker. 1.7. ΤΟΠΟΘΕΤΗΣΗ ΠΟΛΩΝ 21 Σχήμα 1.7: Απόκριση συστήματος κλειστού βρόχου. A=[1 0;0 -2];B=[1 ; -1 ]; C=[1 0]; D=0; P=[-0.5+j,-0.5-j]; % desired pole placement H=acker(A,B,P) % Ackermann method gives H as feedback matrix >> H = 1.0833 1.0833 [y,x,t]=step(A-B*H,B,C,D); % closed-loop system subplot(211);plot(t,y), ylabel('output') subplot(212);plot(t,x(:,1),t,x(:,2)), ylabel('states') legend('x1','x2'); xlabel('Time (sec)') Παράδειγμα 1.7.3 Η εικόνα 1.8 δείχνει την τοποθέτηση πόλων-μηδενιστών στον κλειστό βρόχο, με χρήση της εντολής pzmap. Επίσης, οι εντολές eig, damp υπολογίζουν τις ιδιοτιμές και τα ωn , ζ που έχουν επιτευχθεί για το τελικό σύστημα. MATLAB 1.7.4 % draw poles,zeros for closed-loop sys pzmap(ss(A-B*H,B,C,D)) % poles of closed-loop system eig(A-B*H) >> -0.5000 + 1.0000i -0.5000 - 1.0000i % nat. freq and damping [wn,zeta]=damp(A-B*H) 22 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Σχήμα 1.8: Πόλοι, μηδενιστές στον κλειστό βρόχο >> wn = 1.1180 1.1180 zeta = 0.4472 0.4472 1.7.2 Τοποθέτηση Πόλων-Μέθοδος Ackermann Απαιτούμενο στον έλεγχο με ανατροφοδοτηση εισόδων είναι η εύρεση των τιμών Κ του ελεγκτή. Στη μέθοδο Ackermann , η εύρεση τιμών K γίνεται με τον υπολογισμό K = [0 0 ...1]Mc−1 Φd (A) (1.111) όπου Mc είναι ο πίνακας ελεγξιμότητας του συστήματος και Φd η χαρακτηριστική εξίσωση για τους πόλους κλειστού βρόχου, έχοντας θέσει s = A. Η μήτρα [0 0 ...1] ορίζεται ανάλογα με το πλήθος των όρων του κέρδους K. Ο πίνακας ελεγξιμότητας του συστήματος είναι Mc = [B AB An−1 B] και πρέπει να είναι αντιστρέψιμος. Η μέθοδος αυτή προτάθηκε από τον J. Ackermann το 1972. (1.112) 1.7. ΤΟΠΟΘΕΤΗΣΗ ΠΟΛΩΝ 23 Στο MATLAB υπάρχουν οι εντολές K=acker(A,B,P), K=place(A,B,P), με Α, Β τους πίνακες εξισώσεων κατάστασης και P τον πίνακα με τις επιθυμητές θέσεις πόλων. Προτιμάται η εντολή place καθώς είναι αριθμητικά πιο ευσταθής. Παράδειγμα 1.7.5 Έστω ότι οι επιθυμητοί πόλοι είναι s1,2 = −5, −6. Ζητάμε να υπολογιστούν με τη μέθοδο Ackermann οι τιμές του κέρδους K του ελεγκτή. Πίνακες χώρου κατάστασης είναι οι ακόλουθοι. [ ] 1 1 A= , B = [1 0]T . (1.113) 1 2 Ο ελεκτής προκύπτει από τον υπολογισμό της εξ. 1.111. Ο Πίνακας ελεγξιμότητας του συστήματος είναι [ ] 1 1 Mc = [B AB] = . 0 1 (1.114) Κατόπιν υπολογίζουμε την χαρακτηριστική εξίσωση, θέτοντας τους δύο επιθυμητούς πόλους, (s+5)(s+6) = s2 +11s+30. Για τον υπολογισμό της Φd , στην χαρακτηριστική εξίσωση αντικαθιστούμε τη μεταβλητή s με τη μήτρα A, δηλ. Φd (A) = A2 + 11 ∗ A + 30 ∗ I, με I το μοναδιαίο πίνακα. Υπολογίζουμε το κέρδος Κ [ ]−1 ([ ]2 [ ] [ ]) 1 1 1 1 1 1 1 0 K = [K1 K2 ] = [0 1] + 11 + 30 = [14 57] (1.115) 0 1 1 2 1 2 0 1 Έτσι το κέρδος Κ είναι K = [14 57]. MATLAB 1.7.6 Οι παραπάνω υπολογισμοί γινονται με τον ακόλουθο κώδικα στο MATLAB. A=[1 1;1 2]; B=[1 ;0]; % method A: use place or acker command k_place=place(A,B,[-5;-6]) >> k_place = 14.0000 57.0000 % method B: use Ackermann's formula CC=ctrb(A,B) % controllability matrix k_acker=[0 1]*CC^(-1)*((A*A)+11*A+30*eye(2)) 1.7.3 Τεχνικές για την Επιλογή Θέσεων Πόλων Κυριαρχούντες πόλοι συστήματος 2ης τάξης Στην τεχνική αυτή, θεωρούμε ότι οι πόλοι κλειστού βρόχου αποτελούνται από ζεύγος κυριαρχούντων πόλων συστήματος 2ης τάξης (dominant poles) και υπόλοιπων πόλων που έχουν πραγματικό μέρος με ικανοποιητική απόσβεση, ώστε τελικά το σύστημα θα αντιστοιχεί σε σύστημα 2ης τάξης με αποδεκτή δράση ελέγχου. 24 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ ω2 Έχουμε ήδη μελετήσει σύστημα 2ης τάξης, s2 +2ζωn s+ω2 , με βάση τα ωn (φυσική n συχνότητα) και ζ (απόσβεση). Ο χρόνος ανύψωσης, η υπερακόντιση κα ο χρόνος αποκατάστασης προκύπτουν απο τους πόλους. Στην πράξη λαμβάνονται υπόψη τα εξής: 10 − 90% Rise time : tr = 1 + 1.1ζ + 1.4ζ 2 ωn Settling time (5%) : ts = 3 ζωn (1.117) π √ ωn 1 − ζ 2 (1.118) P eak overshoot : Mp = e−ζωn tp (1.119) T ime to peak : tp = Πρωτότυπος σχεδιασμός Bessel Στην τεχνική αυτή, επιλέγονται πόλοι κλειστού βρόχου από σύστημα με γνωστή και επιθυμητή απόκριση, όπως το πολυώνυμο Bessel. Η μέθοδος Bessel είναι ικανοποιητική, όμως η βηματική απόκριση είναι αργή, έχοντας μικρή υπερακόντιση. Οι εικόνες 1.9, 1.10 δείχνουν τις αποκρισεις και τους πόλου αντίστοιχα. Σχήμα 1.9: Η μέθοδος Bessel, [5]. Διαδικασία Σχεδιασμού Συστήματος n Τάξης 1. Επιλέγουμε το χρόνο αποκατάστασης ts . 2. Βρίσκουμε k = n πολύωνυμο από τον πίνακα πόλων. 1.7. ΤΟΠΟΘΕΤΗΣΗ ΠΟΛΩΝ 25 Σχήμα 1.10: Η μέθοδος Bessel, [5]. 3. Διαιρούμε τους πόλους με ts . 4. Φτιάχνουμε το επιθυμητό χαρακτηριστικό πολυώνυμο Φd (s) και βρίσκουμε τα κέρδη του ελεγκτή (εντολές MATLAB: acker/place). 5. Ελέγχουμε το τελικό αποτέλεσμα ως προς επίδοση και εντολή ελεγκτή. Βηματικές Αποκρίσεις Έχει γίνει κανονικοποίηση, για να υπάρχει χρόνος αποκατάστασης ts = 1 sec. Αν είναι επιθυμητός άλλος χρόνος ts , οι πόλοι διαιρούνται με ts . Πόλοι Ρίζες του πολυωνύμου Bessel, με κανονικοποίηση, για να υπάρχει χρόνος αποκατάστασης ts = 1 sec. Παράδειγμα 1.7.7 Δίνεται σύστημα με συνάρτηση μεταφοράς G(s) = 1 s(s + 4)(s + 1) (1.120) με πίνακες χώρου κατάστασης −5 −4 0 1 0 0 ;B = 0 A= 1 0 −1 0 0 (1.121) και επιθυμητό ts = 2 sec. Έχουμε ότι n = k = 3, άρα υπάρχουν 3 πόλοι, και από τον πίνακα πόλων κλειστού βρόχου λαμβάνουμε −5.0093/2 = −2.5047 και (-3.9668 ± j 3.7845)/2 = −1.9834± j 1.8922. Με τα παραπάνω, σχηματίζουμε το Φd (s) και βρίσκουμε τα κέρδη του ελεγκτή με εντολή στο MATLAB: K = acker(A,B,Phi). 26 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Πρωτότυπος σχεδιασμός ITAE Στην τεχνική αυτή, εναλλακτικά από το πολυώνυμο Bessel, επιλέγονται μεταβατικές αποκρίσεις όπου ελαχιστοποιείται το ολοκλήρωμα ∫ ∞ J= t|e|dt (1.122) 0 Επιθυμητοί πόλοι: k=1 k=2 k=3 :s+1 : s + 0.7071 ± j0.707 : s + 0.708(s + 0.52 ± j1.068) (1.123) (1.124) (1.125) k=4 : s + (0.424 ± 1.26)(s + 0.62 ± j0.414) (1.126) (1.127) Βηματική απόκριση ITAE, ω=1 rad/s. Η εικόνα 1.11 παρουσιάζει τις αποκρίσεις. Σχήμα 1.11: Πρωτότυπος σχεδιασμός ITAE. 1.8 Βέλτιστος Έλεγχος Ο βέλτιστος έλεγχος (optimal control) εισήχθη το 1960, ταυτόχρονα σε ΗΠΑ και πρώην Σοβιετική Ένωση, την εποχή που παρουσίαζε ενδιαφέρον η έρευνα για καθοδήγηση (guidance) και ελιγμούς (maneuvering), κυρίως για στρατιωτικές και διατημικές εφαρμογές. Ο βέλτιστος έλεγχος επιδιώκει η απόδοση να είναι εκτός από αποδεκτή και βέλτιστη. Στον κλασσικό έλεγχο προσπαθούμε να ελαχιστοποιήσουμε το σφάλμα σε καθορισμένα χρονικά σημεία, π.χ. σφάλμα μόνιμης κατάστασης. Στο βέλτιστο έλεγχο ελαχιστοποιούμε το σφάλμα παντού. Συνάρτηση κόστους ή δείκτης λειτουργικής απόδοσης (ΔΛΑ-performance index) μπορεί να είναι το ολοκλήρωμα σφάλματος J1 ή το ολοκλήρωμα απόλυτης τιμής 1.8. ΒΕΛΤΙΣΤΟΣ ΕΛΕΓΧΟΣ σφάλματος J2 27 ∫ ∫ tf 2 J1 = e (t)dt, tf J2 = ti |e(t)|dt (1.128) ti Σημαντικό πλεονέκτημα της μεθόδου θεωρείται η δυνατότητα εφαρμογής σε σύστηματα με πολλές εισόδους/πολλές εξόδους (ΜΙΜΟ). Για γραμμικό μοντέλο και τετραγωνική συνάρτηση σφάλματος, το πρόβλημα είναι γνωστό ως Γραμμικό Τετραγωνικό (Linear Quadratic-LQ). Η συνάρτηση κόστους ορίζεται ως ∫ 1 ∞ T J= (x Qx + uT Ru) dt 2 0 (1.129) όπου Q ≥ 0, R > 0 είναι συμμετρικοί, θετικά ορισμένοι πίνακες καταλλήλων διαστάσεων. Αυτή η συνάρτηση κόστους αποτελεί συμβιβασμό (tradeoff) ανάμεσα στην απόσταση της κατάστασης (state) από την αρχή (origin) και το κόστος της εισόδου ελέγχου. Ο βέλτιστος νόμος ελέγχου (Linear Quadratic Regulator-LQR) προκύπτει με ανατροφοδότηση κατάστασης u = −Kx(t) (1.130) Το κέρδος του ελεγκτή δίνεται από K = −R−1 B T P (1.131) όπου P είναι συμμετρική θετικά ημιορισμένη λύση της αλγεβρικής εξίσωσης Riccati AT P + P A − P BR−1 B T P + Q = 0 (1.132) Οι πίνακες βάρους Q, R αποτελούν επιλογή του μηχανικού και επιδρούν στις μεταβλητές x,u. Συνήθως έχουν διαγώνια μορφή (qii , rii ̸= 0), και τα στοιχεία τους καθορίζουν τη συμμετοχή των μεταβλητών κατάστασης και εισόδων ελέγχου στη συνολική συνάρτηση κόστους. Η ενέργεια του συστήματος σχετίζεται με τον παράγοντα xT Qx. Κατά τη μεταβατική κατάσταση, πρέπει η ενέργεια να πέφτει γρήγορα στο μηδέν. Η μέγιστη τιμή της σχετίζεται με την υπερακόντιση, ενώ ο χρόνος μείωσης της ενέργειας στο μηδέν σχετίζεται με τον χρόνο αποκατάστασης (settling time). Η ενέργεια ελέγχου σχετίζεται με τον παράγοντα uT Ru. Παράδειγμα 1.8.1 Δίνεται σύστημα διπλού ολοκληρωτή, με συνάρτηση μεταφοράς G(s) = 1/s2 . Θεωρούμε ότι x = [x1 x2 ]. Σε μορφή εξισώσεων χώρου κατάστασης έχουμε [ ] [ ] [ ] [ ] 0 1 0 A= (1.133) ;B = ;C = 1 0 ;D = 0 0 0 1 Ζητείται να σχεδιαστεί βέλτιστος ελεγκτής LQR. Ο βέλτιστος ελεγκτής LQR στο MATLAB υλοποιείται με την εντολή [k,m,e]=lqr(A,B,Q,R). k είναι το κέρδος του ελεγκτή, m είναι η λύση της εξίσωσης Riccati και e είναι οι ιδιοτιμές 28 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ του συστήματος κλειστού βρόχου. Q, R είναι πίνακες βαρών για τις καταστάσεις και τις εισόδους αντίστοιχα. Για το συγκεκριμένο παράδειγμα έχουμε τις παρακάτω εντολές. A=[0 1;0 0]; B=[0;1]; C=[1 0];D=[0] % system matrices Q=[1 0 ; 0 0] R=0.016 %R=0.016, 0.05, 0.5, 10 [K,M,E]=lqr(A,B,Q,R) sys1=ss(A-B*K,zeros(2,1),C,zeros(1,1)) [y1,t1,x1]=initial(sys1,[1 0]'); u=-K*x1'; % plotting subplot(211) plot(x1(:,1),'r-.'); hold on plot(x1(:,2),'*'); legend('x1','x2'); grid; ylabel('states') subplot(212) plot(u); grid; ylabel('control'); title('LQR design') Οι αποκρίσεις και η εντολή ελέγχου για R = 0.016, R = 10, φαίνονται στο Σχήμα 1.12. Ως αρχικές τιμές οι καταστάσεις λαμβάνουν τιμές x = [1 0]. Η ρύθμιση στην επιθυμητή τιμή 0 γίνεται με επιτυχία και για τις 2 καταστάσεις. Δοκιμάζοντας διάφορες Σχήμα 1.12: Η μεταβολή των καταστάσεων και η εντολή ελέγχου στον βέλτιστο έλεγχο, για R = 0.016, R = 10. τιμές R προκύπτουν διάφορετικά κέρδη Κ και ιδιοτιμές για το σύστημα κλειστού βρόχου. Για R = 0.016, το κέρδος K = [7.9057 3.9764] και οι ιδιοτιμές E = −1.9882 + 1.9882i, −1.9882 − 1.9882i. Τέλος, για R = 10, το κέρδος K = [0.3162 0.7953] και οι ιδιοτιμές E = −0.3976 + 0.3976i, −0.3976 − 0.3976i. Για R = 0.016, οι αποκρίσεις είναι ταχύτερες, με μεγαλύτερη είσοδο (εντολή) ελέγχου. 1.8. ΒΕΛΤΙΣΤΟΣ ΕΛΕΓΧΟΣ 29 Παράδειγμα 1.8.2 Δίνεται σύστημα, σε μορφή εξισώσεων χώρου κατάστασης [ ] [ ] 0 1 0 A= ;B = 0 −1 1 (1.134) Θεωρούμε ότι x = [x1 x2 ]. Ζητείται να σχεδιαστεί βέλτιστος ελεγκτής LQR με αναλυτικό υπολογισμό του κέρδους Κ μέσω εξίσωσης Riccati. Η συνάρτηση κόστους ορίζεται ως ∫ 1 ∞ T J= (x Qx + uT Ru)dt 2 0 (1.135) όπου επιλέγουμε τιμές για τους πίνακες Q,R ως [ ] [ ] 1 0 Q= ;R = 1 0 1 (1.136) Θεωρούμε βέλτιστο νόμο ελέγχου με ανατροφοδότηση καταστάσεων u = −Kx(t) (1.137) Το κέρδος του ελεγκτή δίνεται από K = −R−1 B T P (1.138) Ο πίνακας P προκύπτει ώς συμμετρική θετικά ημιορισμένη λύση της αλγεβρικής εξίσωσης Riccati AT P + P A − P BR−1 B T P + Q = 0 (1.139) Το αποτέλεσμα είναι [ P = 2 1 1 1 ] (1.140) Υπολογίζουμε το κέρδος Κ ως K = −R −1 T B P = [ 1 ][ 0 1 ] [ 2 1 1 1 ] = [ 1 1 ] (1.141) Τελικά η εντολή ελέγχου είναι u = −Kx(t) = −x1 − x2 (1.142) Για το συγκεκριμένο παράδειγμα έχουμε τις παρακάτω εντολές στο MATLAB. A=[0 1;0 -1]; B=[0;1]; % system matrices Q=[1 0 ; 0 1]; R=[1]; % select weights for states, input BB=B*inv(R)*B' % calculate matrix BB required by are 30 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ P=are(A,BB,Q) K=inv(R)*B'*P % solve Riccati % calculate gain K >>P = 2.0000 1.0000 1.0000 1.0000 >>K = 1.0000 1.0000 Η εντολή are(A,BB,Q) δίνει ως P την λύση της εξίσωσης Riccati. Παράδειγμα 1.8.3 Δίνεται σύστημα με μορφή εξισώσεων χώρου κατάστασης 0 1 0 0 0 1 ;B = 0 A= 0 −35 −27 −9 1 (1.143) Δίνονται αρχικές συνθήκες x(0) = [1 0 0]T . Ζητείται να σχεδιαστεί βέλτιστος ελεγκτής LQR και να δωθούν οι ιδιοτιμές του συστήματος κλειστού βρόχου. Επιλέγουμε τιμές για τους πίνακες Q, R ως 1 0 0 [ ] Q = 0 1 0 ;R = 1 (1.144) 0 0 1 Θεωρούμε βέλτιστο νόμο ελέγχου με ανατροφοδότηση καταστάσεων u = −Kx(t) (1.145) Οι υπολογισμοί γίνονται με το παρακάτω πρόγραμμα MATLAB. A=[0 1 0; 0 0 1; -35 -27 -9]; B=[0;0;1]; % system matrices Q=eye(3); R=[1]; % select weights for states, input [K,M,E]=lqr(A,B,Q,R) % calculate regulator sys2=ss(A-B*K,eye(3),eye(3),eye(3)); % calculate response tt=0:0.01:8; % calculate time vector [y2,t2,x2]=initial(sys2,[1; 0; 0]', tt); % simulate response u=-K*x2'; % calculate control input % plotting subplot(211) plot(t2,x2(:,1),'r-.'); hold on plot(t2,x2(:,2),'k--'); hold on plot(t2,x2(:,3)); legend('x1','x2', 'x3'); grid; ylabel('states') subplot(212) plot(t2,u); grid; ylabel('control'); xlabel('time [s]'); title('LQR design ex. 2') 1.8. ΒΕΛΤΙΣΤΟΣ ΕΛΕΓΧΟΣ 31 Το κέρδος του ελεγκτή είναι K = 0.0143 0.1107 0.0676 Οι ιδιοτιμές του συστήματος κλειστού βρόχου δείχνουν ότι το σύστημα ειναι ευσταθές. E = -5.0958 -1.9859 + 1.7110i -1.9859 - 1.7110i Οι αποκρίσεις και η εντολή ελέγχου φαίνονται στο Σχήμα 1.13. Σχήμα 1.13: Οι αποκρίσεις και η εντολή ελέγχου. Φαίνεται ότι οι 3 καταστάσεις καταλήγουν στο 0, με αρχική τιμή της x1 = 1. Παράδειγμα 1.8.4 Δίνεται σύστημα με μορφή εξισώσεων χώρου κατάστασης [ ] [ ] 0 1 0 A= ;B = 0 −1 1 (1.146) Θεωρούμε ότι x = [0 1]. Ζητείται να σχεδιαστεί βέλτιστος ελεγκτής LQR (ρυθμιστής) στο Simulink. Σύμφωνα με τα παραπάνω, με τη βοήθεια του MATLAB υπολογίζεται ότι το κέρδος του ελεγκτή είναι K = [1.0 1.0]. Ο βέλτιστος ελεγκτής LQR στο Simulink φαίνεται στο Σχήμα 1.14. Στην περίπτωση που ζητείται η ελεγκτής να ακολουθεί συγκεριμένη εντολή (tracking), τότε πρέπει να τοποθετηθεί ολοκληρωτής μετά την εντολή εισόδου. Ένας τέτοιος βέλτιστος ελεγκτής με ολοκληρωτή στο Simulink φαίνεται στο Σχήμα 1.15. 32 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Σχήμα 1.14: Βέλτιστος ελεγκτής LQR στο Simulink. 1.9 Παρατηρητές Καταστάσεων Στον έλεγχο με ανατροφοδότηση καταστάσεων είναι απαραίτητη προυπόθεση ότι θα είναι διαθέσιμες οι καταστάσεις του συστήματος. Κάτι τέτοιο είναι πολλές φορές δύσκολο (δαπανηρό λόγω μεγάλου κόστους πολλών αισθητήρων) ή αδύνατο (λόγω θέσης μέτρησης του μεγέθους). Για να ξεπεραστεί η δυσκολία αυτή, οι καταστάσεις ”εκτιμώνται” μέσω ”παρατηρητών” (observers). Αυτοί αποτελούνται από μαθηματικό μοντέλο (παρόμοιο με το σύστημα), λαμβάνοντας ώς είσοδο την έξοδο y και την εντολή ελέγχου u, δίνοντας ως x ˆ, την εκτίμηση του x. Διαθέτουν κατάλληλο κέρδος K που υπολογίζεται έτσι ώστε το σφάλμα μεταξύ των καταστάσεων του συστήματος και των εκτιμώμενων καταστάσεων συγκλίνει γρήγορα στο μηδέν. Απαραίτητη προυπόθεση για να εκτιμηθούν οι καταστάσεις που δεν είναι διαθέσιμες, είναι το συστημα να είναι παρατηρήσιμο (observable). Τέτοιος παρατηρητής ονομάζεται τύπου Luenberger και φαίνεται στο Σχήμα 1.16. Εναλλακτική μορφή παρατηρητή είναι το φίλτρο Kalman, με βασικό του χαρακτηριστικό ότι είναι βέλτιστο (optimum) σε ότι αφορά τον θόρυβο (noise) μέτρησης και παρατήρησης. Οι παρατηρητές βρίσκουν ευρεία εφαρμογή στην ναυπηγική, στην αεροναυπηγική, σε εφαρμογές διαστημικής και σε μηχανές εσωτερικής καύσης. ˙ Bu + Ky(1.147) x ˆ = (A − KC)ˆ x+ ˙ x ˆ = Aˆ x + Bu + K(y − Cx ˆ)(1.148) Προς τιμήν του D. Luenberger, που εισήγαγε τον όρο στη θεωρία γραμμικών συστημάτων το 1963. 1.9. ΠΑΡΑΤΗΡΗΤΕΣ ΚΑΤΑΣΤΑΣΕΩΝ 33 Σχήμα 1.15: Βέλτιστος ελεγκτής με ολοκληρωτή στο Simulink Στην περίπτωση που ο παρατηρητής εκτιμά όλο το πλήθος των καταστάσεων ονομάζεται παρατηρητής πλήρους τάξης (full order observer), ενώ αν εκτιμά κάποιες από τις καταστάσεις ονομάζεται παρατηρητής μειωμένης τάξης (reduced order observer). Ο σχεδιασμός ελεγκτή με τη βοήθεια παρατηρητών γίνεται ως εξής, ακολουθώντας την αρχή του διαχωρισμού (separation principle). • Στην αρχή σχεδιάζεται ο ελεγκτής θεωρώντας ότι όλες οι μεταβλητές κατάστασης μπορούν να μετρηθούν • Κατόπιν σχεδιάζεται ο παρατηρητής για να εκτιμήσει τις μεταβλητές κατάστασης • Συνδιάζεται ο ελεγκτής με τον παρατηρητή Παράδειγμα 1.9.1 Δίνεται σύστημα με μορφή εξισώσεων χώρου κατάστασης, [[9], ex. 12-7]. [ ] [ ] [ ] 0 1 0 A= ;B = ;C = 0 1 (1.149) 20.6 0 1 Θεωρούμε ότι x(0) = [1 0]. Ζητείται να σχεδιαστεί παρατηρητής. Με τη μέθοδο τοποθέτησης πόλων σχεδιάζεται ελεγκτής, για επιθυμητούς πόλους κλειστού βρόχου τους s1,2 = −1.8 ± 2.4j. Έτσι υπολογίζεται ότι το κέρδος του ελεγκτή είναι K = [29.6 3.6]. Για τον παρατηρητή, είναι επιθυμητό να έχει πόλους τους p1,2 = −8, −8. Σύμφωνα με τα παραπάνω, υπολογίζεται ότι το κέρδος του παρατηρητή είναι Kob = [16 84.6]T . Το Σχήμα 1.17 δείχνει το σύστημα ελεγκτή με πλήρη εκτίμηση καταστάσεων στο Simulunk. 34 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ u x˙ B Σ R Σ x y C − A xˆ Kc u A B Σ ˆ˙ x R C − Σ Kob Observer Σχήμα 1.16: Σύστημα παρατηρητή για εκτίμηση καταστάσεων Η απόκριση των καταστάσεων x1 , x2 , xˆ1 , xˆ2 κα του σφάλματος εκτίμησης φαίνεται στο Σχήμα 1.18 Άσκηση 1.9.2 Να σχεδιαστεί παρατηρητής μειωμένης τάξης για το ανεστραμένο εκκρεμές. 1.10. ΠΑΡΑΡΤΗΜΑ: ΠΡΑΞΕΙΣ ΜΕ ΜΗΤΡΕΣ 35 Σχήμα 1.17: Σύστημα παρατηρητή Simulink, Ogata ex. 12-7 1.10 Παράρτημα: Πράξεις με Μήτρες Ανάστροφος πίνακα (transpose): Αντικατάσταση γραμμών με στήλες (A + B)T = AT + B T ; (AB)T = B T AT (1.150) Συμμετρικός πίνακας: AT = A (1.151) Ορίζουσα (determinant): a 2X2 : |A| = 1 b1 a2 = a1 .b2 − b1 .a2 b2 a1 a2 a3 3X3 : |A| = b1 b2 b3 = c1 c2 c3 a1 .b2 .c3 + b1 .c2 .a3 + c1 .a2 .b3 − c1 .b2 .a3 − b1 .a2 .c3 − a1 .b3 .c2 (1.152) (1.153) (1.154) Αντίστροφος πίνακα (inverse): A.A−1 = I; A−1 ⇐⇒ |A| ̸= 0 A−1 = adj(A) |A| (1.155) (1.156) 36 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Σχήμα 1.18: Απόκριση του συστηματος ελέγχου-παρατηρητή (AB)−1 = B −1 A−1 ; (AT )−1 = (A−1 )T [ 2X2 : A = a c b d ] −1 ⇒A [ = d −b −c a ] . 1 |A| ei − hf −(bi − hc) a b c ai − gc 3X3 : A = d e f ⇒ A−1 = −(di − gf ) g h i dh − ge −(ah − gb) (1.157) (1.158) bf − ec 1 −(af − dc) . (1.159) |A| ae − db Βαθμός πίνακα (rank): Βαθμός πίνακα = Ο αριθμός των γραμμικά ανεξάρτητων στηλών. Ένας τετραγωνικός πίνακας n × n έχει βαθμό n αν και μόνον αν |A| ̸= 0. Ιακωβιανή μήτρα (Jacobian matrix): J= ∂(x, y) = ∂(u, v) [ ∂x ∂u ∂y ∂u ∂x ∂v ∂y ∂v ] (1.160) Ιδιοτιμές πίνακα (eigenvalues): Εξίσωση για την εύρεση ιδιοτιμών: |λI − A| = 0. Η εξίσωση αυτή είναι ισοδύναμη με την εύρεση των ριζών της λn +a1 λn−1 +...+an−1 λ+an = 0. Υπάρχουν 2 περιπτώσεις: α) όλες οι ιδιοτιμές είναι διακριτές, β) επαναλαμβανόμενες ιδιοτιμές. 1.11. ΑΝΑΦΟΡΕΣ 37 Παράδειγμα 1.10.1 Να βρεθούν οι ιδιοτιμές του πίνακα Α: [ ] 0 1 A= −6 −5 (1.161) Θεωρούμε (1.162) ⇒ λ2 + 5λ + 6 = 0 ⇒ λ1 = −3, λ2 = −2. (1.163) λ |λI − A| = 0 ] λ −1 1 0 0 = − 6 λ+5 λ −6 −5 που είναι και οι ζητούμενες ιδιοτιμές. Παράδειγμα 1.10.2 1.11 Αναφορές [1]. κεφάλαια χχχχχχχ. [2]. Κεφ. 9: Εισαγωγή στην βελτιστοποίηση των συστημάτων ελέγχου. [3]. Chapter 6. [4]. Chapter 11. [5]. Ch. 13, 14. Στο [2], κεφ. 9, υπάρχουν περισσότερα στοιχεία για τοποθέτηση πόλων κατά ISE, ITAE, Butterworth, για διάφορες μορφές σημάτων εισόδου. Στο [3], κεφ. 6, υπάρχουν περισσότερα στοιχεία για τοποθέτηση πόλων κατά ITAE, Bessel. Στην παρούσα παρουσίαση, το υλικό για την τοποθέτηση πόλων κατά Bessel έχει βασιστεί στο [5], ch. 13, 14. Περισσότερα στοιχεία για παρατηρητές υπάρχουν στα [11] και [9]. 38 ΚΕΦΑΛΑΙΟ 1. ΕΛΕΓΚΤΕΣ ΣΤΟ ΧΩΡΟ ΚΑΤΑΣΤΑΣΗΣ Βιβλιογραφία [1] Κρικέλης Ν., Μοντελοποίηση και Βέλτιστος Έλεγχος Συστημάτων, Πλαίσιο, 1990. [2] Κρικέλης Ν., Εισαγωγή στον Αυτόματο Έλεγχο, Συμμετρία, 2000. [3] Franklin, G., Powel, D., Enami-Naeimi, A., Feedback Control of Dynamic Systems, Addison Wesley Longman, 5th edition, 2005. [4] Dorf, R., Bishop, R., Modern Control Systems, Prentice-Hall, 2001. [5] How, J., Course materials for 16.31 Feedback Control Systems, Fall 2007. MIT OpenCourseWare (http://ocw.mit.edu), Massachusetts Institute of Technology. [6] Chen, C-T., Linear System eory and Design, 3rd ed., Oxford Univ. Press, 1999. [7] Antsaklis, P., Michel, A., Linear Systems, McGraw Hill, 1997. [8] Bay, J., Fundamentals of Linear State Space Systems, McGraw Hill, 1999. [9] Ogata, K., Modern Control Engineering (3rd Edition) , Prentice Hall, 1997. [10] Williams, R., Lawrence, D., Linear state-space control systems, John Wiley and Sons, 2007. [11] Friedland, B., Control System Design, An introduction to state-space methods, McGraw-Hill, 1986. 39
© Copyright 2025 Paperzz