Αντικείμενο της παρούσας μεταπτυχιακής εργασίας αποτελεί
η διερεύνηση των δυνατοτήτων της βαθιάς μάθησης στη
μηχανική.
Η βαθιά μάθηση αποτελεί μια
συναρπαστική παραλλαγή της μηχανικής μάθησης και έχει
εφαρμοστεί με μεγάλη επιτυχία σε πολλά πεδία της
επιστήμης όπως είναι η τεχνητή όραση, η αναγνώριση
ομιλίας, η επεξεργασία ξένων γλωσσών, η μουσική
αναγνώριση, η εφαρμογή διάφορων φίλτρων σε κοινωνικά
δίκτυα κλπ. Τα περισσότερα μοντέρνα μοντέλα βαθιάς
μάθησης βασίζονται στα τεχνητά νευρωνικά δίκτυα. Στην
παρούσα εργασία παρουσιάζονται τα πιο δημοφιλή νευρωνικά
δίκτυα, τα οποία περιλαμβάνουν τα εμπρόσθια
τροφοδοτούμενα νευρωνικά δίκτυα(
feedforward
neural
networks) ,
συνελικτικά νευρωνικά δίκτυα (convolutional
neural
networks) και τα επαναλαμβανόμενα νευρωνικά
δίκτυα (recurrent
neural
networks). Αυτού του είδους οι προσεγγίσεις
εφαρμόστηκαν σε συνήθη προβλήματα μηχανικής μάθησης,
όπως ταξινόμησης και παλινδρόμησης, χρησιμοποιώντας
βιβλιοθήκες «Python»
όπως την «Keras»
για να κατασκευάσουμε, εκπαιδεύσουμε και ελέγξουμε
διάφορα μοντέλα. Στο πρώτο κεφάλαιο, παρουσιάζονται οι
βασικές αρχές της μηχανικής μάθησης, συμπεριλαμβανομένων
των συναρτήσεων απώλειας, της βελτιστοποίησης βασισμένης
στην ελαχιστοποίηση κλίσης και της οπισθοδιάδοσης. Στο
τέλος του κεφαλαίου γίνεται μετάβαση από
την μηχανική μάθηση στην βαθιά μάθηση με την
εισαγωγή του ποιο αντιπροσωπευτικού νευρωνικού δικτύου,
του εμπρόσθια τροφοδοτούμενου
νευρωνικού δικτύου.
Στο 2ο κεφάλαιο
παρουσιάζονται τα συνελικτικά νευρωνικά δίκτυα, μία
κατηγορία νευρωνικών δικτύων με εντυπωσιακά αποτελέσματα
σε εργασίες ταξινόμησης όπως είναι η αναγνώριση εικόνων.
Στη
συνέχεια συζητήθηκαν τα επαναλαμβανόμενα νευρωνικά
δίκτυα στο 3ο κεφάλαιο, τα οποία βελτιώνουν
τα εμπρόσθια τροφοδοτούμενα νευρωνικά δίκτυα με την
προσθήκη επανατροφοδότησης και είναι από τις ποιο
δημοφιλείς προσεγγίσεις σε προβλήματα παλινδρόμησης.
Στη συνέχεια
στο κεφάλαιο 4 παρουσιάζονται τρόποι για την
αξιολόγηση των επιδόσεων των μοντέλων και την
ελαχιστοποίηση του λάθους γενίκευσης, το οποίο είναι η
απώλεια του μοντέλου σε άγνωστα προηγουμένως δεδομένα.
Τέλος, στο κεφάλαιο 5 παρουσιάζεται
η διαδικασία προετοιμασίας δεδομένων και στο 6ο
κεφάλαιο κατασκευάζονται και εκπαιδεύονται μοντέλα με
χρήση βιβλιοθηκών «Python»
, κυρίως της βιβλιοθήκης «Keras»,
για την αντιμετώπιση διαφόρων προβλημάτων
ταξινόμησης και παλινδρόμησης.