Root NationΝέαειδήσεις πληροφορικήςΣτο Τόκιο παρουσιάστηκαν οι επιτυχίες του ανθρωποειδούς ρομπότ Alter3 που βασίζεται στο GPT-4

Στο Τόκιο παρουσιάστηκαν οι επιτυχίες του ανθρωποειδούς ρομπότ Alter3 που βασίζεται στο GPT-4

-

Μια ομάδα στο Πανεπιστήμιο του Τόκιο παρουσίασε το Alter3, ένα ανθρωποειδές ρομπότ που μπορεί να εκτελεί κινήσεις χρησιμοποιώντας το GPT-4 Large Language Model (LLM). Το Alter3 χρησιμοποιεί το πιο πρόσφατο εργαλείο Ανοίξτε το AI να παίρνετε δυναμικά διαφορετικές πόζες, από πόζα selfie έως είδωλα, όλα αυτά χωρίς την ανάγκη προ-προγραμματισμένων εγγραφών στη βάση δεδομένων.

«Η απόκριση του Alter3 στο περιεχόμενο συνομιλίας χρησιμοποιώντας εκφράσεις προσώπου και χειρονομίες είναι μια σημαντική πρόοδος στην ανθρωποειδή ρομποτική που προσαρμόζεται εύκολα σε άλλα Android με ελάχιστες αλλαγές», είπαν οι ερευνητές.

Alter3

Στον τομέα της ολοκλήρωσης LLM με ρομπότ, η εστίαση είναι στη βελτίωση της βασικής επικοινωνίας και στη μοντελοποίηση ρεαλιστικών απαντήσεων. Οι ερευνητές εμβαθύνουν επίσης στις δυνατότητες του LLM να επιτρέπουν στα ρομπότ να κατανοούν και να εκτελούν πολύπλοκες οδηγίες, αυξάνοντας έτσι τη λειτουργικότητά τους.

Παραδοσιακά, διαχείριση χαμηλού επιπέδου ρομπότ είναι συνδεδεμένη με το υλικό και βρίσκεται εκτός της αρμοδιότητας των εταιρειών LLM. Αυτό δημιουργεί δυσκολίες για την άμεση διαχείριση εργασιών που βασίζονται στο LLM. Επιλύοντας αυτό το πρόβλημα, η ιαπωνική ομάδα έχει αναπτύξει μια μέθοδο μετατροπής εκφράσεων ανθρώπινων κινήσεων σε κώδικα κατανοητό για το Android. Αυτό σημαίνει ότι το ρομπότ μπορεί να δημιουργήσει ανεξάρτητα ακολουθίες ενεργειών με την πάροδο του χρόνου χωρίς να χρειάζεται οι προγραμματιστές να προγραμματίσουν μεμονωμένα κάθε μέρος του σώματος.

Κατά τη διάρκεια της αλληλεπίδρασης, ένα άτομο μπορεί να δώσει εντολές στο Alter3 όπως "Take a selfie with your iPhone". Στη συνέχεια, το ρομπότ ξεκινά μια σειρά από αιτήματα στο GPT-4 για να λάβει καθοδήγηση σχετικά με τα απαραίτητα βήματα. GPT-4 θα το μεταφράσει σε κώδικα Python που επιτρέπει στην εργασία να «κατανοήσει» και να εκτελέσει τις απαραίτητες κινήσεις. Αυτή η καινοτομία επιτρέπει στο Alter3 να κινεί το πάνω μέρος του σώματός του, ενώ το κάτω μέρος του σώματός του παραμένει ακίνητο, στερεωμένο στη βάση.

Το Alter3 είναι η τρίτη επανάληψη στη σειρά ανθρωποειδών ρομπότ του Alter από το 2016, με 43 ενεργοποιητές υπεύθυνους για τις εκφράσεις του προσώπου και τις κινήσεις των άκρων που τροφοδοτούνται από πεπιεσμένο αέρα. Αυτή η διαμόρφωση παρέχει ένα ευρύ φάσμα εκφραστικών χειρονομιών. Το ρομπότ δεν μπορεί να περπατήσει, αλλά μπορεί να μιμηθεί τυπικές κινήσεις περπατήματος και τρεξίματος.

Το Alter3 έδειξε επίσης την ικανότητα να αντιγράφει ανθρώπινες στάσεις χρησιμοποιώντας την κάμερα και το πλαίσιο OpenPose. Το ρομπότ προσαρμόζει τις αρθρώσεις του στις παρατηρούμενες στάσεις και αποθηκεύει επιτυχημένες απομιμήσεις για μελλοντική χρήση. Η αλληλεπίδραση με έναν άνθρωπο οδήγησε σε πιο ποικίλες στάσεις, υποστηρίζοντας την ιδέα ότι διαφορετικές κινήσεις προέρχονται από τη μίμηση του ανθρώπου, παρόμοια με το πώς μαθαίνουν τα νεογέννητα μέσω της μίμησης.

Πριν από το LLM, οι ερευνητές έπρεπε να ελέγχουν προσεκτικά και τους 43 ενεργοποιητές για να αναδημιουργήσουν τη στάση ενός ατόμου ή να προσομοιώσουν μια συμπεριφορά, όπως το σερβίρισμα τσαγιού ή το παιχνίδι σκάκι. Αυτό απαιτούσε πολλές χειροκίνητες ρυθμίσεις, αλλά Όλα συμπεριλαμβάνονται βοήθησε στην απελευθέρωση της ομάδας από αυτή τη ρουτίνα. «Αναμένουμε από το Alter3 να συμμετάσχει αποτελεσματικά σε διάλογο εμφανίζοντας εκφράσεις προσώπου και χειρονομίες που σχετίζονται με το πλαίσιο. Έδειξε την ικανότητα να αντικατοπτρίζει τα συναισθήματα, για παράδειγμα, να δείχνει λύπη ή ευτυχία ως απάντηση, μοιράζοντας έτσι συναισθήματα μαζί μας», λένε οι ερευνητές.

Διαβάστε επίσης:

Εγγραφείτε
Ειδοποίηση για
επισκέπτης

0 Σχόλια
Ενσωματωμένες κριτικές
Δείτε όλα τα σχόλια
Εγγραφείτε για ενημερώσεις