Root NationΝέαειδήσεις πληροφορικήςΤο Figure AI έδειξε τις νέες δεξιότητες του ανθρωποειδούς ρομπότ AI

Το Figure AI έδειξε τις νέες δεξιότητες του ανθρωποειδούς ρομπότ AI

-

Η ανάπτυξη των ανθρωποειδών ρομπότ έχει προχωρήσει με αργούς ρυθμούς για το μεγαλύτερο μέρος των δύο δεκαετιών, αλλά πρόσφατα βλέπουμε όλο και περισσότερες ανακαλύψεις σε αυτόν τον τομέα. Όπως γράψαμε πρόσφατα, ένα ρομπότ AI παρουσιάστηκε στο MWC 2024 Αμερικήκαι μια άλλη εξέλιξη, Unitree H1, έσπασε το ρεκόρ ταχύτητας μεταξύ ανθρωποειδών ρομπότ. Και τώρα ένα θεαματικό αποτέλεσμα της συνεργασίας μεταξύ των εταιρειών Figure AI και OpenAI εμφανίστηκε στο Διαδίκτυο - ένα εκπληκτικό βίντεο ενός ανθρωποειδούς ρομπότ που μπορεί πλέον να συνομιλεί με ανθρώπους.

Το Figure AI και το OpenAI παρουσίασαν ένα νέο ανθρωποειδές ρομπότ με AI

Η Startup Figure AI κυκλοφόρησε ένα βίντεο που δείχνει το ρομπότ Figure 01 να δουλεύει με το νέο Visual Language Model (VLM). Σε αυτό, το Σχήμα 01 στέκεται σε ένα τραπέζι στο οποίο υπάρχει ένα πιάτο, ένα μήλο και ένα φλιτζάνι. Υπάρχει ένα στεγνωτήριο στα αριστερά. Και στην ερώτηση ενός ανθρώπου, τι βλέπει το ρομπότ μπροστά του, απαντά περιγράφοντας αναλυτικά όλα όσα βρίσκονται στο τραπέζι.

Και μετά ο άντρας ρωτά αν μπορεί να φάει κάτι, και το ρομπότ απαντά: «Φυσικά», και μετά με μια επιδέξια ομαλή κίνηση παίρνει το μήλο και το δίνει στον άντρα. Μετά από αυτό ακολουθεί μια άλλη εκπληκτική επίδειξη - ένας άνδρας ρίχνει τσαλακωμένα σκουπίδια από ένα καλάθι μπροστά από το Σχήμα 01 και ζητά από το ρομπότ να εξηγήσει γιατί το έκανε αυτό και ταυτόχρονα μαζεύει τα σκουπίδια στο καλάθι. Και εξηγεί τη «σκέψη» του ενώ ξαναβάζει το χαρτί στα σκουπίδια. «Σου έδωσα λοιπόν ένα μήλο γιατί είναι το μόνο φαγώσιμο που θα μπορούσα να σου δώσω από το τραπέζι», είπε το ρομπότ.

Οι εκπρόσωποι της εταιρείας εξήγησαν ότι το Σχήμα 01 χρησιμοποιεί ένα προεκπαιδευμένο πολυτροπικό μοντέλο OpenAI, VLM, για την κατανόηση εικόνων και κειμένων και βασίζεται σε φωνητικές προτροπές για τη δημιουργία των απαντήσεών του. Αυτό διαφέρει, ας πούμε, από το GPT-4 του OpenAI, το οποίο εστιάζει σε γραπτές προτροπές.

Χρησιμοποιεί επίσης αυτό που η εταιρεία αποκαλεί «μαθημένους χειροκίνητους χειρισμούς χαμηλού επιπέδου». Το σύστημα συντονίζει την ακριβή βαθμονόμηση εικόνας (μέχρι το επίπεδο pixel) με το νευρωνικό του δίκτυο για τον έλεγχο της κίνησης. «Αυτά τα δίκτυα λαμβάνουν εικόνες στα 10 Hz και δημιουργούν ενέργειες 24-DOF (στάσεις καρπού και γωνίες αρθρώσεων των δακτύλων) στα 200 Hz», ανέφερε η Figure AI σε μια δήλωση.

Η εταιρεία ισχυρίζεται ότι κάθε συμπεριφορά στο βίντεο βασίζεται στην εκμάθηση του συστήματος, επομένως κανείς από τα παρασκήνια δεν τραβάει τα νήματα του Figure 01. Φυσικά, υπάρχει μια απόχρωση - δεν είναι γνωστό πόσες φορές το ρομπότ πέρασε αυτή τη διαδικασία. Ίσως ήταν η εκατοστή φορά, κάτι που εξηγεί τις ακριβείς κινήσεις του. Αλλά σε κάθε περίπτωση, αυτό το επίτευγμα φαίνεται θεαματικό και λίγο φανταστικό.

Διαβάστε επίσης:

Πηγήtechradar
Εγγραφείτε
Ειδοποίηση για
επισκέπτης

0 Σχόλια
Ενσωματωμένες κριτικές
Δείτε όλα τα σχόλια
Εγγραφείτε για ενημερώσεις