Root NationΝέαειδήσεις πληροφορικήςApple παρουσίασε το νέο της μοντέλο AI ReALM

Apple παρουσίασε το νέο της μοντέλο AI ReALM

-

Ερευνητές Apple έχουν αναπτύξει ένα σύστημα τεχνητής νοημοσύνης που ονομάζεται ReALM (Reference Resolution as Language Modeling), το οποίο στοχεύει να βελτιώσει ριζικά τον τρόπο με τον οποίο οι βοηθοί φωνής κατανοούν και ανταποκρίνονται σε εντολές.

Σε μια ερευνητική εργασία Apple περιγράφει ένα νέο πλαίσιο για τον τρόπο με τον οποίο τα μεγάλα γλωσσικά μοντέλα αντιμετωπίζουν το πρόβλημα της ανάλυσης αναφοράς, το οποίο περιλαμβάνει την αποκρυπτογράφηση διφορούμενων αναφορών σε αντικείμενα στην οθόνη, καθώς και την κατανόηση του περιβάλλοντος συνομιλίας και φόντου. Ως αποτέλεσμα, το ReALM μπορεί να οδηγήσει σε μια πιο διαισθητική και φυσική αλληλεπίδραση με συσκευές.

Apple

Η αναγνώριση αναφοράς είναι ένα σημαντικό μέρος της κατανόησης της φυσικής γλώσσας, επιτρέποντας στους χρήστες να χρησιμοποιούν αντωνυμίες και άλλες έμμεσες αναφορές στη συνομιλία χωρίς σύγχυση. Για τους ψηφιακούς βοηθούς, αυτή η ικανότητα ήταν ιστορικά μια σημαντική πρόκληση, περιορισμένη από την ανάγκη ερμηνείας ενός ευρέος φάσματος λεκτικών σημάτων και οπτικών πληροφοριών. Το σύστημα ReALM από Apple στοχεύει να λύσει αυτό το πρόβλημα μετατρέποντας τη σύνθετη διαδικασία της αναγνώρισης αναφοράς σε μια καθαρή εργασία μοντελοποίησης γλώσσας. Με αυτόν τον τρόπο, μπορεί να κατανοήσει τις αναφορές στα οπτικά στοιχεία που εμφανίζονται στην οθόνη και να ενσωματώσει αυτή την κατανόηση στη ροή συνομιλίας.

Το ReALM αναδομεί την οπτική δομή της οθόνης χρησιμοποιώντας αναπαραστάσεις κειμένου. Αυτό περιλαμβάνει την ανάλυση αντικειμένων οθόνης και την τακτοποίησή τους για τη δημιουργία μιας μορφής κειμένου που αντικατοπτρίζει το περιεχόμενο και τη δομή της οθόνης. Ερευνητές Apple διαπίστωσε ότι αυτή η στρατηγική, σε συνδυασμό με τον ειδικό συντονισμό των μοντέλων γλώσσας για προβλήματα ανάλυσης συγκριτικής αξιολόγησης, ξεπερνά σημαντικά τις παραδοσιακές μεθόδους, συμπεριλαμβανομένων των δυνατοτήτων GPT-4 του OpenAI.

Apple

Το ReALM μπορεί να επιτρέψει στους χρήστες να αλληλεπιδρούν πολύ πιο αποτελεσματικά με τους ψηφιακούς βοηθούς με βάση αυτό που εμφανίζεται επί του παρόντος στην οθόνη, χωρίς να χρειάζονται ακριβείς, λεπτομερείς οδηγίες. Αυτό θα μπορούσε να κάνει τους φωνητικούς βοηθούς πολύ πιο χρήσιμους σε διάφορες καταστάσεις, όπως να βοηθούν τους οδηγούς να πλοηγούνται σε συστήματα ψυχαγωγίας κατά την οδήγηση ή να βοηθούν χρήστες με αναπηρίες παρέχοντας ευκολότερα και ακριβέστερα μέσα έμμεσης αλληλεπίδρασης.

Apple έχει ήδη δημοσιεύσει αρκετές ερευνητικές εργασίες στον τομέα της ΑΙ. Τον περασμένο μήνα, η εταιρεία παρουσίασε μια νέα μέθοδο για την εκμάθηση μεγάλων μοντέλων γλώσσας που ενσωματώνει απρόσκοπτα τόσο κειμενικές όσο και οπτικές πληροφορίες. Αναμένεται ότι Apple θα παρουσιάσει μια σειρά από χαρακτηριστικά AI στο συνέδριο WWDC τον Ιούνιο.

Διαβάστε επίσης:

ΠηγήMacrumors
Εγγραφείτε
Ειδοποίηση για
επισκέπτης

0 Σχόλια
Ενσωματωμένες κριτικές
Δείτε όλα τα σχόλια
Εγγραφείτε για ενημερώσεις