Root NationΝέαειδήσεις πληροφορικήςΔημιουργήθηκε AI που μετατρέπει μια εικόνα 2D σε τρισδιάστατο μοντέλο σε 3 δευτερόλεπτα

Δημιουργήθηκε AI που μετατρέπει μια εικόνα 2D σε τρισδιάστατο μοντέλο σε 3 δευτερόλεπτα

-

Ερευνητές από την Adobe και το Εθνικό Πανεπιστήμιο της Αυστραλίας ανέπτυξαν έναν αλγόριθμο που μετατρέπει δισδιάστατες εικόνες σε τρισδιάστατα μοντέλα σε μόλις 5 δευτερόλεπτα. Αυτή η ανακάλυψη υπόσχεται να φέρει επανάσταση στη δημιουργία περιεχομένου στον σχεδιασμό και την ψυχαγωγία, αν και προσέξτε πιθανά προβλήματα με θολή υφή και παραβίαση πνευματικών δικαιωμάτων.

Ο νέος αλγόριθμος, που ονομάζεται Large Reconstruction Model (LRM), έχει γίνει μια σημαντική πρόοδος στην ταχεία δημιουργία τρισδιάστατων μοντέλων που βασίζονται σε μια ενιαία εικόνα. Ο αλγόριθμος, εκπαιδευμένος σε ένα μεγάλο σύνολο δεδομένων περίπου ενός εκατομμυρίου τρισδιάστατων αντικειμένων που είναι διαθέσιμα στις βάσεις δεδομένων Objaverse και MVImgNet, έδειξε εξαιρετική ικανότητα γενίκευσης όταν εργάζεστε με μια ποικιλία εικόνων για τη δημιουργία τρισδιάστατου περιεχομένου.

Σε αντίθεση με τα προηγούμενα μοντέλα που εκπαιδεύτηκαν σε περιορισμένα σύνολα δεδομένων με εστίαση σε μία κατηγορία εικόνων, το LRM χρησιμοποιεί μια μετασχηματιστική αρχιτεκτονική που έχει γίνει η βάση για πολλές εξελίξεις στη βαθιά μάθηση, με 500 εκατομμύρια παραμέτρους. Αυτό επιτρέπει στο μοντέλο AI να λειτουργεί αποτελεσματικά με μια ποικιλία τύπων εικόνων, συμπεριλαμβανομένων φωτογραφιών πραγματικού κόσμου και οπτικών κολάζ που δημιουργούνται από άλλες υπηρεσίες AI, όπως το DALL-E και το Stable Diffusion.

Δημιουργήθηκε AI που μετατρέπει μια εικόνα 2D σε τρισδιάστατο μοντέλο σε 3 δευτερόλεπτα

Ο Yitzong Hong, επικεφαλής συγγραφέας της μελέτης, τόνισε ότι το LRM είναι μια σημαντική ανακάλυψη στον τομέα της XNUMXD ανακατασκευής. Ο αλγόριθμος είναι σε θέση να αναπαράγει λεπτομερή γεωμετρία και σύνθετες υφές, για παράδειγμα, την υφή του ξύλου, διατηρώντας παράλληλα την ποιότητα και την ακρίβεια.

Η εφαρμογή του LRM μπορεί να γίνει πραγματικά μαζική, από το σχεδιασμό και την ψυχαγωγία μέχρι τη βιομηχανία τυχερών παιχνιδιών. Για τους σχεδιαστές και τους 3D καλλιτέχνες, αυτό σημαίνει επιτάχυνση της διαδικασίας δημιουργίας μοντέλων, η οποία είναι ιδιαίτερα σημαντική κατά την ανάπτυξη βιντεοπαιχνιδιών και κινούμενων εικόνων. Επιπλέον, η δυνατότητα χρήσης LRM από απλούς χρήστες υπόσχεται να καταστήσει την τρισδιάστατη μοντελοποίηση προνόμιο όχι μόνο επαγγελματιών. Τώρα θα είναι δυνατή η δημιουργία λεπτομερών μοντέλων ακόμη και από φωτογραφίες που τραβήχτηκαν σε smartphone.

Ωστόσο, το LRM έχει τους περιορισμούς του, όπως το θάμπωμα των υφών σε κρυφές περιοχές της εικόνας. Αξίζει επίσης να εξεταστούν θέματα πνευματικών δικαιωμάτων, ειδικά στο πλαίσιο της χρήσης εικόνων που δημιουργούνται από άλλες υπηρεσίες τεχνητής νοημοσύνης. Για να επιδείξουν τις δυνατότητες του LRM, οι ερευνητές της Adobe δημιούργησαν σελίδα με επιδείξεις βίντεο και διαδραστικά τρισδιάστατα μοντέλα. Αυτό υπογραμμίζει τον αυξανόμενο ρόλο της τεχνητής νοημοσύνης στον σημερινό κόσμο και τον πιθανό αντίκτυπό της στο μέλλον των δημιουργικών βιομηχανιών.

Διαβάστε επίσης:

Πηγήtechspot
Εγγραφείτε
Ειδοποίηση για
επισκέπτης

0 Σχόλια
Ενσωματωμένες κριτικές
Δείτε όλα τα σχόλια
Εγγραφείτε για ενημερώσεις