Google: Το AI μοντέλο Gemini πλέον μπορεί να μετατρέψει φωτογραφίες σε βίντεο
Η «αλματώδης» πρόοδος των μοντέλων τεχνητής νοημοσύνης συνεχίζεται χωρίς καμία επιβράδυνση, με το μοντέλο AI της Google, Gemini, να έχει πλέον τη δυνατότητα να «ζωντανέψει» τις φωτογραφίες μας σε βίντεο.
Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο του Gemini AI τροφοδοτείται από το μοντέλο βίντεο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων, τα οποία συνοδεύονται από ήχο που παράγεται από την Τεχνητή Νοημοσύνη, συμπεριλαμβανομένων θορύβων παρασκηνίου, περιβαλλοντικών ήχων και ομιλίας.
Οι χρήστες του Gemini μπορούν να έχουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή «εργαλεία» στη γραμμή προτροπών, επιλέγοντας «βίντεο» και ανεβάζοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινείται. Μπορούν επίσης να συμπεριληφθούν ηχητικές περιγραφές για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, οι οποίες, σύμφωνα με τη Google, θα είναι «τέλεια συγχρονισμένες με τις εικόνες». Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 σε ανάλυση 720p και σε οριζόντια μορφή 16:9.
Η ενημέρωση για τα βίντεο Gemini είναι τώρα διαθέσιμη στους συνδρομητές Google AI Ultra και Pro «σε επιλεγμένες περιοχές», σύμφωνα με τη Google. Κυκλοφορεί στον ιστό από σήμερα και κατά τη διάρκεια της εβδομάδας στις κινητές συσκευές.
«Μπορείτε να γίνετε δημιουργικοί, ζωντανεύοντας καθημερινά αντικείμενα, ζωντανεύοντας τα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης», δήλωσε η Google. «Όλα τα παραγόμενα βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί με τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID».
Ένα παρόμοιο χαρακτηριστικό είναι ήδη διαθέσιμο στο Flow, το εργαλείο δημιουργικής κινηματογράφησης με τεχνητή νοημοσύνη που ξεκίνησε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανεύουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα ξεκινήσει επίσης σε «επιπλέον 75 χώρες» σήμερα, εκτός από την εξάπλωση της νέας λειτουργίας βίντεο του Gemini.
*Με πληροφορίες από The Verge