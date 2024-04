Η Microsoft επέλεξε την παγκοσμίως γνωστή εικόνα της Μόνα Λίζα του Λεονάρντο ντα Βίντσι για να δείξει τις δυνατότητες του VASA-1, το νέο της εργαλείο τεχνητής νοημοσύνης. Το εργαλείο αυτό έχει την ικανότητα να συνδυάζει μια φωτογραφία προσώπου με ηχητικό υλικό από άλλο άτομο, δημιουργώντας ένα βίντεο όπου το πρόσωπο στην εικόνα φαίνεται να τραγουδάει ρεαλιστικά.

Για τη δημιουργία ενός τέτοιου βίντεο με τη Μόνα Λίζα, οι ερευνητές της Microsoft χρησιμοποίησαν τη φωνή της Άνν Χάθαγουεϊ που ερμήνευε το τραγούδι Paparazzi με έναν χιουμοριστικό τρόπο. Το VASA-1 έχει σχεδιαστεί για να αναλύει διάφορες κινήσεις του προσώπου, όπως τα χείλη, τις εκφράσεις, το βλέμμα και το άνοιγμα και κλείσιμο των ματιών.

Γενικότερα, παρατηρούμε μια αγάπη στη Μόνα Λίζα ειδικά όταν πρόκειται να την “πειράξουν” με την τεχνητή νοημοσύνη. Δεν είναι αυτή η πρώτη φορά που δοκιμάζουν την τεχνολογία στην ξακουστή Τζοκόντα!

Παρόλο που το εργαλείο αυτό έγινε γνωστό, η Microsoft δεν προγραμματίζει να το κυκλοφορήσει ακόμα στο ευρύ κοινό.

Microsoft just dropped VASA-1.

This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba

10 wild examples:

1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD

