Η τεχνολογίες τεχνητής νοημοσύνης εξελίσσεται συνεχώς. Μπορεί πολλοί άνθρωποι χρησιμοποιούν AI για να ολοκληρώνουν τις εργασίες τους πιο εύκολα, αυτή η τεχνολογία μπορεί να προσφέρει πολύ περισσότερα. Η Google προσπαθεί εδώ και χρόνια να φτάσει τα όρια της τεχνητής νοημοσύνης και να ξεκλειδώσει όλο το φάσμα των δυνατοτήτων της. Η τελευταία εξέλιξη αυτής της προσπάθειας είναι το AudioPaLM. Πρόκειται για ένα νέο γλωσσικό μοντέλο που μπορεί να ακούσει, να μιλήσει, και να μεταφράσει με πρωτοφανή ακρίβεια.

Πρόκειται για μια πολυτροπική αρχιτεκτονική που συνδυάζει τα πλεονεκτήματα δύο υφιστάμενων μοντέλων, των PaLM-2 και AudioLM. Το PaLM-2 είναι ένα γλωσσικό μοντέλο βασισμένο σε κείμενο που είναι καλό στην κατανόηση της γλωσσικής γνώσης συγκεκριμένων κειμένων. Από την άλλη, το AudioLM είναι εξαιρετικό στη διατήρηση παραγλωσσικών πληροφοριών όπως η ταυτότητα του ομιλητή και ο τόνος.

Συνδυάζοντας αυτά τα δύο μοντέλα, το AudioPaLM εκμεταλλεύεται τη γλωσσική εμπειρογνωμοσύνη του PaLM-2 και τη διατήρηση των παραγλωσσικών πληροφοριών του AudioLM, οδηγώντας σε μια πιο εμπεριστατωμένη κατανόηση και δημιουργία τόσο κειμένου όσο και ομιλίας.

Αυτό το γλωσσικό μοντέλο κάνει χρήση ενός κοινού λεξιλογίου που μπορεί να αναπαραστήσει τόσο ομιλία όσο και κείμενο, με έναν περιορισμένο αριθμό διακριτών tokens. Αυτό επιτρέπει την ενοποίηση εργασιών όπως η αναγνώριση ομιλίας, η σύνθεση κειμένου από ομιλία, και η μετάφραση ομιλίας σε ομιλία, και τη δημιουργία μιας ενιαίας αρχιτεκτονικής και διαδικασίας εκπαίδευσης.

Το AudioPaLM έχει αποδειχθεί ότι ξεπερνά τα υπάρχοντα συστήματα στη μετάφραση ομιλίας. Επιπλέον, μπορεί να εκτελέσει μετάφραση ομιλίας σε κείμενο για γλωσσικούς συνδυασμούς που δεν έχει συναντήσει ποτέ πριν. Επίσης, μπορεί να μεταφέρει φωνές μεταξύ γλωσσών με βάση σύντομες προφορικές οδηγίες και μπορεί να συλλάβει και να αναπαράγει ξεχωριστές φωνές σε διαφορετικές γλώσσες.

Πηγή: MarktechPost.com

Αφήστε ένα Σχόλιο

Το e-mail σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Διαβάστε επίσης

New Decoy Dog Malware Toolkit Uncovered: Targeting Enterprise Networks

An analysis of over 70 billion DNS records has led to the discovery of a new sophisticated malware toolkit dubbed Decoy Dog targeting enterprise networks.

Pakistani Hackers Use Linux Malware Poseidon to Target Indian Government Agencies

The Pakistan-based advanced persistent threat (APT) actor known as Transparent Tribe used a two-factor authentication (2FA) tool used by Indian government agencies as a ruse to deliver a new Linux backdoor called Poseidon.

Οι hackers σκανάρουν για ευάλωτα συστήματα μέσα σε 15 λεπτά από την αποκάλυψη νέων ευπαθειών

Οι διαχειριστές συστημάτων φαίνεται πως έχουν πολύ λίγο χρόνο για να ενημερώσουν τα συστήματά τους και να τα προστατεύσουν από ευπάθειες ασφαλείας, καθώς μια νέα αναφορά δείχνει ότι οι κακόβουλοι hackers σαρώνουν για ευάλωτα συστήματα εντός 15 λεπτών από τη δημόσια αποκάλυψη νέων ευπαθειών (CVE).