Πέμπτη 28 Μαρτίου 2024 -

«Άβαταρ» τεχνητής νοημοσύνης διαβάζουν βιβλία με τις φωνές των συγγραφέων τους



Η κινεζική μηχανή αναζήτησης Sogou δημιουργεί «άβαταρ» τεχνητής νοημοσύνης που διαβάζουν δημοφιλή βιβλία με τις φωνές των συγγραφέων τους, σύμφωνα με το BBC.

H Sogou ανακοίνωσε αληθοφανή «άβαταρ» των Κινέζων συγγραφέων Γιουέ Γκουάν και Μπου Ξν Τιάν Σανγκ Ντιάο Ξιάν Μπινγκ, τα οποία φτιάχτηκαν με βάση βίντεό τους, στο πλαίσιο της συνδιάσκεψης China Online Literature+.

 
 

Πέρυσι, η Sogou είχε παρουσιάσει δύο εκφωνητές ειδήσεων τεχνητής νοημοσύνης, που χρησιμοποιούνται από το κρατικό πρακτορείο Xinhua. Όπως σημειώνει το BBC, η νέα αυτή κίνηση φαίνεται να αντανανακλά την άνοδο της δημοτικότητας των audiobooks στην Κίνα, ακολουθώντας την αντίστοιχη τάση στη Δύση.

Το κινεζικό think tank iiMedia εκτιμά πως η σχετική αγορά θα υπερδιπλασιαστεί μεταξύ του 2016 και του 2020, φτάνοντας τα 7,8 δισ. γουάν (περίπου 100 εκατ. ευρώ) τον χρόνο. Πλέον η διαδικασία μετατροπής κειμένου σε φωνή είναι αρκετά εύκολη, επιτρέποντας την ταχεία δημιουργία ηχητικών εκδόσεων (audiobooks) βιβλίων, τα οποία διαβάζονται με ψηφιοποιημένες, συνθετικές φωνές. Ωστόσο, οι περισσότεροι προτιμούν τα audiobooks με αφηγητές τους ίδιους τους συγγραφείς ή διάσημα πρόσωπα- και πλέον οι εξελίξεις στο machine learning και τις τεχνολογίες speech-to-text μπορούν να καθιστούν τις συνθετικές φωνές πιο αληθοφανείς.