បច្ចុប្បន្នបច្ចេកវិទ្យា AI កំពុងតែមានការផ្ទុះខ្លាំងទាំងក្នុងស្រុកនិងក្រៅស្រុកជាពិសេសបច្ចេកវិទ្យា AI ដែលកំពុងល្បីនៅស្រុកខ្មែរនោះគឺ Chat GPT របស់ក្រុមហ៊ុន Open AI ដែលវាអាចធ្វើការឆ្លើយសំណួរនិងជួយធ្វើការយើងបានលឿនទាន់ពេលវេលា។ ហើយថ្មីៗនេះក្រុមហ៊ុន Microsoft ក៏បានបញ្ចេញបច្ចេកវិទ្យាថ្មីមួយទៀតគឺ VALL-E ដែលអាចចម្លងសំឡេងរបស់យើងបាន។
ដោយយោងទៅតាម ars technica បានឱ្យដឹងថា អ្នកស្រាវជ្រាវរបស់ក្រុមហ៊ុន Microsoft បានធ្វើការបញ្ចេញបច្ចេកវិទ្យា Text to speech ថ្មីដែលគេហៅថា VALL-E ដែលវាអាចចម្លងសំឡេងរបស់យើងយកទៅប្រើបានចេញពីសំឡេងដែលមានស្រាប់ត្រឹមតែ 3វិនាទីតែប៉ុណ្ណោះ បើទោះបីជាសំឡេងនោះនិយាយបែបណាក៏ដោយក៏វាអាចចម្លងបាននិងបញ្ជាឱ្យនិយាយអត្ថន័យផ្សេងក៏បានដែរ។
យ៉ាងណាមិញបច្ចេកវិទ្យា VALL-E នេះគឺជាការរួមបញ្ចូលគ្នាជាមួយនឹងបច្ចេកវិទ្យា EnCodec របស់ក្រុមហ៊ុន Meta ។ លើសពីនេះទៅទៀតគឺវាអាចវិភាគដឹងពីដំណើរក៏ដូចជាព័ត៌មាននៃសំឡេងរបស់យើង វាអាចសិក្សាដឹងថាសំឡេងរបស់យើង នៅពេលដែលនិយាយឃ្លាផ្សេងៗទៀតនឹងឮបែបណាថែមទៀតផង តាមរយៈសំឡេង 3វិនាទីដែលយើងដាក់ឱ្យវាស្តាប់។
លើសពីនេះទៅទៀត Microsoft បានធ្វើការបង្ហាត់ VALL-E ជាមួយនឹងបច្ចេកវិទ្យាផ្សេងៗទៀតរបស់ Meta ដោយក្នុងនោះវាបានផ្ទុកនូវសំឡេងជាភាសាអង់គ្លេសដែលមានរយៈពេលខ្ទង់ 60,000ម៉ោង រួមជាមួយនឹងអ្នកដែលនិយាយជាង 7,00 នាក់ផ្សេងៗគ្នាថែមទៀតផង ហើយសម្រាប់លទ្ធផល VALL-E បានធ្វើការចម្លងសំឡេងទាំងអស់នោះមកបានល្អដែលសឹងតែដូចគ្នាជាមួយនឹងសំឡេងពិតតែម្តង។
ហើយខាងក្រោមនេះគឺគំរូនៃការតេស្តសាកល្បងនូវបច្ចេកវិទ្យា VALL-E របស់ Microsoft ដោយបានធ្វើការប្រៀបធៀបជាមួយសំឡេងជាច្រើនប្រភេទរវាងសំឡេងពិតរបស់មនុស្សនិងចុងក្រោយចម្លងវាទៅ VALL-E តែម្តង។
VALL-E
អត្ថបទដោយ៖ រិន មករា