การแปลงเสียงพูดให้เป็นข้อความ – ธุรกิจสตาร์ทอัพที่มีศักยภาพ

Thu Trang, Lê Phương
Chia sẻ
(VOVWORLD) - การพัฒนาเทคโนโลยี 4.0 ทำให้ผลิตภัณฑ์และเทคโนโลยีต่างๆเป็นที่รู้จักอย่างกว้างขวาง รวมถึงแอพพลิเคชั่นแปลงเสียงพูดให้เป็นข้อความ ซึ่งถูกใช้บันทึกเสียงพูดเป็นข้อความในการประชุมต่างๆ สนับสนุนการรายงานข่าวของผู้สื่อข่าว การบันทึกการตรวจสถานที่เกิดเหตุและช่วยเหลือคนพิการ โดยแอพพลิเคชั่น Origin Note ที่ประดิษฐ์คิดค้นโดย วิศวกรรุ่นใหม่เวียดนามคือหนึ่งในผลิตภัณฑ์ดังกล่าว
การแปลงเสียงพูดให้เป็นข้อความ –  ธุรกิจสตาร์ทอัพที่มีศักยภาพ - ảnh 1แอพพลิเคชั่น Origin-STT ของบริษัท VAIS ได้รับรางวัลที่หนึ่งประเภทเทคโนโลยีสารสนเทศในการประกวดNhân tài Đất Việtปี 2019  (vietnamnet.vn)

เว็บไซต์ List25ได้ประเมินว่า ภาษาเวียดนามเป็นหนึ่งในภาษาที่เรียนยากที่สุดในโลก โดยเฉพาะการออกเสียง ดังนั้น การพัฒนาซอฟต์แวร์เพื่อแปลงเสียงพูดภาษาเวียดนามให้เป็นข้อความเป็นสิ่งที่ทำได้ไม่ง่ายนักแม้กระทั่งสำหรับเครือบริษัทเทคโนโลยีชั้นนำระดับโลก เช่น Google, Microsoft, และApple ในช่วงที่เพิ่งเข้ามาลงทุนในเวียดนาม แต่บริษัทระบบปัญญาประดิษฐ์เวียดนามจำกัด หรือ VAIS ภายใต้การบริหารของวิศวกรรุ่นใหม่ได้ทำธุรกิจสตาร์ทอัพ โดยใช้เวลา 2 ปีเพื่อพัฒนาซอฟต์แวร์ Origin-STT ที่สนับสนุนการแปลงเสียงพูดให้เป็นข้อความด้วยความแม่นยำเฉลี่ยเกือบร้อยละ94 เพราะมีการจดจำคำศัพท์ 7พันคำรวมทั้งสำเนียงทั้งของภาคเหนือ ภาคกลางและภาคใต้ ซึ่งการใช้แอพพลิเคชั่น Origin Note ช่วยประหยัดเวลาในการพิมพ์งานในโปรแกรม Microsoft Word มากถึง10 เท่า สิ่งที่น่าประทับใจคือสามารถพิมพ์ตัวพิมพ์ใหญ่สำหรับชื่อบุคคล สถานที่และการพิมพ์วันเดือนปีได้อย่างถูกต้อง นาย ห่าแองต๊วน ผู้อำนวยการบริษัทหุ้นส่วนการประชาสัมพันธ์และเทคโนโลยี Vinalink และซีอีโอของระบบนิเวศสตาร์ทอัพ EMI ให้ข้อสังเกตว่า“ผมได้ลองใช้แอพพลิเคชั่น Origin Note แล้วเห็นว่า มีความแม่นยำมากถึงร้อยละ99 โดยผมได้ลองพูดในแบบต่างๆ เช่น ผู้สื่อข่าวและคนทั่วไป ซึ่ง Origin Note ก็สามารถแยกเสียงผู้พูดได้ ซึ่งแสดงให้เห็นว่า แอพพลิเคชั่นนี้สามารถใช้งานได้ดีกว่าแอพพลิเคชั่นของต่างชาติ”

ความต้องการซอฟต์แวร์แปลงเสียงพูดให้เป็นข้อความในการประชุมต่างๆทำให้บริษัทระบบปัญญาประดิษฐ์เวียดนามจำกัด หรือ VAIS เกิดแนวคิดในการวิจัยและพัฒนาแอพพลิเคชั่น Origin-STT ที่แปลงเสียงพูดภาษาเวียดนามให้เป็นข้อความ โดยผู้ใช้งานสามารถอัดเสียงในการประชุมแล้วถอดเสียงในไฟล์ให้เป็นตัวอักษร อีกทั้งสามารถเก็บและค้นหาไฟล์ต่างๆได้อย่างสะดวก

เมื่อปี 2018 แอพพลิเคชั่น Origin-STT ของบริษัท VAIS ได้รับรางวัลที่หนึ่งประเภทเทคโนโลยีรู้จำเสียงพูดในการประกวดภาษาเวียดนามและเทคโนโลยีเสียงปี 2019 ซึ่งเป็นความสำเร็จของบริษัทใหม่ด้านปัญญาประดิษฐ์และเทคโนโลยีเสียงในเวียดนาม ต่อมาเมื่อต้นปี 2019 บริษัท VAIS ได้แนะนำเทคโนโลยีรู้จำเสียงพูดในการประชุมของหน่วยงานส่วนกลาง เช่น สำนักงานคณะกรรมการกลางพรรคและสำนักงานสภาแห่งชาติ โดยเฉพาะการประยุกต์ใช้แอพพลิเคชั่น Origin-STT เพื่อแปลงเสียงพูดให้เป็นข้อความในเนื้อหาการตั้งและตอบกระทู้ถามในการประชุมสภาแห่งชาติครั้งที่ 8 สมัยที่ 14 ที่มีความแม่นยำสูง นาย เหงวียนกวางแอง วิศวกรที่พัฒนาซอฟต์แวร์ Origin Note ได้เผยว่า“พวกเราใช้เทคโนโลยีปัญญาประดิษฐ์ หรือ  AI ในการพัฒนาแอพพลิเคชั่นแปลงเสียงพูดให้เป็นข้อความที่ใช้งานได้ในหลายแพลตฟอร์ม เช่น Cloud, Web app, Mobi app … สำหรับการรักษาความปลอดภัยด้านข้อมูลขณะออนไลน์ มีการจัดการรหัสผ่านข้อความและไฟล์เสียงให้แก่ผู้ใช้งานเพื่อป้องกันการถูกขโมยข้อมูลส่วนตัว”

ปัจจุบัน บริษัท VAIS กำลังวางแผนประชาสัมพันธ์ให้แอพพลิเคชั่น Origin Note เป็นที่รู้จักในหมู่ประชาชนมากขึ้นเพื่อมีส่วนร่วมประยุกต์ใช้เทคโนโลยี AI ในการดำเนินชีวิตประจำวัน นาย หว่างมิงแถ่ง ซีอีโอของบริษัท VAIS ได้เผยว่า“พวกเรากำลังปรับปรุงแอพพลิเคชั่น Origin Note ให้สอดคล้องกับการใช้งานต่างๆ โดยนอกจากแอพพลิเคชั่นแปลงเสียงพูดให้เป็นข้อความในการประชุมและบทสัมภาษณ์ต่างๆสำหรับผู้สื่อข่าวและผู้ที่ทำงานในออฟฟิศแล้ว พวกเราจะพัฒนาแอพพลิเคชั่นสำหรับสถานประกอบการและมีแผนเปิดตัวแอพพลิเคชั่นที่ใช้ในระบบรับโทรศัพท์อัตโนมัติและแอพพลิเคชั่นที่สนับสนุนการเรียนการสอน”

คำติชม