จนถึงตอนนี้ใน ชุดบล็อก SeaX ของเรา เราได้ให้ภาพรวมกว้างๆ ของผลิตภัณฑ์เรือธงของ Seasalt.ai: SeaX เรายังได้พูดคุยถึงสองคุณสมบัติหลักที่ทำให้ SeaX แตกต่างจากศูนย์บริการทางโทรศัพท์แบบดั้งเดิม: ประการแรก SeaX เป็นแบบ Omnichannel ซึ่งหมายความว่าคุณสามารถโต้ตอบกับลูกค้าบนช่องทางใดก็ได้ง่ายขึ้น และประการที่สอง แพลตฟอร์มนี้เป็นศูนย์ติดต่อแบบกระจาย ซึ่งช่วยให้คุณสามารถกำหนดเส้นทางข้อความและการโทรจากลูกค้าทั่วโลกไปยังตัวแทนที่กระจายอยู่ของคุณในสถานที่ต่างๆ ได้อย่างราบรื่น
ตอนนี้เราได้ครอบคลุมพื้นฐานของแพลตฟอร์ม SeaX แล้ว เราจะย้ายไปยังคุณสมบัติ AI และระบบอัตโนมัติขั้นสูงที่ทำให้ SeaX แตกต่างจากศูนย์ติดต่อ Omnichannel แบบกระจายอื่นๆ ในบล็อกนี้ เราจะแสดงให้เห็นว่าเอนจินแปลงข้อความเป็นคำพูดและคำพูดเป็นข้อความภายในของ Seasalt.ai สามารถปรับปรุงแง่มุมต่างๆ ของแพลตฟอร์ม SeaX ได้อย่างไร
สารบัญ
บทนำสู่ Voice Intelligence
Voice Intelligence คือการใช้ปัญญาประดิษฐ์เพื่อวิเคราะห์และดึงข้อมูลเชิงลึกจากข้อมูลที่ใช้เสียง แม้ว่าทศวรรษที่ผ่านมาจะมีการพัฒนาเทคโนโลยีเสียงอย่างน่าทึ่ง แต่การใช้งานในองค์กรยังคงค่อนข้างจำกัด บริษัทต่างๆ ยังคงสะสมข้อมูลเสียงหลายเทราไบต์ แต่ในกรณีส่วนใหญ่ ข้อมูลเหล่านั้นยังไม่ถูกนำมาใช้ให้เกิดประโยชน์สูงสุด
เหตุผลหนึ่งคือข้อมูลเสียงประมวลผลยากกว่าข้อมูลรูปแบบอื่น เช่น สถิติพื้นฐาน หรือแม้แต่ข้อมูลข้อความธรรมดา ข้อมูลเสียงมีความพิเศษในหลายๆ ด้าน:
- ขึ้นอยู่กับภาษา มีสำเนียงและภาษาถิ่น จึงยากที่จะเก็บข้อมูลได้ 100%
- คุณภาพแตกต่างกันไปตามช่องทาง (โทรศัพท์เทียบกับ VoIP, โมโนเทียบกับสเตอริโอ), อัตราการสุ่มตัวอย่าง (8KHz เทียบกับ 16KHz), ความแม่นยำในการแสดงผล (8 บิต, 16 บิต, 32 บิต) และเสียงรบกวนจากสิ่งแวดล้อม เช่น เสียงรบกวนพื้นหลัง
- ตีความยากกว่า: ตั้งแต่อารมณ์ของคำพูดไปจนถึงการระบุตัวผู้พูดไปจนถึงความหมายทางความหมาย
อย่างไรก็ตาม เมื่อจัดการอย่างเหมาะสมด้วยเครื่องมือที่ถูกต้อง ความฉลาดทางเสียงสามารถให้ประโยชน์มหาศาลแก่บริษัทที่ใช้งานได้ เหนือสิ่งอื่นใด ความสามารถในการจัดการข้อมูลเสียงอย่างเหมาะสมจะปลดล็อกความสามารถในการใช้การถอดเสียงพูดเป็นข้อความส่วนบุคคล ซึ่งสามารถทำให้การสนทนาสามารถค้นหา จัดทำดัชนี และให้ข้อมูลเชิงลึกได้ และช่วยให้สามารถประมวลผล NLP เพิ่มเติมได้ เมื่อมีการรวบรวมข้อมูลมากขึ้น การปรับปรุงบริการเหล่านี้ก็เป็นไปได้เช่นกัน เช่น การเพิ่มความแม่นยำในการถอดเสียง การเพิ่มความครอบคลุมของกรณีการใช้งาน และการจัดหารูปแบบเสียงและภาษาที่ปรับแต่งได้เพื่อปรับให้เข้ากับภาษาและภาษาถิ่นใหม่ๆ
สิ่งที่ทำให้ Seasalt.ai แตกต่าง
Seasalt.ai ให้บริการเทคโนโลยีและผลิตภัณฑ์ Cloud Communication AI แก่ลูกค้าองค์กร เราได้พัฒนาเทคโนโลยีเสียงและภาษาภายในองค์กรสำหรับข้อความ และการโทรด้วยเสียงในศูนย์ติดต่อองค์กร เอ็นจิ้นภาษาธรรมชาติของเราสนับสนุนภาษา ที่มีทรัพยากรสูงและทรัพยากรต่ำหลากหลาย: พม่า, จีน, อังกฤษ, ฟิลิปปินส์, เยอรมัน, อินโดนีเซีย, เขมร, ลาว, มาเลย์, สเปน, ทมิฬ, ไทย, เวียดนาม ฯลฯ Seasalt.ai ได้รับการสนับสนุนจากเงินทุนร่วมลงทุนและบริหารงานโดยกลุ่มผู้เชี่ยวชาญชั้นนำของโลกด้านการรู้จำเสียงพูดเชิงลึก, การสังเคราะห์เสียงพูดด้วยโครงข่ายประสาทเทียม และบทสนทนาภาษาธรรมชาติ
ดูวิดีโอสาธิตการแปลงคำพูดเป็นข้อความของเรา:
คำพูดเป็นข้อความ

เอนจินแปลงคำพูดเป็นข้อความของเราจะรับเสียงพูดและสร้างการถอดเสียงแบบเรียลไทม์ เริ่มต้นจากเสียง เราจะดึงคุณสมบัติทางสัทวิทยา แปลงคุณสมบัติเหล่านี้เป็นหน่วยเสียง และจากนั้นจับคู่หน่วยเสียงเหล่านี้กับการสะกดคำของภาษาเป้าหมาย ระบบปัจจุบันของเราสามารถถอดเสียงได้หลายภาษา รวมถึงภาษาอังกฤษและภาษาจีน โดยมีการเพิ่มภาษาอื่นๆ อย่างต่อเนื่อง
ดูวิดีโอการปรับแต่ง Speech-to-Text ของเราเพื่อดูว่าเอนจิน STT ของ Seasalt สามารถปรับแต่งสำหรับโดเมนใดก็ได้อย่างไร:
ข้อความเป็นคำพูด

Text-to-Speech คือกระบวนการสังเคราะห์เสียงพูดของมนุษย์ที่สมจริงพร้อมด้วยน้ำเสียงและจังหวะที่เป็นธรรมชาติจากข้อความเท่านั้น โมเดลของเราจะรับข้อความปกติ แปลงข้อความนี้เป็นหน่วยเสียง จากนั้นแปลงหน่วยเสียงเป็นเสียงในขณะที่คาดการณ์ระดับเสียง ระยะเวลา และระดับเสียงที่เหมาะสมในแต่ละช่วงเวลาเพื่อให้ได้ประสบการณ์ TTS ที่สมจริงที่สุดเท่าที่จะเป็นไปได้ หากผลลัพธ์สุดท้ายไม่สมบูรณ์ เรามีฟังก์ชันการปรับแต่งเสียงที่สังเคราะห์ขึ้น รวมถึงการออกเสียงคำ การหยุดชั่วคราว และการเน้นเสียง
ดูวิดีโอสาธิตการปรับแต่ง Text-to-Speech ของเราเพื่อดูว่าเอาต์พุตเอนจิน TTS ของ Seasalt สามารถปรับแต่งเพื่อให้เสียงสังเคราะห์ที่สมจริงได้อย่างไร:
คุณยังสามารถตรวจสอบ หน้า TTS บนเว็บไซต์ของเราเพื่อฟังตัวอย่างเสียงสังเคราะห์บางส่วนของเรา รวมถึง Tom Hanks, David Attenborough และ Reese Witherspoon
TTS และ STT ใน SeaX
Voice IVR

โฟลว์ Voice IVR โดยใช้เอนจินแปลงคำพูดเป็นข้อความของ Seasalt.ai สำหรับการถอดเสียงแบบเรียลไทม์และการกำหนดเส้นทางการโทร.
ความฉลาดทางเสียงสามารถเริ่มช่วยเหลือได้ก่อนที่การโทรจะปรากฏบนแพลตฟอร์ม SeaX โดยการตรวจสอบให้แน่ใจว่าการโทรถูกกำหนดเส้นทางไปยังตำแหน่งที่ถูกต้องและรวบรวมข้อมูลสำคัญก่อนที่จะส่งต่อการโทรไปยังตัวแทน SeaX ใช้ Twilio Studio เพื่อปรับแต่งโฟลว์การกำหนดเส้นทางการโทรและข้อความ แต่เรายังสามารถรวมเอนจินแปลงคำพูดเป็นข้อความของเราเข้ากับโฟลว์ IVR เพื่อให้ลูกค้าสามารถใช้ภาษาธรรมชาติเพื่อกำหนดเส้นทางการโทรของพวกเขาได้ (แทนที่จะเป็นประสบการณ์แบบดั้งเดิม “กด 1 สำหรับ…” ) นอกจากนี้ หากบริษัทของคุณสนใจที่จะใช้แชทบอทเพื่อโต้ตอบกับลูกค้า เราสามารถก้าวไปอีกขั้นโดยให้แชทบอทของคุณมีเสียงเพื่อพูดคุยกับลูกค้าทางโทรศัพท์โดยใช้เอนจินแปลงข้อความเป็นคำพูดของเรา
ข้อความไม่พร้อมใช้งาน

การกำหนดค่าข้อความไม่พร้อมใช้งานของ SeaX โดยใช้ข้อความเป็นคำพูด.
เทคโนโลยีแปลงข้อความเป็นคำพูดของเรายังช่วยให้สามารถปรับแต่งข้อความเสียงได้อย่างมาก ตัวอย่างเช่น ข้อความเหล่านี้สามารถถูกเรียกใช้เมื่อลูกค้าโทรเข้ามาหลังเวลาทำการปกติ หรือหากลูกค้าจำเป็นต้องถูกพักสายขณะรอตัวแทนที่ว่าง
การถอดเสียงสด

การถอดเสียงการโทรสดพร้อมการวิเคราะห์ที่แสดงให้ตัวแทนบน SeaX.
เมื่อลูกค้าอยู่ในสายกับตัวแทน เอนจินแปลงคำพูดเป็นข้อความของเราจะให้การถอดเสียงการสนทนาแบบเรียลไทม์ที่แม่นยำเพื่อการอ้างอิงของตัวแทน สิ่งนี้ช่วยให้ตัวแทนสามารถอ้างอิงจุดก่อนหน้าในการสนทนาและ/หรือตรวจสอบความเข้าใจของพวกเขาเกี่ยวกับสิ่งที่ลูกค้าพูด นอกจากนี้ การถอดเสียงเหล่านี้ยังมีประโยชน์อย่างยิ่งสำหรับการใช้งานปลายน้ำ เช่น การแยกหัวข้อ การแยกการกระทำ การสรุป การวิเคราะห์การประชุม ฯลฯ
และอื่นๆ…
ข้างต้นเป็นเพียงไม่กี่วิธีที่ SeaX ผสานรวมความฉลาดทางเสียงขั้นสูงเพื่อลดเวลารอ ปรับปรุงประสิทธิภาพของตัวแทน และมอบประสบการณ์ที่ราบรื่นโดยรวมให้กับทั้งลูกค้าและตัวแทน หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัติขั้นสูงที่มาพร้อมกับแพลตฟอร์ม SeaX โปรดติดตามบล็อกโพสต์ถัดไปของเรา ซึ่งรวมถึงฐานความรู้ AI การจัดการกรณี และ SMS จำนวนมาก หากต้องการรับการสาธิตส่วนตัวและหารือว่าแพลตฟอร์ม SeaX สามารถตอบสนองความต้องการทางธุรกิจเฉพาะของคุณได้อย่างไร โปรดกรอก แบบฟอร์มจองการสาธิต ของเรา