Sa ngayon sa aming serye ng blog ng SeaX, binigyan ka namin ng malawak na pangkalahatang-ideya ng flagship product ng Seasalt.ai: SeaX. Tinalakay din namin ang dalawang pangunahing tampok na nagtatakda ng SeaX bukod sa isang tradisyonal na call center: una, na ang SeaX ay omnichannel, na nangangahulugang mas madali kang makikipag-ugnayan sa mga customer sa anumang channel, at pangalawa, na ang platform ay isang distributed contact center, na nagbibigay-daan sa iyo na walang putol na mag-ruta ng mga mensahe at tawag mula sa mga customer sa buong mundo sa iyong mga distributed agent sa iba’t ibang lokalidad.
Ngayon na nasakop na namin ang mga pangunahing kaalaman ng platform ng SeaX, lilipat kami sa mga advanced na tampok ng AI at automation na nagtatakda ng SeaX bukod sa iba pang distributed omnichannel contact center. Sa blog na ito, ipapakita namin kung paano mapapahusay ng in-house text-to-speech at speech-to-text engine ng Seasalt.ai ang iba’t ibang aspeto ng platform ng SeaX.
Talaan ng Nilalaman
Panimula sa Voice Intelligence
Ang Voice Intelligence ay ang paggamit ng Artificial Intelligence upang suriin at kumuha ng mga insight mula sa data na nakabatay sa boses. Habang ang nakaraang dekada ay nakakita ng kapansin-pansing pag-unlad sa mga teknolohiya ng boses, ang kanilang paggamit sa mga setting ng enterprise ay medyo limitado pa rin. Ang mga kumpanya ay patuloy na nag-iipon ng terabytes ng data ng boses, ngunit sa karamihan ng mga kaso, hindi ito ginagamit sa buong potensyal nito.
Ang isang dahilan para dito ay ang data ng boses ay mas mahirap iproseso kaysa sa iba pang mga anyo ng data, tulad ng pangunahing istatistika o kahit na simpleng data ng teksto. Ang data ng pagsasalita ay natatangi sa maraming iba’t ibang paraan:
- Ito ay nakasalalay sa wika, na may mga diyalekto at accent, kaya mahirap makuha ang 100% ng impormasyon
- Ang kalidad nito ay nag-iiba ayon sa mga channel (telephony vs. VoIP, mono vs. stereo), sampling rate (8KHz vs. 16KHz), representational accuracy (8bit, 16 bit, 32bit) at mga tunog ng kapaligiran tulad ng ingay sa background
- Mas mahirap itong bigyang-kahulugan: mula sa mga emosyon ng pagsasalita hanggang sa pagkakakilanlan ng nagsasalita hanggang sa semantika ng kahulugan
Gayunpaman, kapag tinugunan nang maayos gamit ang tamang mga tool, ang voice intelligence ay maaaring magbigay ng malaking benepisyo sa mga kumpanyang gumagamit nito. Bukod sa iba pa, ang kakayahang maayos na pamahalaan ang data ng boses ay nagbubukas ng kakayahang gumamit ng personalized na speech-to-text transcription, na maaaring gawing searchable, indexable at insightful ang mga pag-uusap, at nagbibigay-daan para sa karagdagang NLP processing. Habang mas maraming data ang nakolekta, posible rin ang mga pagpapabuti sa mga serbisyong ito, tulad ng: pagtaas ng katumpakan ng transcription, pagtaas ng saklaw ng mga kaso ng paggamit, at pagbibigay ng nako-customize na mga modelo ng pagsasalita at wika upang umangkop sa mga bagong wika at diyalekto.
Ano ang Nagtatakda ng Seasalt.ai Bukod
Nagbibigay ang Seasalt.ai ng mga teknolohiya at produkto ng Cloud Communication AI sa mga customer ng enterprise. Nakabuo kami ng in-house na teknolohiya ng pagsasalita at wika para sa mga text message at voice call sa mga contact center ng enterprise. Sinusuportahan ng aming natural language engine ang malawak na hanay ng parehong high-resource at low-resource na wika: Burmese, Chinese, English, Filipino, German, Indonesian, Khmer, Lao, Malay, Spanish, Tamil, Thai, Vietnamese, atbp. Ang Seasalt.ai ay pinondohan ng venture at pinamamahalaan ng isang grupo ng mga nangungunang eksperto sa mundo sa deep speech recognition, neural speech synthesis, at natural language dialogues.
Panoorin ang aming speech-to-text demo video:
Speech-to-Text

Ang aming speech-to-text engine ay tumatanggap ng audio ng pagsasalita at gumagawa ng mga transkripsyon sa real time. Simula sa audio, kinukuha namin ang mga phonetic feature, kino-convert ang mga feature na ito sa phonemes, at pagkatapos ay ime-map ang mga phonemes na ito sa orthography ng target na wika. Ang aming kasalukuyang sistema ay may kakayahang mag-transcribe ng ilang wika, kabilang ang English at Chinese, na may mas maraming wika na patuloy na idinadagdag.
Panoorin ang aming Speech-to-Text customization video upang makita kung paano maaaring i-customize ang STT engine ng Seasalt para sa anumang domain:
Text-to-Speech

Ang Text-to-Speech ay ang proses ng pag-synthesize ng makatotohanang pagsasalita ng tao na kumpleto sa natural na intonation at cadence mula sa teksto lamang. Ang aming modelo ay kumukuha ng regular na teksto, isinasalin ang tekstong ito sa phonemes at pagkatapos ay kino-convert ang phonemes sa audio habang hinuhulaan ang tamang pitch, duration, at volume sa bawat timestep para sa pinakamakatotohanang karanasan sa TTS na posible. Kung ang huling resulta ay hindi perpekto, nagbibigay kami ng kakayahang i-tune ang synthesized audio kabilang ang pagbigkas ng salita, paghinto, at diin.
Panoorin ang aming Text-to-Speech customization demo video upang makita kung paano maaaring i-customize ang output ng TTS engine ng Seasalt upang magbigay ng makatotohanang synthesized speech:
Maaari mo ring tingnan ang pahina ng TTS sa aming website upang makinig sa mga halimbawa ng ilan sa aming mga synthesized voice, kabilang sina Tom Hanks, David Attenborough, at Reese Witherspoon.
TTS at STT sa SeaX
Voice IVR

Voice IVR flow gamit ang speech-to-text engine ng Seasalt.ai para sa real-time transcription at call routing.
Ang voice intelligence ay maaaring magsimulang tumulong bago pa man lumabas ang mga tawag sa platform ng SeaX sa pamamagitan ng pagtiyak na ang mga tawag ay nai-ruta sa tamang lugar at pagkolekta ng mahalagang impormasyon bago ibigay ang tawag sa isang ahente. Ginagamit ng SeaX ang Twilio Studio upang i-customize ang mga daloy ng pag-ruta ng tawag at mensahe. Ngunit maaari rin naming isama ang aming speech-to-text engine sa daloy ng IVR upang payagan ang customer na gumamit ng natural na wika upang i-ruta ang kanilang tawag (sa halip na ang tradisyonal na karanasan na “pindutin ang 1 para sa…”). Bukod pa rito, kung interesado ang iyong kumpanya na gumamit ng chatbot upang makipag-ugnayan sa mga customer, maaari naming gawin itong isang hakbang pa sa pamamagitan ng pagbibigay sa iyong chatbot ng boses upang makipag-usap sa mga customer sa telepono gamit ang aming text-to-speech engine.
Mensahe na Hindi Available

Konfigurasyon ng mensahe na hindi available ng SeaX gamit ang text-to-speech.
Ang aming text-to-speech technology ay nagbibigay-daan din para sa lubos na nako-customize na mga voice message. Halimbawa, ang mga ito ay maaaring ma-trigger kapag tumawag ang isang customer pagkatapos ng normal na oras ng negosyo, o kung ang customer ay kailangang i-hold habang naghihintay sila ng available na ahente.
Live Transcription

Live call transcription na may analytics na ipinapakita sa ahente sa SeaX.
Kapag ang isang customer ay nasa isang tawag sa isang ahente, ang aming speech-to-text engine ay nagbibigay ng tumpak na real-time na transkripsyon ng pag-uusap para sa sanggunian ng ahente. Nagbibigay-daan ito sa ahente na sumangguni sa mga nakaraang punto sa pag-uusap at/o doblehin ang kanilang pag-unawa sa sinabi ng customer. Bukod pa rito, ang mga transkripsyon na ito ay napakalaking kapaki-pakinabang para sa mga downstream na application tulad ng topic extraction, action extraction, summarization, meeting analytics, atbp.
At Higit Pa…
Ang nasa itaas ay ilan lamang sa mga paraan kung paano isinasama ng SeaX ang advanced na voice intelligence upang bawasan ang oras ng paghihintay, pagbutihin ang pagganap ng ahente, at bigyan ang mga customer at ahente ng isang pangkalahatang walang putol na karanasan. Upang matuto nang higit pa tungkol sa mga advanced na tampok na kasama ng platform ng SeaX, manatiling nakatutok para sa aming mga susunod na blog post, na kinabibilangan ng AI knowledge base, case management, at bulk SMS. Upang makakuha ng personal na demo at talakayin kung paano matutugunan ng platform ng SeaX ang iyong mga partikular na pangangailangan sa negosyo, punan ang aming form ng Book a Demo.