Log in

View Full Version : T́m kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone


tonny_thuong
12-08-2011, 01:00
T́m kiếm địa điểm bằng giọng nói tiếng Việt trên iPhone

Ứng dụng iSago dùng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt giúp người dùng tương tác với điện thoại iPhone để t́m thông tin về ẩm thực, giải trí tại TP HCM.

iSago là thành quả nghiên cứu trong 3 năm của pḥng thí nghiệm AILab thuộc Đại học Khoa học Tự nhiên TP HCM. Ở phiên bản 1.0, iSago cung cấp chức năng t́m kiếm thông tin nhà hàng, quán bar, cafe, địa điểm giải trí trên địa bàn TP.HCM.

Clip t́m thông tin bằng iSago

<object data="http://vnexpress.net/video/player_embed.swf" name="player" id="musicplayer" type="application/x-shockwave-flash" height="380" width="480"><param value="false" name="menu"><param value="true" name="allowfullscreen"><param value="always" name="allowscriptaccess"><param value="opaque" name="wmode"><param value="xmlPath=http://vnexpress.net/Service/FlashVideo/PlayListVideoPage.as p?id=61805&f=2&colorAux=0x0099ff&colorBorder=0x333333&colorMain=0xffffff&local=embed&mAuto=false&repeat=false" name="flashvars"></object>

http://vnexpress.net/Files/Subject/3b/bb/d3/0a/iSago.JPG

Giao diện ứng dụng iSago trên điện thoại iPhone. Ảnh: Hà Mai.

Sau khi cài iSago vào iPhone, người dùng có thể đặt câu hỏi bằng giọng nói như “Tôi muốn t́m quán cafe ở quận 1” hay “Tôi muốn ăn phở tại quận 1”... iSago sẽ truyền nội dung truy vấn này về server để xử lư và gửi lại kết quả t́m kiếm.

http://vnexpress.net/Files/Subject/3b/bb/d3/0a/quy_trinh_iSago.jpg

Quy tŕnh hoạt động t́m kiếm thông tin bằng giọng nói của ứng dụng iSago.

Kết quả là một danh sách tên nhà hàng, địa chỉ. Khi nhấn vào danh sách th́ địa điểm cần t́m sẽ được hiển thị trên bản đồ hoặc người dùng có thể nghe đọc địa chỉ trực tiếp bằng công nghệ tổng hợp giọng nói. Trong trường hợp không có kết nối mạng, người dùng vẫn có thể t́m kiếm trên điện thoại iPhone bằng những câu truy vấn văn bản nhập vào từ bàn phím.

http://vnexpress.net/Files/Subject/3b/bb/d3/0a/qt_tong_dai.jpg

Quy tŕnh hoạt động hệ thống VIS (Viet voIce System).

Pḥng thí nghiệm AILab cũng giới thiệu hệ thống VIS (Viet voIce System) hỗ trợ hỏi đáp thông tin bằng tiếng Việt qua đường điện thoại, sử dụng công nghệ nhận dạng và tổng hợp tiếng nói tiếng Việt với độ chính xác cao và tốc độ xử lư nhanh.

http://vnexpress.net/Files/Subject/3b/bb/d3/0a/tong_dai.JPG

Khi có người gọi điện đến, hệ thống sẽ phân tích giọng nói để chuyển máy đến người cần gặp. Ảnh: à Mai.

VIS phiên bản đầu tiên bao gồm một số dịch vụ trong đó nổi bật nhất là dịch vụ tự động chuyển cuộc gọi VIS:DIR. Với VIS:DIR người dùng có thể nói tên các pḥng, ban trong một trường đại học sau đó hệ thống sẽ tự động chuyển cuộc gọi đến các pḥng, ban tương ứng mà không phải t́m kiếm số điện thoại trong danh bạ hoặc chờ đợi tiếp tân nối máy.

Clip hệ thống VIS:DIR nhận dạng giọng nói

<object data="http://vnexpress.net/video/player_embed.swf" name="player" id="musicplayer" type="application/x-shockwave-flash" height="380" width="480"><param value="false" name="menu"><param value="true" name="allowfullscreen"><param value="always" name="allowscriptaccess"><param value="opaque" name="wmode"><param value="xmlPath=http://vnexpress.net/Service/FlashVideo/PlayListVideoPage.as p?id=61806&f=2&colorAux=0x0099ff&colorBorder=0x333333&colorMain=0xffffff&local=embed&mAuto=false&repeat=false" name="flashvars"></object>

Hà Mai
theo vne