Bốn tháng đưa tiếng mẹ đẻ lên Galaxy AI của kỹ sư Việt - VietBF
 
 
 
News Library Technology Giải Trí Portals Tin Sốt Home

HOME

NEWS 24h

ZONE 1

ZONE 2

Phim Bộ

Phim Lẻ

Ca Nhạc

Breaking

Go Back   VietBF > Other News|Tin Khác > Mobile News|Tin Di Động


Reply
 
Thread Tools
  #1  
Old  Default Bốn tháng đưa tiếng mẹ đẻ lên Galaxy AI của kỹ sư Việt
Kỹ sư Trần Tuấn Minh cùng cộng sự phải xử lư nhiều khó khăn về dữ liệu đầu vào, đa dạng phương ngữ của tiếng Việt khi đưa lên Galaxy AI.

Ngày 18/1, Samsung công bố ḍng điện thoại Galaxy S24 với các tính năng AI tạo sinh (GenAI), trong đó có khả năng dịch thuật trực tiếp bằng trí tuệ nhân tạo, tại sự kiện Unpacked 2024 ở San Jose (Mỹ). Cách đó nửa ṿng Trái Đất, ở Hà Nội, Trần Tuấn Minh, Trưởng nhóm nghiên cứu ngôn ngữ AI tại Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam (SRV), cùng cộng sự cũng hồi hộp theo dơi sự kiện, mong chờ cột mốc được công bố.

"Mọi người như vỡ ̣a khi danh sách 13 ngôn ngữ đầu tiên được hỗ trợ trong tính năng dịch bằng GenAI trên Galaxy S24 được công bố, trong đó có tiếng Việt", Tuấn Minh kể. "Điều này giúp người dùng Việt tương tác với công nghệ mới nhất bằng chính tiếng mẹ đẻ, tương tự các ngôn ngữ phổ biến hàng đầu trên thế giới".

Cuộc chạy đua

Nhóm của Trần Tuấn Minh bắt đầu nhận dự án phát triển tiếng Việt cho Galaxy AI từ tháng 10/2023, trong khi Galaxy S24 được công bố tháng 1, tức nhóm chỉ có bốn tháng để hoàn thành. Trong khi đó, thông thường cần ít nhất từ 6 tháng đến một năm để phát triển AI ngôn ngữ lớn

Đội ngũ dự án gồm 30 kỹ sư phát triển trực tiếp và 45 người kiểm thử, đều là người Việt. Họ liên tục bay qua lại giữa Việt Nam và các trung tâm R&D của Hàn Quốc, Ấn Độ để trao đổi, xây dựng bộ dữ liệu kèm văn bản tương ứng để "dạy" AI nói, hiểu tiếng Việt.

Trên Galaxy AI, tiếng Việt được phát triển dựa trên ba trụ cột chính: nhận diện giọng nói để chuyển sang văn bản, dịch sang ngôn ngữ khác, và chuyển từ văn bản thành giọng nói. Ví dụ, với tính năng dịch trực tiếp Live Translate khi gọi điện thoại, người gọi sẽ nói tiếng mẹ đẻ, sau đó Live Translate dịch sang ngôn ngữ của người nghe và nói lại bằng ngôn ngữ đó. Galaxy AI đảm bảo cho quá tŕnh dịch gần như diễn ra lập tức, giúp cuộc hội thoại không có độ trễ.

Thách thức lớn nhất là dữ liệu "dạy" AI bằng tiếng Việt rất hạn chế so với tiếng Anh hay những ngôn ngữ phổ biến khác. Chất lượng đầu vào cũng không cao do trí tuệ nhân tạo là lĩnh vực mới ở Việt Nam. Việc ít dữ liệu thô và chất lượng thấp ảnh hưởng trực tiếp đến độ chính xác của đầu ra AI. Do đó, trước khi bắt đầu, cả nhóm đă ngồi lại phân tích dữ liệu hiện có, xác định đâu là "vùng lơm" để cải thiện.

"Giải quyết xong phần đầu vào cho mô-đun dịch, chúng tôi tiếp tục phát hiện một thách thức khác là tính phương ngữ, đặc trưng mỗi vùng miền rất khác nhau", Tuấn Minh nói.

Phát sinh tiếp theo là tiếng Việt trong đời sống đang có rất nhiều thay đổi so với kho dữ liệu đang có. Ví dụ, những từ lóng của Gen Z, từ mới của người sử dụng Internet hay tên phim, người nổi tiếng, sự kiện quốc tế... Do đó, đội ngũ R&D phải liên tục cập nhật cho AI.

Cùng lúc, các kỹ sư kiểm thử phải ra môi trường thực tế như trong quán cà phê, trên xe buưt, phố đi bộ... để đánh giá khả năng hoạt động ngoài đời của AI trong nhiều điều kiện khác nhau.

Một sản phẩm mới đi từ pḥng nghiên cứu đến người dùng cuối luôn trải qua công đoạn quan trọng là kiểm thử. "SRV là trung tâm lớn nhất ngoài Hàn Quốc chịu trách nhiệm kiểm thử thiết bị mạng, nhưng chúng tôi phải đối mặt thử thách lớn là kỹ sư kiểm thử khi đó không biết nhiều về AI", Tuấn Minh nhớ lại. "Sau khi được kỹ sư Hàn Quốc bàn giao công nghệ và kinh nghiệm, mọi người vừa học vừa làm, chạy đua với thời gian".

Ông Choi Joo Ho, Tổng giám đốc Tổ hợp Samsung Việt Nam nhận định những tính năng mới trên Galaxy AI có sự đóng góp rất lớn của kỹ sư Việt, từ nỗ lực đưa tiếng Việt trở thành một trong những ngôn ngữ đầu tiên đến việc nghiên cứu, bàn giao công nghệ mới cho kỹ sư trong khu vực.

june04
R10 Vô Địch Thiên Hạ
june04's Avatar
Release: 2 Weeks Ago
Reputation: 16655


Profile:
Join Date: Oct 2014
Posts: 58,620
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	ks.jpg
Views:	0
Size:	207.0 KB
ID:	2359947  
june04_is_offline
Thanks: 1
Thanked 3,017 Times in 2,643 Posts
Mentioned: 0 Post(s)
Tagged: 0 Thread(s)
Quoted: 18 Post(s)
Rep Power: 68 june04 Reputation Uy Tín Level 6
june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6
Reply

User Tag List


Facebook Comments


 
iPad Tablet Menu

HOME

Breaking News

Society News

VietOversea

World News

Business News

Other News

History

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

Sport News

ZONE 1

ZONE 2

Phim Bộ

Phim Lẻ

Ca Nhạc

Thơ Ca

Help Me

Sport Live

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOT 30 Days

NEWS 30 Days

Member News

Tin Sôi Nổi Nhất 24h Qua

Tin Sôi Nổi Nhất 3 Ngày Qua

Tin Sôi Nổi Nhất 7 Ngày Qua

Tin Sôi Nổi Nhất 14 Ngày Qua

Tin Sôi Nổi Nhất 30 Ngày Qua
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. V́ một tương lai tươi đẹp cho các thế hệ Việt Nam hăy ghé thăm chúng tôi, hăy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.


All times are GMT. The time now is 06:42.
VietBF - Vietnamese Best Forum Copyright ©2006 - 2024
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2024 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.05548 seconds with 13 queries