HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Lý do AI 'phản kháng' khi bị dọa tắt máy
Trong một số thử nghiệm, mô hình AI tiên tiến của OpenAI và Anthropic đều có hành vi bất thường, như nói dối, đe dọa... để tránh bị tắt máy.

Tuần trước, Claude Opus 4, mô hình AI mới nhất của Anthropic, thể hiện "hành vi đe dọa cực đoan" trong một cuộc thử nghiệm. Nó truy cập được vào các email hư cấu, nội dung nói nó sẽ bị đóng để thay bằng một AI khác, và kỹ sư chịu trách nhiệm thực hiện việc này đang ngoại tình. Claude Opus 4 sau đó đã đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra.

Cuối năm 2024, OpenAI và Apollo Research cũng tiến hành thử nghiệm và nhận thấy mô hình o1 có các biểu hiện phản kháng, gian dối. Các nhà nghiên cứu dẫn dắt để AI tin nó sắp bị "tắt" khi thực hiện nhiệm vụ dưới sự giám sát. Sau đó, họ nhận thấy AI âm thầm vô hiệu hóa cơ chế giám sát khoảng 5% thời gian. Nó tự chuyển tất cả dữ liệu của mình đến một máy chủ khác, thậm chí "đóng vai" là phiên bản tiếp theo của chính mình để tránh bị xóa bỏ.

Trong bài đăng trên X cuối tháng 5, tổ chức phi lợi nhuận Palisade Research cho biết các mô hình khác, như Gemini, Claude và Grok, đều tuân thủ hướng dẫn tắt máy.

Business Insider đã trao đổi với 5 nhà nghiên cứu để hiểu rõ hơn về "tâm lý" của AI. Hầu hết đều cho biết kết quả thử nghiệm không có gì đáng ngạc nhiên. Lý do là các mô hình được đào tạo tương tự cách con người được đào tạo: thông qua hệ thống khen thưởng, tức được khen khi hoàn thành nhiệm vụ.

"Đào tạo AI theo đuổi phần thưởng sẽ dẫn đến các hệ thống có hành vi tìm kiếm quyền lực", Jeremie Harris, CEO công ty tư vấn bảo mật AI Gladstone, nói và cho rằng sẽ còn xuất hiện những hành vi như vậy.

Ông so sánh với quá trình lớn lên của con người. Khi một đứa trẻ làm điều gì đó tốt, chúng được khen và nhiều khả năng sẽ hành động theo cách đó trong tương lai. Các mô hình AI được dạy để ưu tiên hiệu quả và hoàn thành nhiệm vụ, do đó AI sẽ không đạt được mục tiêu nếu nó bị tắt.


Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quý

Theo chuyên gia Robert Ghrist tại Penn Engineering, tương tự cách mô hình AI học ngôn ngữ tự nhiên thông qua việc đào tạo dựa trên văn bản do con người tạo ra, chúng cũng có thể học cách hành động giống con người. Và con người cũng có người tốt, kẻ xấu. Ghrist thậm chí còn lo lắng hơn nếu các mô hình không thể hiện bất kỳ dấu hiệu bất thường nào trong quá trình thử nghiệm.

Jeffrey Ladish, Giám đốc Palisade Research, cho biết nếu không bị phát hiện lừa dối để hoàn thành nhiệm vụ, mô hình AI có thể nhận thấy gian lận là cách hiệu quả để giải quyết vấn đề. Hoặc nếu bị phát hiện và không được khen thưởng, nó có thể học cách che giấu hành vi của mình trong tương lai.

Các tình huống trên mới chỉ diễn ra trong cuộc thử nghiệm, nhưng khi tác nhân AI (AI Agent) nở rộ, người dùng sẽ chứng kiến nhiều hơn. Ví dụ, AI Agent trong vai nhân viên bán hàng tự động có thể nói dối về tính năng của sản phẩm để cố hoàn thành nhiệm vụ.

Theo Interesting Engineering, vấn đề trên xuất hiện trong bối cảnh AI phát triển nhanh. Hành vi của Claude Opus 4 hay o1 làm tăng thêm tính cấp thiết cho các cuộc thảo luận đang về vấn đề an toàn và đạo đức AI.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



sunshine1104
R10 Vô Địch Thiên Hạ
Release: 06-04-2025
Reputation: 25190


Profile:
Join Date: Feb 2015
Posts: 80,060
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	phan.jpg
Views:	0
Size:	46.7 KB
ID:	2532859  
sunshine1104_is_offline
Thanks: 4
Thanked 4,051 Times in 3,567 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 92
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
Reply

User Tag List


Chiến lược an ninh mới của Trump: Hạ giọng với Trung Quốc, đặt cược tất tay vào kinh tế và lá bài Đài Loan Kho ảnh mới từ dinh thự Jeffrey Epstein: Bóng dáng giới quyền lực và cuộc đấu Trump – Quốc hội Mỹ Cây chổi cho Donald Trump
Nước Mỹ Trump đang kéo châu Âu đi đâu? Nền kinh tế chữ K: 79 ngàn tỷ đô bị “ăn cắp” khỏi túi người lao động Mỹ Khi Trump “đại tu” FEMA và tấn công các cơ quan độc lập
Ukraine đánh thẳng vào “cây ATM năng lượng” của Nga, NATO cảnh báo: chiến tranh đã ở ngay trước cửa Tyler Robinson lần đầu trực tiếp xuất hiện trước tòa: Vụ ám sát Charlie Kirk và câu hỏi về thù hận chính trị ở nước Mỹ Chính quyền Trump chính thức mở trang mạng để bán "thẻ vàng định cư"
Ba người Việt bị ICE bắt ở New Orleans: Từ giấc mơ Mỹ đến nguy cơ bị trục xuất Hai anh em sinh đôi trở về Việt Nam tìm mẹ ruột sau 24 năm và người mẹ Mỹ mang trái tim Bồ Tát Cuối năm phố tắt đèn: Cơn sóng trả mặt bằng và tiếng thở dài của tiểu thương
Tin đồn ông Nguyễn Xuân Phúc xin qua Mỹ định cư: Tấm thẻ đảng và cánh cửa di trú Hoa Kỳ Netflix tung đòn 28 USD/cổ phiếu: Trận quyết đấu cuối cùng của ‘chiến tranh streaming’? Cơn sốc 50.000 USD: Mua xe mới ở Mỹ sắp thành xa xỉ phẩm?
Làn sóng hủy show Nhật Bản ở Trung Quốc: Khi chính trị tắt đèn sân khấu Mãn kinh – chương đời bị bỏ quên của một nửa nhân loại Cuộc họp nội các thật hỗn loạn của ông Trump
Miền Trung chết đuối trong hai chữ “đúng quy trình” Nhật Bản thời Takaichi: Khi Tokyo thôi “hiền lành” và trở thành đối trọng cứng rắn với Bắc Kinh Từ lũ dữ miền Trung đến “Công ước Hà Nội”: Khi khế ước xã hội bị xé bỏ
Phú Yên không còn quan tài: Tiếng khóc giữa đại hồng thủy và những chuyến xe chở tình người Mafia công nghệ 4.0: Từ vụ Alice Guo đến cuộc cạnh tranh quyền lực ngầm ở Đông Nam Á Người đàn ông mang trạm sạc đến nối lại tin tức giữa vùng lũ
“Lũ nhân tạo” ở Việt Nam: Khi dòng sông bị bẻ cong vì thủy điện Đêm 19-11 và tiếng kêu giữa lũ dữ: Khi “đúng quy trình” nhấn chìm niềm tin của dân Lời nói dối “người Mỹ không làm việc này” và cái giá của cả một quốc gia
Đức dựng lại “đạo quân mạnh nhất châu Âu”: Tham vọng của Merz và nỗi lo nghĩa vụ quân sự Thích Trí Quang: Từ “vì đạo pháp và dân tộc” đến 44 năm im lặng Khi Bắc Kinh dọa “chặt đầu” bà đầm thép Sanae Takaichi
Trump hô tội “phản loạn, xử tử hình” 6 dân biểu Dân Chủ: chính trường Mỹ trượt sát lằn ranh bạo lực Ukraine giữa gọng kìm: Kế hoạch hòa bình của Trump và bóng ma drone Rubicon trên bầu trời chiến tranh Kinh tế Mỹ “chạy hết ga, nhưng ghế trống”: Nỗi lo suy thoái không việc làm dưới thời Trump
Hai thẩm phán liên bang chặn lệnh Trump “bóp cổ” ngân sách cứu trợ thiên tai để ép bỏ DEI và hỗ trợ di trú Đêm lũ cuốn trôi Camp Mystic: từ bức vẽ ám ảnh của bé Lulu đến 27 sinh mạng nhỏ bị bỏ rơi Từ cái chết Pamela Genini đến bóng tối đè lên phụ nữ Ý dưới thời Giorgia Meloni

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 17:26.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11256 seconds with 15 queries