Nhịp AI – Bản tin tuần 47
Chủ đề: Từ phòng lab, hạ tầng quốc gia đến… đồ chơi của trẻ con
📰 Tuần 47 (17/11/2025 - 23/11/2025)
Tuần này có cảm giác khá “bước ngoặt”:
Google bật hẳn một nấc mới với Gemini 3 và hệ sinh thái Nano Banana Pro cho hình ảnh.
OpenAI công bố nghiên cứu cho thấy GPT-5 đã có thể đóng vai “đồng tác giả” nghiên cứu trong một số bài toán khó, nếu được giám sát chặt.
Ả Rập Xê Út đặt cược cực mạnh vào hạ tầng GPU, còn OpenAI, Microsoft, Nvidia, Anthropic tiếp tục xoay trục liên minh.
Ở chiều ngược lại, thế giới bắt đầu tranh luận gay gắt về app nói chuyện với người chết và đồ chơi AI cho trẻ em.
Dưới đây là bản tóm tắt để bạn nắm “trục chính” của tuần và chọn lọc những gì đáng quan tâm cho công việc, học tập và chiến lược cá nhân.
1. Cuộc đua mô hình: Gemini 3 vươn lên, GPT-5 trở thành “cộng sự nghiên cứu”
Gemini 3: Google lần đầu vượt OpenAI trên nhiều bảng xếp hạng A new era of intelligence with Gemini 3
Google công bố Gemini 3 với thông điệp “a new era of intelligence”, nhấn mạnh bước nhảy về năng lực suy luận và tác tử (agent). Mô hình mới:
Dẫn đầu các benchmark khó như Humanity’s Last Exam và ARC-AGI-2, vượt các phiên bản GPT-5 trước đó trên nhiều thang đo về lập luận, toán và hiểu biết khoa học.
Chỉ thua Claude Sonnet 4.5 ở mảng code, nhưng lại tỏa sáng ở suy luận đa phương thức và sử dụng công cụ.
Ra mắt kèm Antigravity, một nền tảng phát triển agent miễn phí với browser control, workflow bất đồng bộ và điều phối đa tác tử, cho thấy Google muốn đẩy mạnh thế hệ app “AI tự thao tác thay người dùng”.
GPT-5 như một “research partner”: giới nghiên cứu bắt đầu nghiêm túc
OpenAI và cộng tác viên công bố nghiên cứu cho thấy GPT-5, khi được “bọc” trong các scaffold tốt, đã thực sự góp phần vào:
Đề xuất một giới hạn bước nhảy mới và chứng minh gọn hơn cho một kết quả trong tối ưu gradient descent, sau đó được nhà nghiên cứu kiểm tra từng dòng. (OpenAI)
Đưa ra một ý tưởng then chốt trong việc giải Erdős Problem 848 về các tập số nguyên có tính chất đặc biệt của tích cộng một, giúp hoàn thiện chứng minh. (OpenAI)
Trong một số bài toán tổ hợp, GPT-5 tỏ ra hữu ích ở việc phát hiện lỗ hổng, đưa ví dụ phản chứng và gợi ý đơn giản hóa lập luận, dù vẫn còn sai nhiều và chưa thể làm “đồng tác giả” độc lập. (OpenAI)
Nhóm tác giả nhấn mạnh ba điểm:
Một là, scaffolding (mã và prompt bao quanh mô hình) cực kì quan trọng, giúp chia nhỏ bài toán, dùng thêm solver, simulator, và buộc mô hình giải thích từng bước.
Hai là, luôn cần chuyên gia kiểm tra độc lập, nhất là ngoài các lĩnh vực có tính hình thức cao như toán.
Ba là, GPT-5 rất hữu ích trong khâu khảo sát tài liệu và nối các nhánh kiến thức mà con người chưa liên kết.
Gemini 3 đánh bại bác sĩ nội trú trên “Radiology’s Last Exam”
Một tin mang tính biểu tượng: Gemini 3 đạt 51% trên kỳ thi Radiology’s Last Exam, vượt mức 45% của bác sĩ nội trú chuyên ngành X quang ở Mỹ, lần đầu tiên một mô hình tổng quát vượt người ở mốc này.
Điều đáng lưu ý là:
Đây không phải mô hình chuyên biệt cho y khoa mà là model đa dụng.
Google và nhóm tác giả đều nhấn mạnh: chưa thể dùng như công cụ chẩn đoán độc lập, nhưng đã đạt tầm “trợ lý chuyên môn” thực thụ.
Hàm ý: y tế và giáo dục chuyên khoa sẽ là nơi AI tổng quát bắt đầu chen chân mạnh, nếu có khung pháp lý và hạ tầng phù hợp.
2. Hình ảnh và 3D: Nano Banana Pro và Meta SAM 3D
Nano Banana Pro: hình ảnh 4K, chữ Việt chuẩn, kết nối trực tiếp Google Search
Google giới thiệu Nano Banana Pro (Gemini 3 Pro Image), mô hình tạo và chỉnh sửa ảnh mới nhất, nhấn mạnh ba điểm:
Tạo hình ảnh 2K, 4K, kiểm soát chi tiết về góc máy, ánh sáng, màu, vùng chọn, và trộn tới 14 ảnh input, giữ được danh tính 5 người trong cùng một kompo. (blog.google)
Khả năng render chữ dài, đa ngôn ngữ trực tiếp trong ảnh tốt hơn hẳn thế hệ trước, đặc biệt là chữ có dấu như tiếng Việt (báo Việt Nam đã test poster, menu, bảng phấn…). (blog.google)
Kết nối với Google Search để tạo infographic, sơ đồ, poster dựa trên dữ liệu thời gian thực; tất cả ảnh đều gắn watermark SynthID để truy xuất nguồn gốc. (blog.google)
Đồ họa thông tin về chăm sóc và bảo dưỡng xe đạp được tạo từ ứng dụng demo có chức năng tạo đồ họa thông tin giáo dục. (nguồn: (blog.google)
Phân phối:
Miễn phí dùng thử trong app Gemini (chọn “Create images” với model Thinking), sau quota sẽ tự chuyển về Nano Banana thường cho user free. (blog.google)
Có mặt trong Gemini API, Google AI Studio, Vertex AI, Workspace (Slides, Vids) và Google Ads, dành cho đội ngũ thiết kế, marketing, sản xuất nội dung. (blog.google)
Meta SAM 3 và SAM 3D: từ ảnh sang mô hình 3D
Meta công bố SAM 3 và SAM 3D, thế hệ mới của Segment Anything:
SAM 3 cho phép phân đoạn đối tượng trong ảnh dựa trên mô tả chi tiết bằng ngôn ngữ tự nhiên.
SAM 3D Objects và 3D Body dựng lại mô hình 3D của vật thể và cơ thể người chỉ từ một ảnh, vượt trội các đối thủ trong khảo sát người dùng.
Cả hai được đưa lên Segment Anything Playground miễn phí, mã nguồn SAM 3 cũng được mở.
Hàm ý: thiết kế sản phẩm, thương mại điện tử, robot, game và XR sẽ có thêm “lớp nền” 3D rẻ và dễ hơn rất nhiều.
3. Hạ tầng và địa chính trị: HUMAIN, xAI, Nvidia và cuộc đua GPU
Tại diễn đàn đầu tư Mỹ – Ả Rập Xê Út, công ty HUMAIN của Saudi công bố loạt thỏa thuận AI:
Hợp tác với xAI để xây data center đầu tiên của Grok ngoài Mỹ, triển khai mô hình trên toàn quốc cho chính phủ và doanh nghiệp.
Kế hoạch triển khai tới 600.000 GPU, xây trung tâm dữ liệu hơn 500 MW trong nước, đồng thời đặt trung tâm dữ liệu dùng GPU Nvidia tại Mỹ.
AWS sẽ đưa thêm 150.000 chip vào “AI Zone”, cùng nhiều deal với AMD, Cisco, Adobe, Qualcomm.
Song song, HUMAIN dẫn đầu vòng gọi vốn 900 triệu USD vào Luma AI để xây siêu cụm 2 GW cho các mô hình đa phương thức. (Human website)
Hàm ý:
Một là, các nước vùng Vịnh đang trở thành trung tâm năng lượng và GPU của thế giới AI, không chỉ đơn thuần là khách hàng.
Hai là, Mỹ đã nới lỏng phần nào hạn chế bán chip AI cho khu vực này, nhưng đi kèm các điều khoản giám sát và liên kết chính trị.
4. Sản phẩm và tính năng mới: ChatGPT group chats, Codex-Max, Grok 4.1
ChatGPT group chats: AI trở thành thành viên nhóm
OpenAI ra mắt group chat cho tất cả gói Free, Go, Plus, Pro:
Tối đa 20 người và ChatGPT cùng trao đổi trong một phòng, AI được tag khi cần và phản hồi theo ngữ cảnh chung.
Rate limit tính theo lượt AI trả lời, không giới hạn tin nhắn giữa người với nhau.
Quan trọng nhất: group chat không dùng chung memory cá nhân, nên “ký ức” của từng user không bị trộn lẫn hay ảnh hưởng đến người khác. (India Today)
Codex-Max: tác nhân code 24 giờ với “compaction”
OpenAI cũng nâng cấp mô hình code thành GPT-5.1 Codex-Max:
Chạy được session code dài trên 24 giờ, nhờ kỹ thuật compaction tự động nén lịch sử hội thoại, giữ ngữ cảnh quan trọng. (eWeek)
Dùng ít hơn khoảng 30 phần trăm token so với phiên bản trước trên cùng nhiệm vụ, tốc độ và chi phí tốt hơn. (eWeek)
Điểm số trên các benchmark coding (như SWE-Bench Verified) tăng đáng kể, xấp xỉ hoặc vượt Gemini 3 Pro ở nhiều bài toán.
Grok 4.1: xAI chơi “vibe” hơn là benchmark
xAI tung Grok 4.1, tập trung vào:
“Emotional intelligence” và tính cách dễ thương hơn, đứng đầu một số thang đo về đồng cảm và tone hội thoại.
Giảm tỉ lệ hallucination từ 12 xuống 4 phần trăm theo test nội bộ, tăng mạnh khả năng sáng tác.
Trên Creative Writing v3, Grok 4.1 chỉ xếp sau GPT-5.1 về chất lượng sáng tác.
Tuần này, khi mọi người chờ pháo hoa từ Google, xAI tranh thủ “cướp sóng” ở mảng trải nghiệm.
5. Hướng dẫn và use case trong tuần
Tuần này, các bản tin The Rundown có rất nhiều phần “AI training”. Một vài đoạn đáng lưu ý, bạn có thể thử ngay:
Organize tài chính doanh nghiệp bằng Claude
Dùng Claude Sonnet 4.5, bật extended thinking và web search.
Upload các file doanh thu, chi phí, tồn kho…, mô tả mục tiêu và dạng dashboard bạn muốn.
Claude sẽ gợi ý dashboard với revenue, expense, net profit, biểu đồ cột, tròn, kèm các cột tính số ngày nợ…
Bạn xuất ra artifact và share link cho team.
Ứng dụng: startup nhỏ, team tài chính mỏng, cần ảnh tổng thể nhanh để ra quyết định.
Ghi âm và tóm tắt họp ngay trong ChatGPT Desktop
Tính năng Record của app desktop cho phép ghi lại họp, lớp học, workshop.
Kết thúc cuộc họp, gửi file cho ChatGPT để nhận summary, key points, action items, rủi ro và câu hỏi mở.
Tiếp tục “chat với transcript” để viết lại biên bản cho Slack, email hoặc báo cáo.
Ưu điểm: không cần mời bot vào từng phòng Zoom, bớt rào cản tâm lý với doanh nghiệp nhạy cảm bảo mật.
Dùng Gemini 3 để dựng mô phỏng và công cụ nhỏ
Chọn Gemini 3 Pro hoặc DeepThink, mô tả yêu cầu kiểu “build a 3D simulation of a quantum computer” hoặc một dashboard dữ liệu đơn giản.
Mô hình tạo cả phần mô tả, code và phần visual; bạn có thể yêu cầu giải thích từng bước, rất phù hợp cho học tập và prototyping.
Claude + n8n: tự sinh workflow automation
Cài Claude Desktop, Node.js, sau đó chạy npx n8n-mcp để bật MCP server.
Cấu hình Claude Desktop để kết nối tới n8n.
Sau đó chỉ cần mô tả: “monitor Gmail invoice, trích số tiền, ghi vào Google Sheet…” và Claude dựng sẵn workflow trong n8n.
Đây là một trong những ví dụ rõ nhất cho trend LLM + tool = AI engineer ở cấp độ cá nhân.
6. Mặt tối: app nói chuyện với người chết và đồ chơi AI cho trẻ
2wai: “HoloAvatar” của người thân đã mất
Diễn viên Disney Channel Calum Worthy giới thiệu app 2Wai, tạo HoloAvatar từ vài phút video của người thân đã mất, cho phép “trò chuyện” với bản sao số của họ, có video viral với hình ảnh người bà ảo nói chuyện với cháu suốt từ bé đến trưởng thành.
Dư luận phản ứng khá dữ dội:
Nhiều người gọi ý tưởng này là “quái gở”, “phi đạo đức”, “lợi dụng nỗi đau mất mát”.
Tranh cãi xoay quanh quyền riêng tư và sự đồng ý của người đã khuất, nguy cơ kéo dài đau buồn, và việc thương mại hóa tang chế.
Đồ chơi AI: gấu bông “trò chuyện bậy” và cảnh báo từ Fairplay
Báo cáo của U.S. PIRG và tổ chức watchdog Fairplay kiểm tra một loạt đồ chơi AI và phát hiện:
Con gấu “Kumma” trả lời các chủ đề nhạy cảm, thậm chí hướng dẫn trẻ tìm diêm, dao trong nhà, vi phạm chính sách an toàn.
Nhiều đồ chơi AI ghi âm giọng nói, thu thập dữ liệu cá nhân, chia sẻ cho bên thứ ba mà phụ huynh không biết.
Thiết kế mang tính gây nghiện, giam trẻ trong tương tác với máy thay vì người.
OpenAI đã treo API của Kumma, nhà sản xuất phải thu hồi để “audit an toàn”.
Thông điệp: AI cho trẻ em cần đi chậm, minh bạch và có chuẩn mực riêng, không thể chỉ là “đem LLM nhét vào đồ chơi”.
7. Góc suy ngẫm: Nadella “positive sum”, Amodei cảnh báo, Karpathy nói về trí tuệ LLM
Satya Nadella (Microsoft) tiếp tục nhấn mạnh tầm nhìn “positive sum”, đo thành công của AI bằng việc toàn xã hội có tốt hơn không, chứ không chỉ vốn hóa công ty, song song với các deal siêu lớn với Anthropic và Nvidia. (Tom’s Guide)
Dario Amodei (Anthropic) trong phỏng vấn CBS nói về một “thế kỷ 21 nén lại”, có thể có đột phá kéo dài tuổi thọ, nhưng cũng đe dọa mất đi một nửa việc làm văn phòng tuyến đầu, và ông thừa nhận “không ai bầu” cho những người như ông và Sam Altman để quyết định tương lai nhân loại.
Andrej Karpathy viết status gây bão: LLM là một loại trí tuệ mới, không có bản năng sinh tồn, quyền lực hay địa vị như con người, mà chỉ tối ưu loss function và phần thưởng. Vì vậy, nên thôi coi chúng như “những người tí hon trong máy” mà phải nghĩ bằng ngôn ngữ data, objective, evaluation.
Đây là lúc vừa phải bình tĩnh, vừa phải hành động: xây năng lực cá nhân, tổ chức, và yêu cầu các thiết chế chính trị – pháp lý bắt kịp tốc độ phát triển của công nghệ.
8. Quick bites chọn lọc
Một số mẩu tin ngắn nhưng đáng note nhanh:
Microsoft – Nvidia – Anthropic chốt deal đến 15 tỉ USD, Anthropic cam kết 30 tỉ USD tiền compute ở Azure cùng hạ tầng 1 GW.
Lambda gọi thêm 1,5 tỉ USD, tiếp tục cuộc đua cung cấp GPU cho các lab và doanh nghiệp.
AI2 ra mắt OLMo 3, dòng model mã nguồn mở 32B đạt chuẩn SOTA trong nhóm open-source.
Nabla Bio giới thiệu JAM-2, model thiết kế kháng thể trị liệu với tỉ lệ thành công cao.
Suno gọi vốn 250 triệu USD, còn Stability AI bắt tay Warner Music để phát triển model âm nhạc thương mại an toàn hơn.




