Nhịp AI – Bản tin tuần 32
Tuần 31 (từ 28/07/2025-03/08/2025) năm 2025 đánh dấu những bước tiến đáng kể trong ngành AI với loạt đột phá từ các nghiên cứu học thuật đến ứng dụng thương mại.
📰 Tổng quan tuần 32
(04/08/2025- 10/08/2025)
🔥 OpenAI phát hành bộ mô hình open-weight đầu tiên từ thời GPT-2
Tóm tắt: OpenAI giới thiệu gpt-oss-120B và gpt-oss-20B, lần đầu công bố trọng số và mã nguồn kể từ GPT-2, với giấy phép Apache 2.0 cho phép thương mại hóa và tái phân phối.
Chi tiết:
• gpt-oss-120B là mô hình mixture-of-experts với 117B tham số, chỉ kích hoạt 5.1B mỗi bước, giúp giảm chi phí suy luận mà vẫn đạt gần chất lượng mô hình thương mại.
• gpt-oss-20B đủ nhỏ để chạy trên thiết bị cá nhân có ≥16GB RAM.
• Hỗ trợ chain-of-thought mở, cho phép điều chỉnh mức độ suy luận (thấp, trung bình, cao) và tích hợp gọi công cụ (trình duyệt, Python, API).
• Hiệu năng toán học nổi bật: đạt 97.9% trên AIME 2025, gần ngang o4-mini.
• Lợi ích lớn về an toàn: CoT thô giúp phát hiện hành vi rủi ro, tránh “tô hồng” suy luận khi giám sát trực tiếp.
Vì sao quan trọng: Động thái này đưa sức mạnh gần mô hình frontier vào cộng đồng mã nguồn mở, tạo nền tảng minh bạch cho nghiên cứu và phát triển AI an toàn.
🏆 Anthropic ra mắt Claude Opus 4.1 vượt trội về lập trình và suy luận
Tóm tắt: Phiên bản mới Claude Opus 4.1 nâng cấp đáng kể khả năng coding, reasoning và tác vụ agentic, hiện có qua Claude Code, API, Amazon Bedrock và Google Cloud Vertex AI.
Chi tiết:
• Đạt 74.5% SWE-Bench, vượt Gemini 2.5 Pro và OpenAI o3.
• Tăng 1 độ lệch chuẩn so với Opus 4 trên benchmark lập trình junior developer.
• Rakuten đánh giá cao độ chính xác khi sửa lỗi trong codebase lớn mà không gây lỗi mới.
• Developer chỉ cần thay tên mô hình sang claude-opus-4-1-20250805
là chạy được ngay.
Vì sao quan trọng: Opus 4.1 giữ vị trí hàng đầu trong AI lập trình, tăng sức cạnh tranh với GPT-5 và Gemini.
📡 Google DeepMind ra mắt Genie 3 – tạo thế giới 3D tương tác từ văn bản
Tóm tắt: Genie 3 biến một câu lệnh văn bản thành môi trường 3D tương tác, chạy 24fps ở 720p trong ~1 phút, tạo bước nhảy từ video render sang engine game thời gian thực cho nghiên cứu agent.
Chi tiết:
• Duy trì tính nhất quán ~60 giây, vượt xa giới hạn 10 giây của Genie 2.
• Cho phép điều khiển trực tiếp và thay đổi cảnh tức thì (“make it snow”).
• Không cần mesh 3D hay render offline, chỉ dùng một mạng nơ-ron và bộ nhớ tạm.
• Tận dụng attention window tùy chỉnh để truy xuất ngữ cảnh nhanh, giữ tốc độ thực.
Vì sao quan trọng: Đây là bước tiến lớn để huấn luyện AI agent trong môi trường vật lý ảo, hướng tới AGI.
🥉 OpenAI chính thức ra mắt GPT-5, nâng ChatGPT lên tầm “PhD-level”
Tóm tắt: GPT-5 nay có mặt ở mọi gói ChatGPT, với router tự động chuyển sang chế độ reasoning cho yêu cầu phức tạp.
Chi tiết:
• Context window: 8K (Free), 32K (Plus), 128K (Pro); API hỗ trợ tới 400K token.
• Giới hạn sử dụng khác nhau cho từng gói, Pro không giới hạn.
• Cải thiện mạnh khả năng lập trình, viết và suy luận.
• Đơn giản hóa giao diện: hợp nhất mô hình thay vì tách reasoning model.
Vì sao quan trọng: GPT-5 đưa OpenAI trở lại vị trí dẫn đầu AI frontier, cạnh tranh trực tiếp với Claude và Gemini.
🧠 Google Research giảm 10.000 lần dữ liệu huấn luyện LLM
Tóm tắt: Phương pháp active learning mới giúp fine-tune LLM chỉ cần 250-450 nhãn chuyên gia thay vì 100K nhãn crowdsourced.
Chi tiết:
• Lọc ví dụ ở vùng ranh quyết định (decision boundary) để tối đa giá trị mỗi nhãn.
• Tiết kiệm chi phí, cập nhật nhanh khi chính sách thay đổi.
• Duy trì chất lượng ngang hoặc cao hơn tập dữ liệu lớn.
Vì sao quan trọng: Giảm đáng kể rào cản dữ liệu cho huấn luyện AI, đặc biệt trong các tác vụ an toàn và kiểm duyệt nội dung.
🛡️ METR: GPT-5 không đạt ngưỡng rủi ro tự động nguy hiểm + Google ra mắt Perch 2.0
Tóm tắt: METR đánh giá GPT-5 có thể làm việc tự động ~2h17m ở mức 50% thành công, thấp hơn nhiều ngưỡng gây lo ngại. Đồng thời, Google phát hành Perch 2.0, AI mã nguồn mở phân tích âm thanh động vật.
Chi tiết:
• GPT-5 chưa đủ khả năng thực hiện tác vụ R&D AI, replication hay sabotage ở quy mô dài ngày.
• Perch 2.0 nhận diện 14.597 loài từ 1,54M bản ghi, chạy trên EfficientNet-B3 chỉ 12M tham số.
Vì sao quan trọng: Cập nhật này vừa củng cố đánh giá an toàn GPT-5, vừa mở ra cơ hội giám sát sinh học giá rẻ, nhanh chóng.
🔄 OpenAI đưa GPT-4o trở lại tùy chọn ChatGPT + GPT-5 đứng thứ 5 trên SimpleBench
Tóm tắt: Sau khi mặc định GPT-5, OpenAI khôi phục GPT-4o cho người dùng Plus do phản hồi tiêu cực. GPT-5 đạt 56.7% trên SimpleBench, xếp thứ 5.
Chi tiết:
• Người dùng có thể bật tùy chọn “Show legacy model” để chọn 4o.
• GPT-4o được ưa chuộng cho tác vụ sáng tạo và đa phương tiện.
• SimpleBench tập trung vào suy luận đời thường, nơi con người vẫn vượt trội.
Vì sao quan trọng: Cho thấy tầm quan trọng của “thói quen” và “phong cách” AI đối với người dùng, cùng khoảng trống AI cần cải thiện.
🇺🇸 OpenAI cung cấp ChatGPT Enterprise cho cơ quan liên bang Mỹ với giá 1 USD/năm
Tóm tắt: Thỏa thuận với GSA cho phép mọi cơ quan thuộc nhánh hành pháp liên bang Mỹ dùng ChatGPT Enterprise chỉ với 1 USD.
Chi tiết:
• Bao gồm quyền truy cập mô hình cao cấp, cộng đồng người dùng chính phủ, tài nguyên đào tạo.
• Bảo mật dữ liệu: không dùng dữ liệu chính phủ để huấn luyện.
• Thời gian dùng không giới hạn trong 60 ngày cho tính năng nâng cao.
Vì sao quan trọng: Mở đường cho AI thâm nhập sâu vào quy trình hành chính liên bang, tạo áp lực cạnh tranh cho các đối thủ.
🎓 Google ra mắt chế độ AI hướng dẫn học tập & miễn phí AI Pro Plan cho sinh viên
Tóm tắt: Google triển khai Guided Learning cho Gemini, đóng vai trò bạn học, hướng dẫn từng bước thay vì trả lời trực tiếp, đồng thời miễn phí gói AI Pro Plan trị giá $250/tháng cho sinh viên ở một số nước.
Chi tiết:
• Tích hợp hình ảnh, video, quiz tương tác.
• Hợp tác với chuyên gia giáo dục để tăng kỹ năng tư duy phản biện.
• Đầu tư 1 tỷ USD trong 3 năm đào tạo AI tại các trường đại học Mỹ.
Vì sao quan trọng: Định hình lại AI giáo dục theo hướng hỗ trợ học tập chủ động, tránh nguy cơ “làm hộ” kiến thức.
📩 Bạn đang dùng AI thế nào trong công việc và cuộc sống? Hãy chia sẻ câu chuyện của bạn để có cơ hội xuất hiện trong bản tin tuần sau.