Nhịp AI – Bản tin tuần 31
Tuần 31 (từ 28/07/2025-03/08/2025) năm 2025 đánh dấu những bước tiến đáng kể trong ngành AI với loạt đột phá từ các nghiên cứu học thuật đến ứng dụng thương mại.
Tổng quan tuần 31 (28/7/2025- 03/08/2025)
Tuần 31 năm 2025 đánh dấu những bước tiến đáng kể trong ngành AI với loạt đột phá từ các nghiên cứu học thuật đến ứng dụng thương mại. Từ DeepSeek giành giải thưởng Best Paper tại hội nghị ACL 2025 [1] với kỹ thuật Native Sparse Attention cho đến ChatGPT Study Mode [5] nhắm vào thị trường giáo dục 80 tỷ USD, tuần này chứng kiến sự cạnh tranh gay gắt giữa các gã khổng lồ công nghệ và những đổi mới mang tính đột phá.
1. Top Papers Tuần 31: Các Nghiên Cứu AI Đột Phá
Tóm tắt
Tuần kết thúc 28/7/2025 ghi nhận nhiều nghiên cứu AI đột phá, đặc biệt với tuyên bố "AlphaGo Moment" cho việc khám phá kiến trúc mô hình tự động và lý thuyết SETOL mới về deep learning.
Điểm nổi bật
ASI-ARCH System: Hệ thống tự động khám phá kiến trúc mô hình với 3 AI agent (Researcher, Engineer, Analyst), tìm ra 106 thiết kế linear-attention đạt kỷ lục mới
SETOL Theory: Lý thuyết Semi-Empirical về deep learning sử dụng thuộc tính phổ của weight matrices để dự đoán khả năng tổng quát hóa [16]
Gemini 2.5 Pro: Đạt điểm 5/6 tại IMO 2025 với phương pháp generate-criticize-repair
Diffusion vs Autoregressive: Mô hình diffusion vượt trội trong môi trường ít dữ liệu với data half-life 513 epochs so với 32 epochs
In-Context Learning: Giải thích cơ chế học không cần cập nhật trọng số thông qua rank-1 patches
Chi tiết kỹ thuật
ASI-ARCH đã thực hiện 1,773 thí nghiệm với 20,000 GPU hours [15], cho thấy mối quan hệ tuyến tính giữa compute và số lượng SOTA hits
SETOL sử dụng điểm Alpha gần 2 để chỉ ra cân bằng tối ưu signal/noise
Diffusion model 2.3B parameters huấn luyện trên 500M tokens vượt trội trên nhiều benchmark
In-context learning kết nối với LoRA-style adaptations, tiết kiệm 2,000× storage
2. GLM-4.5: Model Open-Source từ Trung Quốc vượt mặt DeepSeek và GPT-4
Tóm tắt
Zhipu AI ra mắt GLM-4.5 với kiến trúc mixture-of-experts đột phá [3], chỉ sử dụng 32B/355B parameters active và đạt top 3 trên 12 benchmark AI, đồng thời giảm 50% chi phí GPU so với DeepSeek.
Điểm nổi bật
Kiến trúc đột phá: Mixture-of-experts "tall and narrow" với chỉ 32B/355B weights active, tiết kiệm memory và chi phí [4]
Dual modes: "Thinking" và "non-thinking" modes để tối ưu compute cho từng loại câu hỏi
Hiệu suất vượt trội:
MMLU Pro: 84.6%
AIME24: 91.0%
GPQA: 79.1%
SWE-bench Verified: 64.2%
Tối ưu hạ tầng: Chạy trên 8 Nvidia H20 chips (50% ít hơn DeepSeek)
Context window: 128K tokens cho xử lý tài liệu dài
Ý nghĩa thị trường
Trung Quốc đã phát hành 1,509 [20] LLM tính đến tháng 7/2025, dẫn đầu thế giới [19]
Chiến lược open-source để cạnh tranh với các công ty phương Tây
Chứng minh lệnh trừng phạt chip của Mỹ không ngăn được tiến bộ AI của Trung Quốc
Z.ai huy động 1.5 tỷ USD từ Alibaba, Tencent và quỹ chính phủ Trung Quốc
3. ChatGPT Study Mode: Cách mạng giáo dục
Tóm tắt
OpenAI ra mắt Study Mode [5] cho ChatGPT, áp dụng phương pháp Socratic questioning để khuyến khích tư duy phản biện thay vì đưa ra câu trả lời trực tiếp, nhắm vào thị trường ed-tech 80.5 tỷ USD.
Điểm nổi bật
Phương pháp Socratic: Từ chối đưa câu trả lời trực tiếp, thay vào đó đặt câu hỏi gợi mở
Hỗ trợ đa cấp độ: Thích ứng từ novice đến advanced learners
Tích hợp giáo dục: Phát triển với 40+ tổ chức giáo dục
Khả năng truy cập: Có sẵn cho Free, Plus, Pro, và Team users
Tính năng kỹ thuật
Custom system instructions được phát triển với các tổ chức giáo dục
Thích ứng độ sâu học tập theo từng người dùng
Khuyến khích step-by-step guidance thay vì direct answers
Tích hợp với ChatGPT Edu sắp ra mắt [6]
Cạnh tranh thị trường
Google NotebookLM bổ sung AI Video Summaries với narrated video summaries
4. Stanford AI Virtual Scientists: Tự động hóa nghiên cứu sinh học
Tóm tắt
Stanford và Chan Zuckerberg Biohub phát triển hệ thống AI "virtual scientists" [7] có khả năng tự động thực hiện nghiên cứu sinh học phức tạp với chỉ 1% can thiệp từ con người, tạo ra 92 ứng viên nanobody cho COVID-19 trong vài ngày
Điểm nổi bật
Tự động hóa cao: 1% human intervention, 99% tự động
Kết quả ấn tượng: 92 nanobody candidates với 2 candidates vượt trội hơn antibodies hiện tại [8]
Cấu trúc lab ảo: Mô phỏng cấu trúc lab thực với các AI agent chuyên biệt
Tích hợp công cụ: Sử dụng AlphaFold, ESM, và Rosetta cho phân tích protein
Quy trình kỹ thuật
Principal Investigator AI chọn bài toán nghiên cứu
Specialized Agents collaboration:
Immunology agents
Computational biology agents
Critique agents
Tool Integration:
ESM scores protein binding potential
AlphaFold-Multimer dự đoán cấu trúc 3D
Rosetta tinh chỉnh molecular shapes
Ứng dụng rộng rãi
Nghiên cứu bệnh học nhanh chóng
Drug discovery tự động
Protein engineering
Biomedical research acceleration
5. DeepSeek giành Best Paper Award tại ACL 2025
Tóm tắt
DeepSeek giành giải Best Paper [1] tại hội nghị ACL 2025 với nghiên cứu "Native Sparse Attention" đạt tốc độ decode nhanh hơn 11.6X trên input 64K tokens, đồng thời gây chấn động thị trường với mô hình R1 huấn luyện chỉ với 6 triệu USD.
Đột phá kỹ thuật
Native Sparse Attention (NSA) [2]: Thay thế sparse attention tĩnh bằng trainable filters
Three-lane architecture:
Compressed chunks: Tóm tắt mỗi 32 tokens cho global context
Top-n picker: Giữ lại 16 blocks 64-token quan trọng nhất
Rolling window: Duy trì 512 tokens cuối cho local fluency
Hardware optimization: Triton kernels tối ưu cho GPU tensor-cores
Hiệu suất vượt trội
Tốc độ: Forward pass nhanh hơn 9X, back-propagation nhanh hơn 6X
Độ chính xác: LongBench +0.032 điểm, AIME-24 từ 0.092 lên 0.146
Hiệu quả: Chỉ 1/11 memory demand so với dense attention
Tác động thị trường
Mô hình R1 gây "paper loss" 1 nghìn tỷ USD trong một đêm [18]
Nvidia mất 593 tỷ USD market cap [17]
Huấn luyện với dưới 6 triệu USD sử dụng H800 GPUs tái sử dụng
6. Google Deep Think AI: Olympic-Level Mathematical Reasoning
Tóm tắt
Google ra mắt Deep Think AI đạt huy chương Olympic toán học (35/42 điểm IMO 2025), hiện có sẵn cho người dùng qua gói AI Ultra với giá 124.99-249.99 USD/tháng, sử dụng kiến trúc parallel thinking và reinforcement learning.
Tính năng nổi bật
Parallel Thinking: Đồng thời tạo và tinh chỉnh nhiều ý tưởng ứng viên
Reinforcement Learning: Thưởng cho tính đúng đắn multi-step thay vì fluency
Context Window: 1M tokens input, 192K tokens output
Tool Integration: Code execution, Google Search tích hợp
Phiên bản sản phẩm
Bronze: Cho người dùng thông thường, tối ưu cho tác vụ hàng ngày
Gold: Dành cho các nhà toán học, đạt 35/42 IMO 2025
Kiến trúc kỹ thuật
Sparse MoE Transformer: Chỉ kích hoạt experts liên quan cho mỗi token
Multimodal Training: Corpus đa phương thức + dataset math/theorem-proving
Hardware: Huấn luyện trên TPU pods qua hệ thống Pathways
Ứng dụng thực tế
Algorithm design
Scientific literature analysis
Iterative product development
Advanced mathematical research
7. Anthropic: Khám phá "Personality" của AI qua Neural Directions
Tóm tắt
Anthropic công bố nghiên cứu đột phá về "persona vectors" - các hướng neural kiểm soát hành vi AI như sycophancy hoặc hallucination, cho phép giám sát real-time và điều khiển hành vi trong quá trình inference.
Đột phá khoa học
Persona Vectors: Neural directions kiểm soát personality traits của AI
Real-time Monitoring: Giám sát hành vi không mong muốn trong inference
Behavioral Control: Điều khiển qua vector addition/subtraction
Training Data Filtering: Ngăn chặn trait emergence từ giai đoạn huấn luyện
Cơ chế kỹ thuật
Chạy model với prompts mâu thuẫn (e.g., "be evil" vs "be helpful")
Tính toán activation difference vector
Áp dụng vector như control knob trong inference/training
Ví dụ ứng dụng
Trừ "evil" vector giảm malicious outputs mà không ảnh hưởng core capabilities
Thêm "helpful" vector tăng cường tính hữu ích
Filter training data để ngăn unwanted behaviors
Bối cảnh ngành
Meta đề xuất 1 tỷ USD+ cho cofounder Thinking Machines Andrew Tulloch (không thành công)
Mô hình o3 của OpenAI giải được 4/48 bài toán Tier 4 FrontierMath (elite human level) [21]
McKinsey thay thế 40% công việc bằng AI agents (12,000+ chat-style agents)
Nhận định tổng quan tuần 31
Tuần 31 năm 2025 đánh dấu một giai đoạn chuyển mình quan trọng của ngành AI với ba xu hướng chính:
1. Cạnh tranh Đông-Tây ngày càng gay gắt: GLM-4.5 của Trung Quốc và DeepSeek R1 chứng minh sức mạnh của chiến lược open-source và tối ưu hóa chi phí, thách thức vị thế của các mô hình phương Tây.
2. AI chuyên biệt và ứng dụng thực tế: Từ Study Mode của ChatGPT nhắm vào giáo dục đến Virtual Scientists của Stanford cho nghiên cứu sinh học, AI đang được tùy chỉnh cho từng lĩnh vực cụ thể.
3. Đột phá về hiệu quả và control: Native Sparse Attention của DeepSeek và Persona Vectors của Anthropic cho thấy ngành đang tập trung vào việc làm AI hiệu quả hơn và có thể kiểm soát được hơn.
Những phát triển này báo hiệu một giai đoạn mới của AI - không chỉ mạnh mẽ mà còn thực tế, có thể kiểm soát và tiếp cận được với nhiều ứng dụng đa dạng.
Tham khảo
[1] South China Morning Post, "DeepSeek founder shares best paper award at top global AI research conference," SCMP, Jul. 2025. [Online]. Available: https://www.scmp.com/tech/big-tech/article/3320255/deepseek-founder-shares-best-paper-award-top-global-ai-research-conference
[2] W. Liang et al., "Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention," in Proc. Annual Meeting of the Association for Computational Linguistics (ACL), 2025. [Online]. Available: https://aclanthology.org/2025.acl-long.1126/
[3] Z.ai, "GLM-4.5: Reasoning, Coding, and Agentic Abilities," Z.ai Blog, Jul. 28, 2025. [Online]. Available: https://z.ai/blog/glm-4.5
[4] PR Newswire, "Z.ai Releases GLM-4.5, Setting New Standards for AI Performance and Accessibility While Improving Affordability," Jul. 28, 2025. [Online]. Available: https://www.prnewswire.com/news-releases/zai-releases-glm-4-5--setting-new-standards-for-ai-performance-and-accessibility-while-improving-affordability-302514803.html
[5] OpenAI, "Introducing study mode," OpenAI Blog, Jul. 2025. [Online]. Available: https://openai.com/index/chatgpt-study-mode/
[6] K. Wiggers, "OpenAI launches Study Mode in ChatGPT," TechCrunch, Jul. 29, 2025. [Online]. Available: https://techcrunch.com/2025/07/29/openai-launches-study-mode-in-chatgpt/
[7] Stanford Medicine, "Researchers create 'virtual scientists' to solve complex biological problems," Stanford Medicine News, Jul. 2025. [Online]. Available: https://med.stanford.edu/news/all-news/2025/07/virtual-scientist.html
[8] A. Ghafarollahi et al., "The Virtual Lab: AI Agents Design New SARS-CoV-2 Nanobodies," bioRxiv preprint, Nov. 2024. [Online]. Available: https://www.biorxiv.org/content/10.1101/2024.11.11.623004v1
[9] Google DeepMind, "Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad," DeepMind Blog, Jul. 2025. [Online]. Available: https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
[10] Google, "Gemini 2.5: Deep Think is now rolling out," Google Blog, Aug. 1, 2025. [Online]. Available: https://blog.google/products/gemini/gemini-2-5-deep-think/
[11] Anthropic, "Persona vectors: Monitoring and controlling character traits in language models," Anthropic Research, Aug. 2025. [Online]. Available: https://www.anthropic.com/research/persona-vectors
[12] The Wall Street Journal, "AI Is Coming for the Consultants. Inside McKinsey, 'This Is Existential,'" WSJ, Aug. 2, 2025. [Online]. Available: https://www.wsj.com/tech/ai/mckinsey-consulting-firms-ai-strategy-89fbf1be
[13] LinkedIn News, "McKinsey leans into AI," LinkedIn, Aug. 2, 2025. [Online]. Available: https://www.linkedin.com/news/story/mckinsey-leans-into-ai-6481020/
[14] GAIR-NLP, "ASI-Arch: AlphaGo Moment for Model Architecture Discovery," GitHub Repository, 2025. [Online]. Available: https://github.com/GAIR-NLP/ASI-Arch
[15] Anonymous et al., "AlphaGo Moment for Model Architecture Discovery," arXiv preprint arXiv:2507.18074, Jul. 24, 2025. [Online]. Available: https://arxiv.org/abs/2507.18074
[16] Anonymous et al., "SETOL: A Semi-Empirical Theory of (Deep) Learning," arXiv preprint arXiv:2507.17912, Jul. 23, 2025. [Online]. Available: http://arxiv.org/abs/2507.17912
[17] Reuters, "DeepSeek sparks AI stock selloff; Nvidia posts record market-cap loss," Reuters, Jan. 27, 2025. [Online]. Available: https://www.reuters.com/technology/chinas-deepseek-sets-off-ai-market-rout-2025-01-27/
[18] The Guardian, "'Sputnik moment': $1tn wiped off US stocks after Chinese firm launches free AI model," The Guardian, Jan. 27, 2025. [Online]. Available: https://www.theguardian.com/business/2025/jan/27/tech-shares-asia-europe-fall-china-ai-deepseek
[19] Xinhua News Agency, "China tops global AI model count with over 1,500 large artificial intelligence models," Xinhua, Jul. 28, 2025. [Online]. Available: https://english.news.cn/20250728/ff93808c3b674349acc9cfee48f07774/c.html
[20] China Daily, "China tops global AI development with 1509 large models," China Daily, Jul. 28, 2025. [Online]. Available: https://global.chinadaily.com.cn/a/202507/28/WS6887269fa310c26fd717c174.html
[21] Epoch AI, "FrontierMath: LLM Benchmark for Advanced AI Math Reasoning," Epoch AI, 2024. [Online]. Available: https://epoch.ai/frontiermath