Home
Categories
EXPLORE
True Crime
Comedy
Business
Society & Culture
Health & Fitness
Sports
Technology
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Podjoint Logo
US
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts125/v4/ff/cf/19/ffcf195e-100a-381f-f9c3-ec7baad56d16/mza_3528149599659607259.jpg/600x600bb.jpg
Trí Tuệ Nhân Tạo
trituenhantao.io
40 episodes
3 days ago
Podcast chính thức của trituenhantao.io, nơi chia sẻ thông tin, kiến thức, kinh nghiệm học tập và triển khai các chương trình và dự án sử dụng trí tuệ nhân tạo trên thế giới.
Show more...
Technology
RSS
All content for Trí Tuệ Nhân Tạo is the property of trituenhantao.io and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Podcast chính thức của trituenhantao.io, nơi chia sẻ thông tin, kiến thức, kinh nghiệm học tập và triển khai các chương trình và dự án sử dụng trí tuệ nhân tạo trên thế giới.
Show more...
Technology
https://d3t3ozftmdmh3i.cloudfront.net/production/podcast_uploaded/2933114/2933114-1579410108502-aa5f18a3e6bc6.jpg
DeepSeek-R1: Tăng Cường Khả Năng Suy Luận LLMs
Trí Tuệ Nhân Tạo
7 minutes 4 seconds
6 months ago
DeepSeek-R1: Tăng Cường Khả Năng Suy Luận LLMs

Bài viết giới thiệu DeepSeek-R1, một mô hình ngôn ngữ lớn thế hệ mới được phát triển thông qua học tăng cường (RL) để nâng cao khả năng suy luận. Mô hình đầu tiên, DeepSeek-R1-Zero, được huấn luyện chỉ bằng RL và cho thấy khả năng suy luận ấn tượng, nhưng gặp vấn đề về tính dễ đọc. DeepSeek-R1 giải quyết những vấn đề này bằng cách kết hợp huấn luyện đa giai đoạn và dữ liệu khởi tạo trước RL, đạt hiệu suất suy luận ngang ngửa với OpenAI-o1-1217 trên các điểm chuẩn. Ngoài ra, các nhà nghiên cứu đã công khai các mô hình nhỏ hơn được tinh chỉnh từ DeepSeek-R1, chứng minh hiệu quả của việc tinh chỉnh khả năng suy luận từ các mô hình lớn hơn.

Trí Tuệ Nhân Tạo
Podcast chính thức của trituenhantao.io, nơi chia sẻ thông tin, kiến thức, kinh nghiệm học tập và triển khai các chương trình và dự án sử dụng trí tuệ nhân tạo trên thế giới.