Google’s Gemini 2.5 Pro Vươn Lên: Thống Trị Bảng Xếp Hạng Lập Trình và Bài Test MENSA Trong Cuộc Chiến ‘IQ’ AI

Khám phá những thành tựu vượt trội của Gemini 2.5 Pro trong lĩnh vực trí tuệ nhân tạo, từ khả năng lập trình, phân tích suy luận, đến sự đa năng trong các dự án phức tạp.

Google’s Gemini 2.5 Pro Vươn Lên

Thống Trị Bảng Xếp Hạng Lập Trình và Bài Test MENSA Trong Cuộc Chiến ‘IQ’ AI

Google vừa công bố một bước đột phá ngoạn mục trong lĩnh vực trí tuệ nhân tạo với Gemini 2.5 Pro, một mô hình AI vượt trội trong việc lập trình và khả năng suy luận. Gemini 2.5 Pro đã vượt qua nhiều đối thủ như Claude tại WebDev Arena – một nền tảng nổi tiếng để đánh giá khả năng lập trình của các mô hình AI. Những thành tựu này đã củng cố vị thế của Google trong cuộc chiến AI toàn cầu.

Điểm Nổi Bật của Gemini 2.5 Pro

  • Gemini 2.5 Pro không chỉ nổi bật với khả năng lập trình vượt trội mà còn sở hữu khả năng phân tích tốt nhất trên các tiêu chuẩn kiểm tra suy luận phức tạp, bao gồm cả bài test MENSA và Humanity’s Last Exam. Chỉ số “IQ” của mô hình này đã vượt qua nhiều đối thủ, đạt 115 điểm trong các thử nghiệm ngoại tuyến, đưa Gemini vào nhóm ‘sáng trí’, vượt xa mức thông minh trung bình của con người từ 85 đến 114 điểm.
  • Đặc biệt, cửa sổ ngữ cảnh của Gemini 2.5 Pro có thể chứa tới 1 triệu token và sẽ được mở rộng lên tới 2 triệu, giúp cho việc hoạt động trên các dự án phức tạp và quy mô lớn dễ dàng hơn, một khả năng mà các đối thủ như ChatGPT hay Claude 3.7 Sonnet không thể sánh kịp với giới hạn chỉ 128K token.
  • Ngoài ra, Gemini 2.5 Pro còn vượt qua các thử nghiệm tập trung vào AI khác, với số điểm 86.7% trên bài kiểm tra toán AIME 2025 và 84.0% trong đánh giá khoa học GPQA. Trong Humanity’s Last Exam, Gemini 2.5 Pro đạt 18.8%, vượt trội so với mini (14%) của OpenAI và Claude 3.7 Sonnet (8.9%).

Phiên bản mới của Gemini 2.5 Pro hiện đã được phát hành miễn phí cho tất cả người dùng Gemini, mặc dù có giới hạn tần suất sử dụng. Google mô tả đây là một phiên bản ‘thử nghiệm’ của 2.5 Pro, thuộc dòng sản phẩm ‘thinking models’, một loại mô hình nhằm lý giải câu hỏi, thay vì chỉ tạo ra văn bản.

“Nếu bạn là một nhà phát triển đang tìm kiếm một công cụ mạnh mẽ, đa năng và hiệu quả về chi phí, Gemini 2.5 Pro là lựa chọn không thể bỏ qua trong hành trình chinh phục AI.”

Mặc dù chưa hoàn toàn đứng đầu trong mọi đánh giá, Gemini đã thu hút sự chú ý từ cộng đồng phát triển nhờ vào sự đa năng của mình. Mô hình có khả năng tạo ra ứng dụng phức tạp từ một yêu cầu đơn giản, xây dựng ứng dụng web tương tác, game endless runner, và các mô phỏng hình ảnh mà không cần hướng dẫn chi tiết.

Chi phí của Gemini 2.5 Pro rất cạnh tranh, chỉ với $2.50 cho mỗi triệu token nhập vào và $15.00 cho mỗi triệu token xuất ra. Mô hình này có khả năng xử lý tới 30,000 dòng mã trong gói kế hoạch Nâng Cao, làm cho nó trở thành lựa chọn phù hợp cho các dự án cấp doanh nghiệp. Khả năng đa phương tiện của Gemini – làm việc với văn bản, mã, âm thanh, hình ảnh, và video – cũng là một điểm cộng lớn so với các mô hình lập trình khác.

Leave a Reply

Your email address will not be published. Required fields are marked *