Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?

Kể từ khi xuất hiện, các mô hình ngôn ngữ lớn đã làm thay đổi cách người dùng tiếp cận và xử lý công việc hàng ngày. Giờ đây bạn có thể lên kế hoạch cho công việc hàng ngày cũng như trả lời các câu hỏi phức tạp. Nhiều người có thể nghĩ rằng các mô hình AI này là những giải pháp toàn diện cho mọi vấn đề hàng ngày. Tuy nhiên, có một điều bạn không thể kỳ vọng từ các mô hình AI này, đó là giải toán.

Đừng nhờ AI giải toán

Ngay cả những mô hình AI giỏi nhất về toán cũng có tỷ lệ chính xác khá thấp. Không chỉ dựa vào các mô hình AI thông thường, các nhà nghiên cứu tại Trường Đại học Thanh Hoa Trung Quốc còn huấn luyện một mô hình AI dành riêng cho các phép tính toán học có tên MathGLM để giải quyết các vấn đề toán học hóc búa.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 1. — Dù thông minh nhưng Google Bard (tiền thân của Gemini) vẫn không thể giải được phép toán nói trên

Trên thực tế, các mô hình AI hoàn toàn có thể học cách giải toán nếu được huấn luyện trên các bộ dữ liệu toán học lớn để nhận diện được các mô hình phép tính và khi kết hợp với những số nhỏ hơn sẽ cho ra những câu trả lời gần đúng.

Nếu chỉ xét riêng khả năng tính toán, MathGLM hoàn toàn vượt trội so với ChatGPT và GPT-4 của OpenAI. Tuy vậy, ngay cả với những phép tính có 5 chữ số, mức độ chính xác của mô hình AI 2 tỷ tham số này chỉ đạt 85,16%. Điều này trái ngược hoàn toàn với một chiếc máy tính thông thường khi nó luôn kết quả đúng với độ chính xác tới 100%.

Thậm chí khi con số tính toán trở nên lớn hơn, mức độ chính xác cũng giảm nhanh chóng. Nguyên nhân có thể là do các phép tính với những con số nhỏ hơn thường xuất hiện nhiều trong các bộ dữ liệu huấn luyện, do đó, mô hình có thể nhận diện và đưa ra kết quả dựa trên dữ liệu huấn luyện – thay vì thực sự thực hiện các phép tính.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 2. — Bảng thống kê cho thấy, con số trong phép tính càng dài, tỷ lệ chính xác khi giải toán của MathGLM càng giảm

Nếu dùng đúng cách, các mô hình AI vượt xa con người về khả năng tính toán

Tuy nhiên, các nhà nghiên cứu của Google đã chỉ ra rằng, nếu được kết hợp đúng cách, khả năng giải toán của các mô hình AI có thể vượt xa con người. Gần đây, Google đã giới thiệu một phương pháp mới gọi là FunSearch, kết hợp một mô hình ngôn ngữ lớn đã được huấn luyện trước với một công cụ ước lượng tự động. Phương pháp này nhằm ngăn ngừa hiện tượng ảo giác và các ý tưởng không chính xác của mô hình AI.

Về cơ bản, phương pháp này là một quy trình lặp lại kết hợp sự sáng tạo của một mô hình ngôn ngữ lớn với điều gì đó có thể bắt nó lùi lại một bước nếu phát hiện hướng đi của nó bị sai. Có thể các mô hình AI không giỏi toán, nhưng chúng rất khá trong khả năng sáng tạo.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 3. — Kết hợp nhiều công cụ với nhau, FunSearch của Google sẽ giúp giải được bài toán hóc búa hơn

Đối với các phép toán, FunSearch hoạt động bằng cách lấy mô tả về một bài toán dưới dạng các dòng code. Phần mô tả sẽ đưa ra một quy trình để đánh giá đầu ra và khởi chạy một nhóm các chương trình để tính toán lại. Với mỗi vòng lặp của FunSearch, hệ thông sẽ lựa chọn một số chương trình và nạp chúng vào một mô hình ngôn ngữ lớn – ví dụ như PaLM 2 – để xây dựng các chương trình mới trên đó. Những chương trình mới sẽ được lựa chọn để lặp lại, tạo ra một vòng lặp tự cải thiện.

Ví dụ trong một phép tính, FunSearch tìm ra được các tập hợp giới hạn lớn nhất, vượt xa các tập hợp nổi tiếng nhất của những nhà toán học lỗi lạc nhất thế giới. “Theo hiểu biết của tôi, đây là khám phá khoa học đầu tiên được phát hiện nên nhờ sử dụng một mô hình AI.” Các nhà nghiên cứu cho biết trong bài đăng trên tạp chí Nature.

Dù sao đi nữa, một chiếc máy tính vẫn tốt hơn

Nghiên cứu của Google cho thấy, nếu dùng đúng cách một mô hình ngôn ngữ vẫn có thể là một công cụ toán học mạnh mẽ, nhưng nó sẽ không thể giải quyết được một bài toán và tạo ra ý tưởng mới nếu không có sự trợ giúp từ bên ngoài.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 4.

Dù phương pháp FunSearch của các nhà nghiên cứu Google có thể giúp giải quyết các vấn đề toán học bằng cách tận dụng khả năng sáng tạo của mô hình AI, nó không đồng nghĩa với việc các mô hình AI thực sự giỏi toán. Phương pháp này chỉ định hướng cho khả năng sáng tạo của AI đúng hướng và tránh những ảo giác mà mô hình AI có thể tạo ra.

Có thể một mô hình AI sẽ rất có ích nếu bạn yêu cầu nó giải thích về một lý thuyết toán học nào đó, ví dụ như làm thế nào nhân nhiều ma trận với nhau. Nhưng nếu bạn yêu cầu chúng nhân các ma trận cho bạn, thì kết quả có thể sẽ hoàn toàn sai lệch.

Nói cách khác, bạn có thể yêu cầu các mô hình AI làm rất nhiều điều, nhưng để giải toán, tốt nhất bạn nên tìm một chiếc máy tính cầm tay.

Đây là 3 chòm sao tiền bạc hanh thông, tình duyên rực rỡ nhất nửa cuối tháng 5

Thứ Hai, 19/05/25 8:25 Sáng

Tử vi - Phong Thủy

Nửa cuối tháng 5, 3 chòm sao này hanh thông hơn, cũng kiếm được nhiều tiền hơn. Nửa cuối tháng 5 là thời điểm vũ trụ rung chuyển...

Dự đoán vận trình tình duyên của 12 con giáp trong tuần mới 19/5 – 25/5

Chủ Nhật, 18/05/25 3:25 Chiều

Tử vi - Phong Thủy

Dự đoán tình duyên của 12 con giáp trong tuần mới. Dưới đây là dự đoán chuyện tình duyên, tình yêu của 12 con giáp trong tuần từ...

Mặc kệ mâu thuẫn giữa mình và mẹ chồng, tôi vẫn để chồng đưa con về thăm ông bà, thế nhưng bà lại cho rằng tôi mưu đồ với nhà chồng

Chủ Nhật, 18/05/25 3:25 Chiều

Tâm sự

Có lẽ, tình cảm gia đình đôi khi là thứ không thể ép buộc. Tôi vẫn nhớ rõ cái ngày mình nằm trên bàn sinh, mồ hôi đẫm...

Không ai ngờ Hyun Bin trên thảm đỏ và ở nhà lại khác xa đến vậy

Thứ Tư, 14/05/25 11:17 Sáng

Hậu Trường

Có thể thấy, Hyun Bin không mấy bận tâm với ngoại hình khi ở nhà của mình. Cách đây hơn 1 tuần, Hyun Bin từng khiến người hâm...

“Tứ tiểu thư” đẹp nhất Trung Quốc hiện tại: Mỹ nhân cổ trang xứng đáng phong thần, nhan sắc lẫn phối đồ đều mướt mắt

Thứ Ba, 13/05/25 10:45 Chiều

Giải Trí

Nhan sắc của mỹ nhân Hoa ngữ này ở bộ phim mới rất đẹp, khó lòng chê bai. Trong số các dự án phim cổ trang đang quay...

Phim Trung Quốc mới chiếu đã gây sốt vì quá hay: Nữ chính có cảnh khóc đầy mỹ cảm, đang viral khắp MXH

Thứ Ba, 13/05/25 10:45 Chiều

Phim Ảnh

Không chỉ xinh đẹp, mỹ nhân Trung Quốc này còn có khả năng diễn cảnh khóc cực đỉnh. Cuối cùng thì ngày Khom Lưng (Chiết Yêu) lên sóng...

Phim 18+ chủ đề “khó nói” gây tranh cãi nhất sự nghiệp nàng thơ Hàn Quốc: Hình tượng nữ thần băng thanh ngọc khiết nay còn đâu?

Thứ Ba, 13/05/25 10:24 Chiều

Phim Ảnh

Mặc dù Love and Leashes gây ra không ít tranh cãi về hình tượng và sự nghiệp của Seohyun, nhưng không thể phủ nhận rằng vai diễn này...

Đu trend ăn mực hấp cuốn rau muống sống, 1 TikToker bị đau bụng, dân mạng liền nghĩ ngay tới lý do này

Thứ Ba, 13/05/25 8:44 Chiều

Xã Hội

Món mực hấp cuốn rau muống sống đang là trend ẩm thực mới nổi trên TikTok, nhưng bất ngờ lại khiến 1 TikToker gặp sự cố đau bụng...

Gieo quẻ 12 con giáp cho tuần mới (12/5 – 18/5): Tuất nhiều cơ hội, Dậu lột xác thành công

Thứ Hai, 12/05/25 8:47 Sáng

Tử vi - Phong Thủy

Tuần mới này, 12 con giáp sẽ nhận được quả nào? Kinh Dịch – bộ sách cổ xưa bậc nhất phương Đông – không chỉ là nền tảng...

Nhìn lại hành trình “tan cửa nát nhà” của cặp sao hạng A mới thấy: Dạy con sai không chỉ hại đời con mà ảnh hưởng cả gia đình

Thứ Bảy, 10/05/25 10:47 Chiều

Giáo Dục

Nhiều năm qua, cả 2 liên tục giải quyết những rắc rối dính dáng đến luật pháp cho con. Tôn An Tá (sinh năm 2000) là con trai...

Clip 11s của Địch Lệ Nhiệt Ba lên xu hướng: Tạo hình không là gì so với cú liếc mắt tia camera

Thứ Bảy, 10/05/25 10:24 Chiều

Hậu Trường

Địch Lệ Nhiệt Ba vừa có khoảnh khắc ấn tượng trong tạo hình mới nhất. Không quá khi nói rằng Địch Lệ Nhiệt Ba là một trong những...

Bố chồng âm thầm cho con dâu nửa lương hưu mỗi tháng, bị mẹ chồng phát hiện, bà làm ầm lên và đòi ly hôn

Thứ Bảy, 10/05/25 10:10 Chiều

Tâm sự

Bữa cơm đó kết thúc trong không khí ngột ngạt. Tôi về phòng mà lòng rối bời. Tôi năm nay 25 tuổi, lấy chồng được 3 năm, con...

oFamily

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?

Đừng nhờ AI giải toán

Nếu dùng đúng cách, các mô hình AI vượt xa con người về khả năng tính toán

Dù sao đi nữa, một chiếc máy tính vẫn tốt hơn

TIN CÙNG CHUYÊN MỤC

Người HƯỚNG NỘI có 5 câu nói giúp họ thành công và khác biệt so với đám đông: Nếu bạn thường nói những điều này, xin chúc mừng!

Người EQ thấp có 8 kiểu nói chuyện điển hình, ai tiếp xúc rồi cũng chỉ muốn lánh xa: Mong bạn không trúng điều nào!

Tôi chân thành khuyên bạn giữ 3 thứ này để giàu lên từ từ

Sáng Mùng 2 Tết, chồng dẫn về một đứa bé, con lên tiếng gọi “mẹ ơi” mà tôi vỡ òa trong hạnh phúc

Nhà tuyển dụng hỏi: đâu là khoảng cách lớn nhất giữa người giàu và người nghèo, nếu bạn trả lời là TIỀN, bạn sẽ bị đánh trượt đầu tiên

Gần Tết, sếp hỏi “Tình hình công việc thế nào?”, người thường nói vẫn ổn, người EQ cao đáp khéo tạo cơ hội thăng tiến năm mới

Nhà tuyển dụng hỏi: “Bạn có thể làm tôi sướng bằng cách nào?”, nữ ứng viên chốt một câu được tuyển dụng luôn

Nếu bạn thường nói 13 cụm từ này thì xin chúc mừng: Bạn là người có EQ cao!

10 điều người EQ cao không bao giờ nói với cha mẹ, đặc biệt là câu số 6

ĐƯỢC QUAN TÂM

Hot nhất Weibo: Sao nữ phá sản vì vỡ nợ 310 tỷ, bị “khai trừ” khỏi showbiz mãi mãi

Loại chân váy làm say lòng các mỹ nhân Việt: Mặc vào trông trẻ trung và sang trọng hơn nhiều

10 set áo sơ mi đẹp long lanh của Kim Ji Won, chị em nên tham khảo nếu muốn mặc sang trọng hơn

Hướng dẫn làm món salad tôm vừa ngon lại bổ mát ngày hè

Mỹ nhân “lười nhất showbiz” vẫn giữ nét trẻ đẹp sau 25 năm

Hướng dẫn cách làm nộm bò rau muống giòn ngon, thanh mát cực thích hợp

Hướng dẫn làm món Đậu hũ sốt thịt băm mềm ngon, đậm đà và hấp dẫn

“Tò mò” Mối quan hệ giữa ViruSs với Ngọc Kem, hot girl kém 10 tuổi

TIN XEM NHIỀU

TIN MỚI: