Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?

Thứ Ba, 20/08/24 3:56 Chiều

Nếu cần giải một phép toán, tốt hơn bạn cần có một chiếc máy tính thay vì trông chờ vào các mô hình AI giải hộ mình.

Kể từ khi xuất hiện, các mô hình ngôn ngữ lớn đã làm thay đổi cách người dùng tiếp cận và xử lý công việc hàng ngày. Giờ đây bạn có thể lên kế hoạch cho công việc hàng ngày cũng như trả lời các câu hỏi phức tạp. Nhiều người có thể nghĩ rằng các mô hình AI này là những giải pháp toàn diện cho mọi vấn đề hàng ngày. Tuy nhiên, có một điều bạn không thể kỳ vọng từ các mô hình AI này, đó là giải toán.

Đừng nhờ AI giải toán

Ngay cả những mô hình AI giỏi nhất về toán cũng có tỷ lệ chính xác khá thấp. Không chỉ dựa vào các mô hình AI thông thường, các nhà nghiên cứu tại Trường Đại học Thanh Hoa Trung Quốc còn huấn luyện một mô hình AI dành riêng cho các phép tính toán học có tên MathGLM để giải quyết các vấn đề toán học hóc búa.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 1.

Dù thông minh nhưng Google Bard (tiền thân của Gemini) vẫn không thể giải được phép toán nói trên

Trên thực tế, các mô hình AI hoàn toàn có thể học cách giải toán nếu được huấn luyện trên các bộ dữ liệu toán học lớn để nhận diện được các mô hình phép tính và khi kết hợp với những số nhỏ hơn sẽ cho ra những câu trả lời gần đúng.

Nếu chỉ xét riêng khả năng tính toán, MathGLM hoàn toàn vượt trội so với ChatGPT và GPT-4 của OpenAI. Tuy vậy, ngay cả với những phép tính có 5 chữ số, mức độ chính xác của mô hình AI 2 tỷ tham số này chỉ đạt 85,16%. Điều này trái ngược hoàn toàn với một chiếc máy tính thông thường khi nó luôn kết quả đúng với độ chính xác tới 100%.

Thậm chí khi con số tính toán trở nên lớn hơn, mức độ chính xác cũng giảm nhanh chóng. Nguyên nhân có thể là do các phép tính với những con số nhỏ hơn thường xuất hiện nhiều trong các bộ dữ liệu huấn luyện, do đó, mô hình có thể nhận diện và đưa ra kết quả dựa trên dữ liệu huấn luyện – thay vì thực sự thực hiện các phép tính.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 2.

Bảng thống kê cho thấy, con số trong phép tính càng dài, tỷ lệ chính xác khi giải toán của MathGLM càng giảm

Nếu dùng đúng cách, các mô hình AI vượt xa con người về khả năng tính toán

Tuy nhiên, các nhà nghiên cứu của Google đã chỉ ra rằng, nếu được kết hợp đúng cách, khả năng giải toán của các mô hình AI có thể vượt xa con người. Gần đây, Google đã giới thiệu một phương pháp mới gọi là FunSearch, kết hợp một mô hình ngôn ngữ lớn đã được huấn luyện trước với một công cụ ước lượng tự động. Phương pháp này nhằm ngăn ngừa hiện tượng ảo giác và các ý tưởng không chính xác của mô hình AI.

Về cơ bản, phương pháp này là một quy trình lặp lại kết hợp sự sáng tạo của một mô hình ngôn ngữ lớn với điều gì đó có thể bắt nó lùi lại một bước nếu phát hiện hướng đi của nó bị sai. Có thể các mô hình AI không giỏi toán, nhưng chúng rất khá trong khả năng sáng tạo.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 3.

Kết hợp nhiều công cụ với nhau, FunSearch của Google sẽ giúp giải được bài toán hóc búa hơn

Đối với các phép toán, FunSearch hoạt động bằng cách lấy mô tả về một bài toán dưới dạng các dòng code. Phần mô tả sẽ đưa ra một quy trình để đánh giá đầu ra và khởi chạy một nhóm các chương trình để tính toán lại. Với mỗi vòng lặp của FunSearch, hệ thông sẽ lựa chọn một số chương trình và nạp chúng vào một mô hình ngôn ngữ lớn – ví dụ như PaLM 2 – để xây dựng các chương trình mới trên đó. Những chương trình mới sẽ được lựa chọn để lặp lại, tạo ra một vòng lặp tự cải thiện.

Ví dụ trong một phép tính, FunSearch tìm ra được các tập hợp giới hạn lớn nhất, vượt xa các tập hợp nổi tiếng nhất của những nhà toán học lỗi lạc nhất thế giới. “Theo hiểu biết của tôi, đây là khám phá khoa học đầu tiên được phát hiện nên nhờ sử dụng một mô hình AI.” Các nhà nghiên cứu cho biết trong bài đăng trên tạp chí Nature.

Dù sao đi nữa, một chiếc máy tính vẫn tốt hơn

Nghiên cứu của Google cho thấy, nếu dùng đúng cách một mô hình ngôn ngữ vẫn có thể là một công cụ toán học mạnh mẽ, nhưng nó sẽ không thể giải quyết được một bài toán và tạo ra ý tưởng mới nếu không có sự trợ giúp từ bên ngoài.

Trên thông thiên văn, dưới tường địa lý, tại sao các mô hình AI như ChatGPT lại dốt Toán?- Ảnh 4.

Dù phương pháp FunSearch của các nhà nghiên cứu Google có thể giúp giải quyết các vấn đề toán học bằng cách tận dụng khả năng sáng tạo của mô hình AI, nó không đồng nghĩa với việc các mô hình AI thực sự giỏi toán. Phương pháp này chỉ định hướng cho khả năng sáng tạo của AI đúng hướng và tránh những ảo giác mà mô hình AI có thể tạo ra.

Có thể một mô hình AI sẽ rất có ích nếu bạn yêu cầu nó giải thích về một lý thuyết toán học nào đó, ví dụ như làm thế nào nhân nhiều ma trận với nhau. Nhưng nếu bạn yêu cầu chúng nhân các ma trận cho bạn, thì kết quả có thể sẽ hoàn toàn sai lệch.

Nói cách khác, bạn có thể yêu cầu các mô hình AI làm rất nhiều điều, nhưng để giải toán, tốt nhất bạn nên tìm một chiếc máy tính cầm tay.

Phải chăng máy móc cũng có cảm xúc? Tôi ngừng cảm ơn ChatGPT và bất ngờ vì những gì mình nhận được
Phải chăng máy móc cũng có cảm xúc? Tôi ngừng cảm ơn ChatGPT và bất ngờ vì những gì mình nhận được

Liệu người dùng có nên lịch sự với một cỗ máy đang nhiệt tình hỗ trợ cho mình bất kể lúc nào, bất kể câu hỏi...

Theo: Thanh niên Việt
Ứng dụng xem tuổi làm nhà Bói bài Tarot mới hàng ngày

ĐƯỢC QUAN TÂM

TIN MỚI:

Đang yên ổn thì bố thông báo tìm người thừa kế khiến cả nhà náo loạn, tới ngày bố chia xong tài sản, tôi mới hiểu nỗi khổ của ông

Đang yên ổn thì bố thông báo tìm người thừa kế khiến cả nhà náo loạn, tới ngày bố chia xong tài sản, tôi mới hiểu nỗi khổ của ông

Thứ Hai, 21/04/25 12:59 Chiều
Bố nói xong, anh Trung và chị Huệ đều nhận ngay lập tức. Tôi biết bố đã trăn trở băn khoăn rất nhiều. Cửa tiệm gỗ của gia...
Thực phẩm kích thích mọc tóc con, chống rụng tóc, là món yêu thích của Phạm Băng Băng để nuôi dưỡng mái tóc

Thực phẩm kích thích mọc tóc con, chống rụng tóc, là món yêu thích của Phạm Băng Băng để nuôi dưỡng mái tóc

Thứ Hai, 21/04/25 12:55 Chiều
Ngoài việc chăm sóc tóc thông qua các sản phẩm chăm sóc tóc, bạn cũng có thể cải thiện mái tóc của mình bằng cách lựa chọn "thực...
Trong vòng 3 tháng anh trai tôi mất gần 80 triệu vì bị bạn gái "đào mỏ bằng chiêu thức mới", thế nhưng cuối cùng cô ta cũng nhận về cái kết của thiên trả địa hết

Trong vòng 3 tháng anh trai tôi mất gần 80 triệu vì bị bạn gái “đào mỏ bằng chiêu thức mới”, thế nhưng cuối cùng cô ta cũng nhận về cái kết của thiên trả địa hết

Thứ Hai, 21/04/25 12:49 Chiều
Mai Anh có những chiêu trò phải nói là tinh vi, sáng táo và mới lạ để đào mỏ. Tôi vẫn còn nhớ rõ cái ngày anh trai...
Về quê đột ngột, thấy bố nằm thở khò khè trên giường, mẹ thì không có nhà, chồng tôi lao vào, mặt tái mét kêu lên một tiếng thương tâm

Về quê đột ngột, thấy bố nằm thở khò khè trên giường, mẹ thì không có nhà, chồng tôi lao vào, mặt tái mét kêu lên một tiếng thương tâm

Chủ Nhật, 20/04/25 10:55 Chiều
Nghe đến đây, chồng tôi không chịu được nữa. Anh lập tức đưa bố lên ô tô, mặc cho ông phản đối. 2 vợ chồng tôi đều tất...
Check camera, thấy anh hàng xóm bế vợ tôi lên giường rồi gọi điện thoại cho ai đó, khi trở về nhà tôi vội mang quà sang cảm ơn

Check camera, thấy anh hàng xóm bế vợ tôi lên giường rồi gọi điện thoại cho ai đó, khi trở về nhà tôi vội mang quà sang cảm ơn

Chủ Nhật, 20/04/25 10:55 Chiều
Bao lâu nay, tôi luôn lo lắng cho vợ và rồi cuối cùng ngày đó cũng đã đến. Ngày đưa bạn gái về ra mắt, bố tôi tinh...
Nhật Bản tiết lộ 5 điều đơn giản giúp họ sống lâu trăm tuổi, bất ngờ là nhiều người Việt đang làm mỗi ngày mà không hề biết

Nhật Bản tiết lộ 5 điều đơn giản giúp họ sống lâu trăm tuổi, bất ngờ là nhiều người Việt đang làm mỗi ngày mà không hề biết

Chủ Nhật, 20/04/25 10:45 Chiều
Điều đáng mừng là phần lớn các “bí quyết vàng” giúp người Nhật trường thọ đã và đang hiện diện trong văn hóa sống của người Việt. Tính...
"Gieo quẻ" tháng 5 cho 12 con giáp: Người công việc lên hương, kẻ được Thần Tài chiếu cố, tiền bạc lẫn tình yêu đều thăng hoa

“Gieo quẻ” tháng 5 cho 12 con giáp: Người công việc lên hương, kẻ được Thần Tài chiếu cố, tiền bạc lẫn tình yêu đều thăng hoa

Chủ Nhật, 20/04/25 9:13 Chiều
Thần Tài gõ cửa, tình tiền lên hương: 12 con giáp tháng 5 được "quẻ" nào dẫn đường? Bước vào tháng 5 – tháng của khởi đầu mùa...
Tử vi ngày mới 21/4: 2 con giáp tiền bạc dồi dào, công việc hanh thông, 1 con giáp cẩn thận "tiền mất tật mang"

Tử vi ngày mới 21/4: 2 con giáp tiền bạc dồi dào, công việc hanh thông, 1 con giáp cẩn thận “tiền mất tật mang”

Chủ Nhật, 20/04/25 1:41 Chiều
Tử vi ngày mới tiết lộ 3 con giáp này có biến động vận số đặc biệt. Tử vi ngày 21/4 hé lộ nhiều chuyển biến đáng chú...
Đồ hiệu Made in China: Pha dắt mũi mang tầm quốc tế, người giàu không tin, vậy ai tin?

Đồ hiệu Made in China: Pha dắt mũi mang tầm quốc tế, người giàu không tin, vậy ai tin?

Chủ Nhật, 20/04/25 11:01 Sáng
Trào lưu “bóc mẽ đồ hiệu” của loạt nhà xưởng Trung Quốc có lẽ đang khiến các thương hiệu thời trang xa xỉ và tín đồ đích thực…...
3 lọ kem chống nắng bình dân tôi ưng nhất từ trước đến giờ

3 lọ kem chống nắng bình dân tôi ưng nhất từ trước đến giờ

Chủ Nhật, 20/04/25 10:13 Sáng
Rất thích bôi kem chống nắng bình dân, tôi đã tìm ra 3 loại khiến mình muốn dùng mãi không thôi. Tôi không thích theo đuổi một quy...
Gội đầu xong dùng thêm 3 sản phẩm này, sẽ giúp tóc đẹp như tạo kiểu ở spa

Gội đầu xong dùng thêm 3 sản phẩm này, sẽ giúp tóc đẹp như tạo kiểu ở spa

Chủ Nhật, 20/04/25 9:57 Sáng
Bạn hoàn toàn có thể dưỡng tóc đẹp tại nhà chỉ với 3 sản phẩm đơn giản ngay sau khi gội đầu. Mái tóc là 1 trong những...
5 biện pháp biến da chảy xệ thành săn chắc, trẻ măng

5 biện pháp biến da chảy xệ thành săn chắc, trẻ măng

Chủ Nhật, 20/04/25 9:57 Sáng
Chị em nên tham khảo những cách khắc phục tình trạng da chảy xệ khá đơn giản sau đây. Có nhiều cách để điều trị và ngăn ngừa...
Bói bài Tarot mới hàng ngày Ứng dụng xem tuổi làm nhà