บริษัท Google DeepMind หันมาเน้นด้านงานวิจัยให้ AI เรียนรู้การเล่นเกมส์คอมพิวเตอร์หลายๆอย่างให้สามารถเล่นได้อย่างมีประสิทธิภาพเทียบเท่าหรือมากกว่าที่มนุษย์ทำได้ และประสบความสำเร็จอย่างสูงกับ ‘AlphaGo’ AI ที่ใช้เล่นเกมหมากล้อมซึ่งสามารถแข่งขันเอาชนะมืออันดับหนึ่งของโลกได้อย่างขาดลอย
นักวิจัยของกูเกิลบอกว่าการเพิ่มขีดความสามารถในการคิดจินตนาการและวางแผนให้กับ AI จะเป็นสิ่งที่สำคัญมากในการพัฒนาอัลกอริทึมของ AI ในอนาคต ทำให้ระบบปรับตัวต่อการเปลี่ยนสภาพเงื่อนไขที่ไม่เคยถูกเขียนโปรแกรมมาก่อนได้ดีขึ้น
“ยกตัวอย่างเช่นถ้าหากจะวางแก้วบนขอบโต๊ะเราจะหยุดพิจารณาว่ามันมั่นคงดีหรือจะหล่นลงพื้น ผลจากการคิดแบบนั้นทำให้เราขยับแก้วเพื่อป้องกันไม่ให้มันหล่นลงมาแตก” นักวิจัยกล่าว “ถ้าอัลกอริทึมของเราถูกพัฒนาจนเท่าเทียมกับคนที่ช่ำชอง มันก็จะต้องมีความสามารถในการจินตนาการและคิดแบบมีเหตุผลสำหรับสิ่งที่จะเกิดขึ้นในอนาคต”
เราเคยเห็นการวางแผนล่วงหน้าแบบนี้มาแล้วจากการทำงานของ AlphaGo ที่สามารถแข่งขันเอาชนะคนได้เมื่อไม่นานมานี้ มันได้แสดงการสร้างผลงานในอนาคตที่เป็นผลมาจากการกระทำของมันในปัจจุบัน แต่กฎเกณฑ์ในโลกของความเป็นจริงมันแปรผันและซับซ้อนกว่าในเกมหมากล้อมมาก ทีมงานจึงได้พัฒนาระบบที่สามารถปฏิบัติงานได้ในอีกระดับหนึ่ง
ทีมวิจัยได้รวมเอาวิธีการทำงานของ AI ที่มีอยู่แล้วหลายวิธีรวมเข้าด้วยกัน ซึ่งรวมทั้งการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning) หรือการเรียนรู้แบบลองผิดลองถูก และการเรียนรู้เชิงลึก (Deep Learning) ที่เป็นการเรียนรู้ผ่านการประมวลผลข้อมูลจำนวนมากคล้ายกับวิธีการของสมองมนุษย์
ทีมวิจัยได้ทดสอบอัลกอริทึมใหม่กับเกม Sokoban พบว่าด้วยความสามารถในการจินตนาการของมัน AI ทำสำเร็จถึง 85% ดีกว่าอัลกอริทึมรุ่นก่อนที่ทำสำเร็จเพียง 60% นักวิจัยบอกว่ามันเรียนรู้ได้เร็วขึ้น สามารถจัดการกับสภาพเงื่อนไขที่ไม่สมบูรณ์ได้ และเรียนรู้กลยุทธ์หลายอย่างสำหรับใช้ในการวางแผน
แม้ว่าการทดสอบจะประสบความสำเร็จด้วยดีแต่มันยังเป็นแค่ช่วงเริ่มต้นของเทคโนโลยีนี้ และยังห่างไกลจากความซับซ้อนของโลกแห่งความจริง แต่ถือว่าเป็นการเริ่มต้นที่มีความหวังในการพัฒนา AI ที่จะไม่วางแก้วน้ำบนโต๊ะถ้ามีแนวโน้มว่าน้ำจะหก และยังจำเป็นต้องวิเคราะห์และพิจารณาเพิ่มเติมเพื่อเพิ่มขีดความสามารถของ AI ในการคิดอย่างมีเหตุผลและวางแผนสำหรับอนาคตกันต่อไป
ลองดู AI เล่นเกม Sokoban โดยที่มันยังไม่รู้กฎของเกมนี้มาก่อนในวิดีโอด้านล่าง
ข้อมูลและภาพจาก deepmind, sciencealert