আলফাগো বনাম লি সেডল – কৃত্রিম বুদ্ধিমত্তা এবং মানুষ

ডিপ ব্লু-এর পর এবার আলফাগো। আবারো কম্পিউটারের সঙ্গে খেলে মানুষের হার! ঘটনাটি ঘটেছে দক্ষিণ কোরিয়ার সিওলে। গুগলের ডিপমাইন্ড ইউনিটের তৈরি “গো” খেলার কৃত্রিম বুদ্ধিমত্তার প্রোগ্রাম “আলফাগো” পরপর তিনবার হারিয়ে দিলো ৩৩ বছর বয়সি পেশাদার কিংবদন্তী  “গো” খেলোয়ার লি সিডলকে। পাঁচ ম্যাচ সিরিজের চারটিতেই জিতেছে “আলফাগো”। পরপর তিনবার হারার পর চতুর্থ ম্যাচে এসে জয় পান লি সিডল। এই একটিমাত্র জয়কে তিনি “অমূল্য” হিসেবে গণ্য করেছেন। প্রথম গেমটিতে হারার পর লি সাংবাদিকদের বলেনঃ “আমি খুবই অবাক হয়েছি। আমি হারবো এটা কখনো ভাবিনি। আলফাগো এত ভাল খেলবে এটা আশা করিনি।”

গো অথবা ষোলগুটি বা বাঘবন্দিঃ

“গো” নামক কয়েক হাজার বছরের পুরানো গেমের উদ্ভব হয় চীনে। খেলাটি অনেকটা আমাদের দেশের ষোলগুটি বা বাঘবন্দি খেলার মত। একটি নির্দিষ্ট বোর্ডে সাদা এবং কালো গুটি নিয়ে দুইপক্ষকে খেলতে হয়। উদ্দেশ্য থাকে প্রতিপক্ষের গুটি আটকে বোর্ডের দখল নেয়া। যে বোর্ডের অর্ধেকের বেশি এলাকা দখল করতে পারবে, সেই বিজয়ী। দাবা খেলার সাথে এই খেলার বড় পার্থক্য হচ্ছে, এখানে অসংখ্য সম্ভাবনাময় চাল থাকে। কেবলমাত্র গাণিতিক হিসাব করে সম্ভাব্য চাল বের করা অসম্ভব।

“গো” খেলার জন্য গুগল ডিপমাইন্ড “আলফা-গো” কম্পিউটার প্রোগ্রামটি তৈরি করেছে। এটির অ্যালগোরিদম মেশিন লার্নিং এবং ট্রি সার্চিং প্রযুক্তি সমন্বয়ে করা হয়েছে। এতে পলিসি এবং ভ্যালু নেটওয়ার্ক হিসেবে দুইটি নিউরাল নেটওয়ার্ক আছে। পলিসি নেটওয়ার্কটি সম্ভাব্য সেরা চালটি দ্রত হিসাব করতে পারে এবং ভ্যালু নেটওয়ার্কটি প্রতিটি চালের শুরুতে অপ্রয়োজনীয় চালগুলো বাদ দিয়ে সম্ভাব্য চালের পরিমাণ কমিয়ে ফেলে।মানুষের এই “অপ্রয়োজনীয়” চাল বাদ দেয়ার সক্ষমতায় কৃত্রিম বুদ্ধিমত্তার জোরে অবশেষে ভাগ বসালো আলফাগো। আলফাগো-এর প্রাথমিক পর্যায়ে, একে বিভিন্ন এক্সপার্ট গেমারের ঐতিহাসিক গেমের চালগুলো মনে রাখতে বলা হয়েছিল, ৩০ মিলিয়ন চালের একটি ডাটাবেস থেকে। পরবর্তীতে একটি নির্ধারিত পর্যায়ের দক্ষতা অর্জনের পর রি-ইনফোর্সমেন্ট লার্নিং এর সাহায্যে আলফা-গো-এর সক্ষমতা এমনভাবে বৃদ্ধি করা হয় যে এটি নিজে নিজে খেলার দক্ষতা অর্জন করে।

আলফাগো বনাম লি সেডলঃ

আলফাগো বনাম লি সেডল-এর “গুগল ডিপমাইন্ড চ্যালেঞ্জ ম্যাচ” সিওলে ৯ মার্চ-এ শুরু হয়ে ১৫ মার্চ শেষ হয়। প্রথম ম্যাচটিতে আলফাগো জয়লাভ করে যদিও পুরো ম্যাচের বেশিরভাগ সময় জুড়েই ছিল লি-এর আধিপত্য। কিন্তু শেষ ২০ মিনিটে আলফাগো আধিপত্য বিস্তার করে ম্যাচ জিতে নেয়। মজার ব্যাপার হচ্ছে, খেলার প্রথমদিকে লি  আলফাগো-এর ক্ষমতা যাচাই করার জন্য বেশ বড়সড় একটি ভুল করে বসেন। সেই ভুলের উত্তরে আলফাগো-এর চালটি ছিল একেবারে নিখুঁত এবং কার্যকরী।

চতুর্থ ম্যাচ, যেটিতে লি জয়লাভ করে মানবজাতির মানসম্মান রক্ষা করে, সেখানেও ৭৮ নাম্বার চাল পর্যন্ত আলফাগো-এর জিতে যাওয়ার সম্ভবনা ছিল ৭০%। কিন্তু ৭৯ নাম্বার চালে ভুল করে ফেলার কারণে আলফাগো বঞ্চিত হয় লি সেডলকে হোয়াইটওয়াশ করার সুযোগ থেকে।

১৮টি আন্তর্জাতিক পুরষ্কার বিজয়ী পেশাদার গো খেলোয়ার লি সেডল ম্যাচ শেষে স্বীকার করেন যে শুরুর দিকে তিনি আলফাগো-এর খেলোয়াড়ি দক্ষতাকে অবজ্ঞা করেছিলেন। ডিপমাইন্ডের প্রতিষ্ঠাতা ডেমিস হাসাবিস বলেন, এ পরাজয় মূল্যবান। কারণ, এ থেকে আমরাও আমাদের প্রোগ্রামের দুর্বলতা খুঁজে বের করতে পারবো। “গুগল ডিপমাইন্ড চ্যালেঞ্জ”-এর বিজেতা হিসেবে আলফাগো এক মিলিয়ন ডলার পুরষ্কার জিতে নিয়েছে। ডিপমাইন্ড-এর বিবৃতি অনুযায়ি এই পুরষ্কারের অর্থ ইউনিসেফ, গো অর্গানাইজেশন এবং অন্যান্য দাতব্য প্রতিষ্ঠানে দান করা হবে। ম্যাচ শেষে “সাউথ কোরিয়া গো অ্যাসোসিয়েশন” আলফাগো-কে “গো গ্র্যান্ডমাস্টার” পদবী প্রদান করে।

লেখক : তামান্না নিশাত রিনি।