আলফাগো বনাম লি সেডল – কৃত্রিম বুদ্ধিমত্তা এবং মানুষ

ডিপ ব্লু-এর পর এবার আলফাগো। আবারো কম্পিউটারের সঙ্গে খেলে মানুষের হার! ঘটনাটি ঘটেছে দক্ষিণ কোরিয়ার সিওলে। গুগলের ডিপমাইন্ড ইউনিটের তৈরি “গো” খেলার কৃত্রিম বুদ্ধিমত্তার প্রোগ্রাম “আলফাগো” পরপর তিনবার হারিয়ে দিলো ৩৩ বছর বয়সি পেশাদার কিংবদন্তী  “গো” খেলোয়ার লি সিডলকে। পাঁচ ম্যাচ সিরিজের চারটিতেই জিতেছে “আলফাগো”। পরপর তিনবার হারার পর চতুর্থ ম্যাচে এসে জয় পান লি সিডল। এই একটিমাত্র জয়কে তিনি “অমূল্য” হিসেবে গণ্য করেছেন। প্রথম গেমটিতে হারার পর লি সাংবাদিকদের বলেনঃ “আমি খুবই অবাক হয়েছি। আমি হারবো এটা কখনো ভাবিনি। আলফাগো এত ভাল খেলবে এটা আশা করিনি।”

গো অথবা ষোলগুটি বা বাঘবন্দিঃ

“গো” নামক কয়েক হাজার বছরের পুরানো গেমের উদ্ভব হয় চীনে। খেলাটি অনেকটা আমাদের দেশের ষোলগুটি বা বাঘবন্দি খেলার মত। একটি নির্দিষ্ট বোর্ডে সাদা এবং কালো গুটি নিয়ে দুইপক্ষকে খেলতে হয়। উদ্দেশ্য থাকে প্রতিপক্ষের গুটি আটকে বোর্ডের দখল নেয়া। যে বোর্ডের অর্ধেকের বেশি এলাকা দখল করতে পারবে, সেই বিজয়ী। দাবা খেলার সাথে এই খেলার বড় পার্থক্য হচ্ছে, এখানে অসংখ্য সম্ভাবনাময় চাল থাকে। কেবলমাত্র গাণিতিক হিসাব করে সম্ভাব্য চাল বের করা অসম্ভব।

“গো” খেলার জন্য গুগল ডিপমাইন্ড “আলফা-গো” কম্পিউটার প্রোগ্রামটি তৈরি করেছে। এটির অ্যালগোরিদম মেশিন লার্নিং এবং ট্রি সার্চিং প্রযুক্তি সমন্বয়ে করা হয়েছে। এতে পলিসি এবং ভ্যালু নেটওয়ার্ক হিসেবে দুইটি নিউরাল নেটওয়ার্ক আছে। পলিসি নেটওয়ার্কটি সম্ভাব্য সেরা চালটি দ্রত হিসাব করতে পারে এবং ভ্যালু নেটওয়ার্কটি প্রতিটি চালের শুরুতে অপ্রয়োজনীয় চালগুলো বাদ দিয়ে সম্ভাব্য চালের পরিমাণ কমিয়ে ফেলে।মানুষের এই “অপ্রয়োজনীয়” চাল বাদ দেয়ার সক্ষমতায় কৃত্রিম বুদ্ধিমত্তার জোরে অবশেষে ভাগ বসালো আলফাগো। আলফাগো-এর প্রাথমিক পর্যায়ে, একে বিভিন্ন এক্সপার্ট গেমারের ঐতিহাসিক গেমের চালগুলো মনে রাখতে বলা হয়েছিল, ৩০ মিলিয়ন চালের একটি ডাটাবেস থেকে। পরবর্তীতে একটি নির্ধারিত পর্যায়ের দক্ষতা অর্জনের পর রি-ইনফোর্সমেন্ট লার্নিং এর সাহায্যে আলফা-গো-এর সক্ষমতা এমনভাবে বৃদ্ধি করা হয় যে এটি নিজে নিজে খেলার দক্ষতা অর্জন করে।

আলফাগো বনাম লি সেডলঃ

আলফাগো বনাম লি সেডল-এর “গুগল ডিপমাইন্ড চ্যালেঞ্জ ম্যাচ” সিওলে ৯ মার্চ-এ শুরু হয়ে ১৫ মার্চ শেষ হয়। প্রথম ম্যাচটিতে আলফাগো জয়লাভ করে যদিও পুরো ম্যাচের বেশিরভাগ সময় জুড়েই ছিল লি-এর আধিপত্য। কিন্তু শেষ ২০ মিনিটে আলফাগো আধিপত্য বিস্তার করে ম্যাচ জিতে নেয়। মজার ব্যাপার হচ্ছে, খেলার প্রথমদিকে লি  আলফাগো-এর ক্ষমতা যাচাই করার জন্য বেশ বড়সড় একটি ভুল করে বসেন। সেই ভুলের উত্তরে আলফাগো-এর চালটি ছিল একেবারে নিখুঁত এবং কার্যকরী।

চতুর্থ ম্যাচ, যেটিতে লি জয়লাভ করে মানবজাতির মানসম্মান রক্ষা করে, সেখানেও ৭৮ নাম্বার চাল পর্যন্ত আলফাগো-এর জিতে যাওয়ার সম্ভবনা ছিল ৭০%। কিন্তু ৭৯ নাম্বার চালে ভুল করে ফেলার কারণে আলফাগো বঞ্চিত হয় লি সেডলকে হোয়াইটওয়াশ করার সুযোগ থেকে।

১৮টি আন্তর্জাতিক পুরষ্কার বিজয়ী পেশাদার গো খেলোয়ার লি সেডল ম্যাচ শেষে স্বীকার করেন যে শুরুর দিকে তিনি আলফাগো-এর খেলোয়াড়ি দক্ষতাকে অবজ্ঞা করেছিলেন। ডিপমাইন্ডের প্রতিষ্ঠাতা ডেমিস হাসাবিস বলেন, এ পরাজয় মূল্যবান। কারণ, এ থেকে আমরাও আমাদের প্রোগ্রামের দুর্বলতা খুঁজে বের করতে পারবো। “গুগল ডিপমাইন্ড চ্যালেঞ্জ”-এর বিজেতা হিসেবে আলফাগো এক মিলিয়ন ডলার পুরষ্কার জিতে নিয়েছে। ডিপমাইন্ড-এর বিবৃতি অনুযায়ি এই পুরষ্কারের অর্থ ইউনিসেফ, গো অর্গানাইজেশন এবং অন্যান্য দাতব্য প্রতিষ্ঠানে দান করা হবে। ম্যাচ শেষে “সাউথ কোরিয়া গো অ্যাসোসিয়েশন” আলফাগো-কে “গো গ্র্যান্ডমাস্টার” পদবী প্রদান করে।

লেখক : তামান্না নিশাত রিনি।

Facebook Comments

Leave a Reply